blob: 0af4d67b7e43b578a93bd86368d8027e4978e6fe [file] [log] [blame]
<?xml version="1.0" encoding="UTF-8"?>
<?xml-model href="header.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<!DOCTYPE idsCorpus PUBLIC "-//IDS//DTD IDS-XCES 1.0//EN" "http://corpora.ids-mannheim.de/idsxces1/DTD/ids.xcesdoc.dtd">
<teiHeader>
<dokumentSigle>TEST_BSP</dokumentSigle>
<fileDesc>
<titleStmt>
<title level="u" type="main">Beispielkorpus</title>
<title level="u" type="sub">Subkorpus Beispieltext</title>
</titleStmt>
<publicationStmt>
<p>Dieses Korpus wird als Teil der OpenSource-Testsuite einer Konvertierungssoftware veröffentlicht.</p>
</publicationStmt>
<sourceDesc>
<p>Der hier erfasste Text entstammt einem größeren Forschungskorpus.</p>
</sourceDesc>
</fileDesc>
<language ident="de">Deutsch</language>
<editorialDecl xml:id="TEST.BSP.Metadaten.Autoren">
<interpretation>
<p>Dieses Korpus beinhaltet Metadaten zum Autor des Textes und weiteren, fiktiven Autoren. Eine Liste aller Autoren ist in der Sektion <gi corresp="#TEST.BSP.Autoren">particDesc</gi> zusammengestellt. Jeder Autor ist dabei als <tag scheme="TEI">person</tag> kodiert und führt Attribute mit Angaben zu seiner Altersklasse (<att scheme="TEI">age</att>) und seinem Geschlecht (<att scheme="TEI">sex</att>). Letzteres ist gemäß <ref target="http://microformats.org/wiki/gender-formats">vCard-Richtlinien</ref> kodiert. Die Zuordnung der Autoren zu ihren Texten regeln die Metadaten der Texte.</p>
<ab>
<elementSpec ident="person">
<attList>
<attDef ident="age">
<valList>
<valItem ident="A">
<desc>Kinder im Alter bis zu 6 Jahren</desc>
</valItem>
<valItem ident="B">
<desc>Kinder im Alter zwischen 7 und 10 Jahren (entspricht etwa den Schulklassen 1 bis 4)</desc>
</valItem>
<valItem ident="C">
<desc>Kinder im Alter zwischen 11 und 12 Jahren (entspricht etwa den Schulklassen 5 bis 6)</desc>
</valItem>
<valItem ident="D">
<desc>Kinder im Alter zwischen 13 und 14 Jahren (entspricht etwa den Schulklassen 7 bis 8)</desc>
</valItem>
<valItem ident="X">
<desc>Kinder, deren Alter nicht dokumentiert ist</desc>
</valItem>
</valList>
</attDef>
</attList>
</elementSpec>
</ab>
</interpretation>
</editorialDecl>
<particDesc xml:id="TEST.BSP.Autoren">
<person age="X" ana="#TEST.BSP.Metadaten.Autoren" n="1" sex="M" xml:id="TEST.BSP.Autoren.1"/>
<person age="A" ana="#TEST.BSP.Metadaten.Autoren" n="2" sex="M" xml:id="TEST.BSP.Autoren.2"/>
<person age="A" ana="#TEST.BSP.Metadaten.Autoren" n="3" sex="F" xml:id="TEST.BSP.Autoren.3"/>
<person age="B" ana="#TEST.BSP.Metadaten.Autoren" n="4" sex="M" xml:id="TEST.BSP.Autoren.4a"/>
<person age="C" ana="#TEST.BSP.Metadaten.Autoren" n="5" sex="F" xml:id="TEST.BSP.Autoren.4b"/>
<person age="A" ana="#TEST.BSP.Metadaten.Autoren" n="6" sex="F" xml:id="TEST.BSP.Autoren.5a"/>
<person age="B" ana="#TEST.BSP.Metadaten.Autoren" n="7" sex="F" xml:id="TEST.BSP.Autoren.5b"/>
<person age="B" ana="#TEST.BSP.Metadaten.Autoren" n="8" sex="F" xml:id="TEST.BSP.Autoren.5c"/>
<person age="C" ana="#TEST.BSP.Metadaten.Autoren" n="9" sex="M" xml:id="TEST.BSP.Autoren.6"/>
<person age="C" ana="#TEST.BSP.Metadaten.Autoren" n="10" sex="M" xml:id="TEST.BSP.Autoren.7"/>
<person age="A" ana="#TEST.BSP.Metadaten.Autoren" n="11" sex="F" xml:id="TEST.BSP.Autoren.8a"/>
<person age="A" ana="#TEST.BSP.Metadaten.Autoren" n="12" sex="F" xml:id="TEST.BSP.Autoren.8b"/>
<person age="C" ana="#TEST.BSP.Metadaten.Autoren" n="13" sex="M" xml:id="TEST.BSP.Autoren.9a"/>
<person age="C" ana="#TEST.BSP.Metadaten.Autoren" n="14" sex="M" xml:id="TEST.BSP.Autoren.9b"/>
<person age="A" ana="#TEST.BSP.Metadaten.Autoren" n="15" sex="F" xml:id="TEST.BSP.Autoren.10"/>
</particDesc>
<interpretation xml:id="TEST.BSP.Kodex">
<p>Dieses Korpus beinhaltet Metadaten zu den Texten. Eine Liste aller Texte ist in der folgenden Sektion <gi corresp="#TEST.BSP.Texte">editorialDecl</gi> zusammengestellt. Jeder als <tag scheme="TEI">item</tag> realisierter Listeneintrag führt neben einem vollständig strukturierten bibliographischen Unterblock mit Titel und Autorenreferenz auch die Angabe ihrer Verschriftlichungsart im Attribut (<att scheme="TEI">rendition</att>). Letzteres ist gemäß folgender Interpretation kodiert:</p>
<ab>
<elementSpec ident="item">
<attList>
<attDef ident="rend">
<valList>
<valItem ident="M">
<desc>Manuskript, handgeschriebene Texte</desc>
</valItem>
<valItem ident="T">
<desc>Typoskript, maschinell verfasste Texte</desc>
</valItem>
<valItem ident="H">
<desc>Hybrid, Texte mit sowohl handgeschriebenem als auch maschinell verfasstem Anteil</desc>
</valItem>
<valItem ident="X">
<desc>Texte, deren Verschriftlichungsart unbekannt ist</desc>
</valItem>
</valList>
</attDef>
</attList>
</elementSpec>
</ab>
</interpretation>
<segmentation xml:id="TEST.BSP.Token">
<p>Der Text in diesem Korpus wurde mit der Software <ref target="https://github.com/DFKI-MLT/JTok">jTok</ref> tokenisiert. Im Ergebnis wurden Sätze mit <tag scheme="TEI">s</tag>, Wörter mit <tag scheme="TEI">w</tag> und Satzpunktuation mit <tag scheme="TEI">c</tag> ausgezeichnet. Ferner wurden auf Textebene absatzübergreifend alle Sätze und auf Satzebene durchgängig alle Wörter und jede Satzpunktuation im jeweiligen Attribut <att scheme="TEI">n</att> und bei 1 beginnend durchgezählt.</p>
</segmentation>
<interpretation xml:id="TEST.BSP.POS">
<p>Dieses Korpus verwendet ein Wortart-Tagging nach dem Stuttgart-Tübingen-Tagset (<ref target="http://www.ims.uni-stuttgart.de/forschung/ressourcen/lexika/TagSets/stts-table.html">STTS</ref>). Dabei wurden drei ursprüngliche Tags ("$.", "$," und "$(") in ("_ENDE", "_KOMMA" und "_SONST") umbennant, um den Validitätsrichtlinien für XML-Identifikatoren (beschrieben in der <ref target="http://www.w3.org/TR/2006/REC-xml-20060816/">W3C-Empfehlung für XML 1.0 vom 16.08.2006</ref>) zu genügen.</p>
<ab>
<interpGrp type="annotation">
<interp xml:id="TEST.BSP.POS.ADJA">attributives Adjektiv</interp>
<interp xml:id="TEST.BSP.POS.ADJD">adverbiales oder prädikatives Adjektiv</interp>
<interp xml:id="TEST.BSP.POS.ADV">Adverb</interp>
<interp xml:id="TEST.BSP.POS.APPO">Postposition</interp>
<interp xml:id="TEST.BSP.POS.APPR">Präposition; Zirkumposition links</interp>
<interp xml:id="TEST.BSP.POS.APPRART">Präposition mit Artikel</interp>
<interp xml:id="TEST.BSP.POS.APZR">Zirkumposition rechts</interp>
<interp xml:id="TEST.BSP.POS.ART">bestimmter oder unbestimmter Artikel</interp>
<interp xml:id="TEST.BSP.POS.CARD">Kardinalzahl</interp>
<interp xml:id="TEST.BSP.POS.FM">Fremdsprachliches Material</interp>
<interp xml:id="TEST.BSP.POS.ITJ">Interjektion</interp>
<interp xml:id="TEST.BSP.POS.KOKOM">Vergleichskonjunktion</interp>
<interp xml:id="TEST.BSP.POS.KON">nebenordnende Konjunktion</interp>
<interp xml:id="TEST.BSP.POS.KOUI">unterordnende Konjunktion mit "zu" und Infinitiv</interp>
<interp xml:id="TEST.BSP.POS.KOUS">unterordnende Konjunktion mit Satz</interp>
<interp xml:id="TEST.BSP.POS.NE">normales Nomen</interp>
<interp xml:id="TEST.BSP.POS.NN">Eigennamen</interp>
<interp xml:id="TEST.BSP.POS.NNE">normales Nomen mit Eigennamen</interp>
<interp xml:id="TEST.BSP.POS.PAV">Pronominaladverb</interp>
<interp xml:id="TEST.BSP.POS.PDAT">attribuierendes Demonstrativpronomen</interp>
<interp xml:id="TEST.BSP.POS.PDS">substituierendes Demonstrativpronomen</interp>
<interp xml:id="TEST.BSP.POS.PIAT">attribuierendes Indefinitpronomen ohne Determiner</interp>
<interp xml:id="TEST.BSP.POS.PIDAT">attribuierendes Indefinitpronomen mit Determiner</interp>
<interp xml:id="TEST.BSP.POS.PIS">substituierendes Indefinitpronomen</interp>
<interp xml:id="TEST.BSP.POS.PPER">irreflexives Personalpronomen</interp>
<interp xml:id="TEST.BSP.POS.PPOSAT">attribuierendes Possessivpronomen</interp>
<interp xml:id="TEST.BSP.POS.PPOSS">substituierendes Possessivpronomen</interp>
<interp xml:id="TEST.BSP.POS.PRELAT">attribuierendes Relativpronomen</interp>
<interp xml:id="TEST.BSP.POS.PRELS">substituierendes Relativpronomen</interp>
<interp xml:id="TEST.BSP.POS.PRF">reflexives Personalpronomen</interp>
<interp xml:id="TEST.BSP.POS.PROAV">Pronominaladverb</interp>
<interp xml:id="TEST.BSP.POS.PTKA">Partikel bei Adjektiv oder Adverb</interp>
<interp xml:id="TEST.BSP.POS.PTKANT">Antwortpartikel</interp>
<interp xml:id="TEST.BSP.POS.PTKNEG">Negationspartikel</interp>
<interp xml:id="TEST.BSP.POS.PTKVZ">abgetrennter Verbzusatz</interp>
<interp xml:id="TEST.BSP.POS.PTKZU">"zu" vor Infinitiv</interp>
<interp xml:id="TEST.BSP.POS.PWAT">attribuierendes Interrogativpronomen</interp>
<interp xml:id="TEST.BSP.POS.PWAV">adverbiales Interrogativ- oder Relativpronomen</interp>
<interp xml:id="TEST.BSP.POS.PWS">substituierendes Interrogativpronomen</interp>
<interp xml:id="TEST.BSP.POS.TRUNC">Kompositions-Erstglied</interp>
<interp xml:id="TEST.BSP.POS.VAFIN">finites Verb, aux</interp>
<interp xml:id="TEST.BSP.POS.VAIMP">Imperativ, aux</interp>
<interp xml:id="TEST.BSP.POS.VAINF">Infinitiv, aux</interp>
<interp xml:id="TEST.BSP.POS.VAPP">Partizip Perfekt, aux</interp>
<interp xml:id="TEST.BSP.POS.VMFIN">finites Verb, modal</interp>
<interp xml:id="TEST.BSP.POS.VMINF">Infinitiv, modal</interp>
<interp xml:id="TEST.BSP.POS.VMPP">Partizip Perfekt, modal</interp>
<interp xml:id="TEST.BSP.POS.VVFIN">finites Verb, voll</interp>
<interp xml:id="TEST.BSP.POS.VVIMP">Imperativ, voll</interp>
<interp xml:id="TEST.BSP.POS.VVINF">Infinitiv, voll</interp>
<interp xml:id="TEST.BSP.POS.VVIZU">Infinitiv mit "zu", voll</interp>
<interp xml:id="TEST.BSP.POS.VVPP">Partizip Perfekt, voll</interp>
<interp xml:id="TEST.BSP.POS.XY">Nichtwort, Sonderzeichen enthaltend</interp>
<interp xml:id="TEST.BSP.POS._KOMMA">Komma</interp>
<interp xml:id="TEST.BSP.POS._SONST">sonstige Satzzeichen; satzintern</interp>
<interp xml:id="TEST.BSP.POS._ENDE">Satzbeendende Interpunktion</interp>
</interpGrp>
</ab>
</interpretation>
</teiHeader>