Added Schreibgebrauch meta data test suite for Duden
Change-Id: I4d4efb43bc13e962e45bedee6a424a909939f3bb
diff --git a/t/sgbr/PRO-DUD/BSP-2013-01/32/base/sentences.xml b/t/sgbr/PRO-DUD/BSP-2013-01/32/base/sentences.xml
new file mode 100644
index 0000000..b0e76d5
--- /dev/null
+++ b/t/sgbr/PRO-DUD/BSP-2013-01/32/base/sentences.xml
@@ -0,0 +1,8 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="span.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+
+<layer docid="PRO-DUD_BSP-2013-01.32" xmlns="http://ids-mannheim.de/ns/KorAP" version="KorAP-0.4">
+ <spanList>
+ <span from="0" to="18" />
+ </spanList>
+</layer>
\ No newline at end of file
diff --git a/t/sgbr/PRO-DUD/BSP-2013-01/32/base/tokens_aggr.xml b/t/sgbr/PRO-DUD/BSP-2013-01/32/base/tokens_aggr.xml
new file mode 100644
index 0000000..aa5be2d
--- /dev/null
+++ b/t/sgbr/PRO-DUD/BSP-2013-01/32/base/tokens_aggr.xml
@@ -0,0 +1,11 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="span.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+
+<layer docid="PRO-DUD_BSP-2013-01.32" xmlns="http://ids-mannheim.de/ns/KorAP" version="KorAP-0.4">
+ <spanList>
+ <span id="t_0" from="0" to="6" />
+ <span id="t_1" from="7" to="10" />
+ <span id="t_2" from="11" to="14" />
+ <span id="t_3" from="15" to="19" />
+ </spanList>
+</layer>
\ No newline at end of file
diff --git a/t/sgbr/PRO-DUD/BSP-2013-01/32/base/tokens_conservative.xml b/t/sgbr/PRO-DUD/BSP-2013-01/32/base/tokens_conservative.xml
new file mode 100644
index 0000000..aa5be2d
--- /dev/null
+++ b/t/sgbr/PRO-DUD/BSP-2013-01/32/base/tokens_conservative.xml
@@ -0,0 +1,11 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="span.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+
+<layer docid="PRO-DUD_BSP-2013-01.32" xmlns="http://ids-mannheim.de/ns/KorAP" version="KorAP-0.4">
+ <spanList>
+ <span id="t_0" from="0" to="6" />
+ <span id="t_1" from="7" to="10" />
+ <span id="t_2" from="11" to="14" />
+ <span id="t_3" from="15" to="19" />
+ </spanList>
+</layer>
\ No newline at end of file
diff --git a/t/sgbr/PRO-DUD/BSP-2013-01/32/data.xml b/t/sgbr/PRO-DUD/BSP-2013-01/32/data.xml
new file mode 100644
index 0000000..e38121e
--- /dev/null
+++ b/t/sgbr/PRO-DUD/BSP-2013-01/32/data.xml
@@ -0,0 +1,7 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="text.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+
+<raw_text docid="PRO-DUD_BSP-2013-01.32" xmlns="http://ids-mannheim.de/ns/KorAP">
+ <metadata file="metadata.xml" />
+ <text>Selbst ist der Jeck</text>
+</raw_text>
\ No newline at end of file
diff --git a/t/sgbr/PRO-DUD/BSP-2013-01/32/header.xml b/t/sgbr/PRO-DUD/BSP-2013-01/32/header.xml
new file mode 100644
index 0000000..2080865
--- /dev/null
+++ b/t/sgbr/PRO-DUD/BSP-2013-01/32/header.xml
@@ -0,0 +1,19 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="header.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+<!DOCTYPE idsCorpus PUBLIC "-//IDS//DTD IDS-XCES 1.0//EN" "http://corpora.ids-mannheim.de/idsxces1/DTD/ids.xcesdoc.dtd">
+<teiHeader>
+<textSigle>PRO-DUD_BSP-2013-01.32</textSigle>
+<item ana="#PRO.DUD.BSP.2013.01.Kodex" n="32" rend="T" xml:id="PRO.DUD.BSP.2013.01.Texte.32">
+<biblFull>
+<titleStmt>
+<title>Nur Platt, kein Deutsch</title>
+<author ref="#PRO.DUD.BSP.2013.01.Autoren.1"/>
+</titleStmt>
+<publicationStmt>
+<publisher>Dorfblatt GmbH</publisher>
+<pubPlace>Stadtingen</pubPlace>
+<date>2013-01-26</date>
+</publicationStmt>
+</biblFull>
+</item>
+</teiHeader>
diff --git a/t/sgbr/PRO-DUD/BSP-2013-01/32/sgbr/ana.xml b/t/sgbr/PRO-DUD/BSP-2013-01/32/sgbr/ana.xml
new file mode 100644
index 0000000..ad84d3f
--- /dev/null
+++ b/t/sgbr/PRO-DUD/BSP-2013-01/32/sgbr/ana.xml
@@ -0,0 +1,47 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="span.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+
+<layer docid="PRO-DUD_BSP-2013-01.32" xmlns="http://ids-mannheim.de/ns/KorAP" version="KorAP-0.4">
+ <spanList>
+ <span id="s1" from="0" to="6">
+ <fs type="lex" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="lex">
+ <fs>
+ <f name="lemma">Selbst</f>
+ <f name="ctag">NE</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s2" from="7" to="10">
+ <fs type="lex" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="lex">
+ <fs>
+ <f name="lemma">ist</f>
+ <f name="ctag">VVFIN</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s3" from="11" to="14">
+ <fs type="lex" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="lex">
+ <fs>
+ <f name="lemma">der</f>
+ <f name="ctag">ART</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s4" from="15" to="19">
+ <fs type="lex" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="lex">
+ <fs>
+ <f name="lemma">Jeck</f>
+ <f name="ctag">NE</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ </spanList>
+</layer>
\ No newline at end of file
diff --git a/t/sgbr/PRO-DUD/BSP-2013-01/32/sgbr/lemma.xml b/t/sgbr/PRO-DUD/BSP-2013-01/32/sgbr/lemma.xml
new file mode 100644
index 0000000..e95296f
--- /dev/null
+++ b/t/sgbr/PRO-DUD/BSP-2013-01/32/sgbr/lemma.xml
@@ -0,0 +1,43 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="span.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+
+<layer docid="PRO-DUD_BSP-2013-01.32" xmlns="http://ids-mannheim.de/ns/KorAP" version="KorAP-0.4">
+ <spanList>
+ <span id="s1" from="0" to="6">
+ <fs type="lex" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="lex">
+ <fs>
+ <f name="lemma">Selbst</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s2" from="7" to="10">
+ <fs type="lex" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="lex">
+ <fs>
+ <f name="lemma">sein</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s3" from="11" to="14">
+ <fs type="lex" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="lex">
+ <fs>
+ <f name="lemma">d_art</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s4" from="15" to="19">
+ <fs type="lex" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="lex">
+ <fs>
+ <f name="lemma">Jeck</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ </spanList>
+</layer>
\ No newline at end of file
diff --git a/t/sgbr/PRO-DUD/BSP-2013-01/32/struct/structure.xml b/t/sgbr/PRO-DUD/BSP-2013-01/32/struct/structure.xml
new file mode 100644
index 0000000..4926974
--- /dev/null
+++ b/t/sgbr/PRO-DUD/BSP-2013-01/32/struct/structure.xml
@@ -0,0 +1,90 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="span.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+
+<layer docid="PRO-DUD_BSP-2013-01.32" xmlns="http://ids-mannheim.de/ns/KorAP" version="KorAP-0.4">
+ <spanList>
+ <span id="s0" from="0" to="18" l="1">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">text</f>
+ </fs>
+ </span>
+ <span id="s1" from="0" to="18" l="2">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">div</f>
+ </fs>
+ </span>
+ <span id="s2" from="0" to="18" l="3">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">head</f>
+ </fs>
+ </span>
+ <span id="s3" from="0" to="18" l="4">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">s</f>
+ <f name="attr">
+ <fs type="attr">
+ <f name="n">1</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s4" from="0" to="6" l="5">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">w</f>
+ <f name="attr">
+ <fs type="attr">
+ <f name="ana">#PRO.DUD.BSP.2013.01.POS.NE</f>
+ <f name="lemmaRef">#PRO.DUD.BSP.2013.01.Lemmata.3773</f>
+ <f name="n">1</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s5" from="7" to="10" l="5">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">w</f>
+ <f name="attr">
+ <fs type="attr">
+ <f name="ana">#PRO.DUD.BSP.2013.01.POS.VVFIN</f>
+ <f name="lemmaRef">#PRO.DUD.BSP.2013.01.Lemmata.2</f>
+ <f name="n">2</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s6" from="11" to="14" l="5">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">w</f>
+ <f name="attr">
+ <fs type="attr">
+ <f name="ana">#PRO.DUD.BSP.2013.01.POS.ART</f>
+ <f name="lemmaRef">#PRO.DUD.BSP.2013.01.Lemmata.3</f>
+ <f name="n">3</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s7" from="15" to="18" l="5">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">w</f>
+ <f name="attr">
+ <fs type="attr">
+ <f name="ana">#PRO.DUD.BSP.2013.01.POS.NE</f>
+ <f name="lemmaRef">#PRO.DUD.BSP.2013.01.Lemmata.227</f>
+ <f name="n">4</f>
+ </fs>
+ </f>
+ </fs>
+ </span>
+ <span id="s8" from="18" to="18" l="3">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">div</f>
+ </fs>
+ </span>
+ <span id="s9" from="18" to="18" l="4">
+ <fs type="struct" xmlns="http://www.tei-c.org/ns/1.0">
+ <f name="name">p</f>
+ </fs>
+ </span>
+ </spanList>
+</layer>
\ No newline at end of file
diff --git a/t/sgbr/PRO-DUD/BSP-2013-01/header.xml b/t/sgbr/PRO-DUD/BSP-2013-01/header.xml
new file mode 100644
index 0000000..a0b5092
--- /dev/null
+++ b/t/sgbr/PRO-DUD/BSP-2013-01/header.xml
@@ -0,0 +1,139 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="header.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+<!DOCTYPE idsCorpus PUBLIC "-//IDS//DTD IDS-XCES 1.0//EN" "http://corpora.ids-mannheim.de/idsxces1/DTD/ids.xcesdoc.dtd">
+<teiHeader>
+<dokumentSigle>PRO-DUD_BSP-2013-01</dokumentSigle>
+ <fileDesc>
+ <titleStmt>
+ <title level="u" type="main">Korpus zur Beobachtung des Schreibgebrauchs im Deutschen</title>
+ <title level="u" type="sub">Subkorpus Ortsblatt</title>
+ <title level="u" type="sub">Jahrgang 2013</title>
+ <title level="u" type="sub">Monat Januar</title>
+ <funder>
+ <orgName>Bundesministerium für Bildung und Forschung</orgName>
+ </funder>
+ <editor n="1" xml:id="PRO.DUD.BSP.2013.01.Bearbeiter.1">
+ <persName>Thorsten Frank</persName>
+ <orgName>Bibliographisches Institut GmbH, Berlin</orgName>
+ </editor>
+ </titleStmt>
+ <publicationStmt>
+ <p>Dieses Subkorpus wurde als solches nicht veröffentlicht.</p>
+ </publicationStmt>
+ <sourceDesc>
+ <biblFull>
+ <titleStmt>
+ <title level="a">Kölner Stadt-Anzeiger</title>
+ </titleStmt>
+ <publicationStmt>
+ <publisher>Dorfmedien GmbH</publisher>
+ <pubPlace>Stadtingen</pubPlace>
+ <date>Januar 2013</date>
+ </publicationStmt>
+ </biblFull>
+ </sourceDesc>
+ </fileDesc>
+ <language ident="de">Deutsch</language>
+ <projectDesc>
+ <p>
+ Dieses Subkorpus wurde vom und für das Gemeinschaftsprojekt <name>Analyse und Instrumentarien zur Beobachtung des Schreibgebrauchs im Deutschen</name> (<ref target="http://www.schreibgebrauch.org/">http://www.schreibgebrauch.org/</ref> ) zusammengestellt. Das Projektkonsortium besteht aus folgenden Partnern:
+ <list><item><orgName>Institut für Deutsche Sprache, Mannheim</orgName></item><item><orgName>Institut für Computerlinguistik, Universität des Saarlandes, Saarbrücken</orgName></item><item><orgName>Bibliographisches Institut GmbH (Dudenverlag), Berlin</orgName></item><item><orgName>Wahrig bei Brockhaus, Gütersloh</orgName></item></list>
+ </p>
+ </projectDesc>
+ <particDesc xml:id="PRO.DUD.BSP.2013.01.Autoren">
+ <person n="1" xml:id="PRO.DUD.BSP.2013.01.Autoren.1">
+ <persName>unbekannt</persName>
+ </person>
+ </particDesc>
+ <interpretation xml:id="PRO.DUD.BSP.2013.01.Kodex">
+ <p>Dieses Korpus beinhaltet Metadaten zu den Texten. Eine Liste aller Texte in diesem Korpus ist in der folgenden Sektion <gi corresp="#PRO.DUD.BSP.2013.01.Texte">editorialDecl</gi> zusammengestellt. Jeder als <tag scheme="TEI">item</tag> realisierter Listeneintrag repräsentiert dabei einen Zeitungsartikel und führt neben einem vollständig strukturierten bibliographischen Unterblock mit Titel und Autorenreferenz auch die Angabe ihrer Verschriftlichungsart im Attribut (<att scheme="TEI">rend</att>). Dieses Attribut ist innerhalb der Korpora mit Texten professioneller Schreiber wohl immer "T" für maschinell verfasste Texte, wird aber hier trotzdem aufgenommen zur besseren Suchbarkeit im Gesamtkorpus. Das Attribut ist wie folgt kodiert:</p>
+ <ab>
+ <elementSpec ident="item">
+ <attList>
+ <attDef ident="rend">
+ <valList>
+ <valItem ident="M">
+ <desc>Manuskript, handgeschriebene Texte</desc>
+ </valItem>
+ <valItem ident="T">
+ <desc>Typoskript, maschinell verfasste Texte</desc>
+ </valItem>
+ <valItem ident="H">
+ <desc>Hybrid, Texte mit sowohl handgeschriebenem als auch maschinell verfasstem Anteil</desc>
+ </valItem>
+ <valItem ident="X">
+ <desc>Texte, deren Verschriftlichungsart unbekannt ist</desc>
+ </valItem>
+ </valList>
+ </attDef>
+ </attList>
+ </elementSpec>
+ </ab>
+ </interpretation>
+ <segmentation xml:id="PRO.DUD.BSP.2013.01.Token">
+ <p>Die Texte in diesem Korpus wurden mit der Software Duden Morphological Engine (DME) tokenisiert. Im Ergebnis wurden Sätze mit <tag scheme="TEI">s</tag>, Wörter mit <tag scheme="TEI">w</tag> und Satzpunktuation mit <tag scheme="TEI">c</tag> ausgezeichnet. Ferner wurden auf Textebene absatzübergreifend alle Sätze und auf Satzebene durchgängig alle Wörter und jede Satzpunktuation im jeweiligen Attribut <att scheme="TEI">n</att> und bei 1 beginnend durchgezählt.</p>
+ </segmentation>
+ <interpretation xml:id="PRO.DUD.BSP.2013.01.POS">
+ <p>Die Texte in diesem Korpus wurden mit der Software Duden Morphological Engine (DME) annotiert. Die Wortartinformationen wurden dann von <respons locus="value" resp="#PRO.DUD.BSP.2013.01.Bearbeiter.1"><desc>Thorsten Frank</desc></respons> in ein Wortart-Tagging nach dem Stuttgart-Tübingen-Tagset (<ref target="http://www.ims.uni-stuttgart.de/forschung/ressourcen/lexika/TagSets/stts-table.html">STTS</ref>) überführt. Dabei wurden drei ursprüngliche Tags ("$.", "$," und "$(") in ("_ENDE", "_KOMMA" und "_SONST") umbenannt, um den Validitätsrichtlinien für XML-Identifikatoren (beschrieben in der <ref target="http://www.w3.org/TR/2006/REC-xml-20060816/">W3C-Empfehlung für XML 1.0 vom 16.08.2006</ref>) zu genügen.</p>
+ <ab>
+ <interpGrp type="annotation">
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.ADJA">attributives Adjektiv</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.ADJD">adverbiales oder prädikatives Adjektiv</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.ADV">Adverb</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.APPO">Postposition</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.APPR">Präposition; Zirkumposition links</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.APPRART">Präposition mit Artikel</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.APZR">Zirkumposition rechts</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.ART">bestimmter oder unbestimmter Artikel</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.CARD">Kardinalzahl</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.FM">Fremdsprachliches Material</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.ITJ">Interjektion</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.KOKOM">Vergleichskonjunktion</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.KON">nebenordnende Konjunktion</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.KOUI">unterordnende Konjunktion mit "zu" und Infinitiv</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.KOUS">unterordnende Konjunktion mit Satz</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.NE">normales Nomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.NN">Eigennamen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.NNE">normales Nomen mit Eigennamen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PAV">Pronominaladverb</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PDAT">attribuierendes Demonstrativpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PDS">substituierendes Demonstrativpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PIAT">attribuierendes Indefinitpronomen ohne Determiner</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PIDAT">attribuierendes Indefinitpronomen mit Determiner</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PIS">substituierendes Indefinitpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PPER">irreflexives Personalpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PPOSAT">attribuierendes Possessivpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PPOSS">substituierendes Possessivpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PRELAT">attribuierendes Relativpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PRELS">substituierendes Relativpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PRF">reflexives Personalpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PROAV">Pronominaladverb</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PTKA">Partikel bei Adjektiv oder Adverb</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PTKANT">Antwortpartikel</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PTKNEG">Negationspartikel</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PTKVZ">abgetrennter Verbzusatz</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PTKZU">"zu" vor Infinitiv</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PWAT">attribuierendes Interrogativpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PWAV">adverbiales Interrogativ- oder Relativpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.PWS">substituierendes Interrogativpronomen</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.TRUNC">Kompositions-Erstglied</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VAFIN">finites Verb, aux</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VAIMP">Imperativ, aux</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VAINF">Infinitiv, aux</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VAPP">Partizip Perfekt, aux</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VMFIN">finites Verb, modal</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VMINF">Infinitiv, modal</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VMPP">Partizip Perfekt, modal</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VVFIN">finites Verb, voll</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VVIMP">Imperativ, voll</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VVINF">Infinitiv, voll</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VVIZU">Infinitiv mit "zu", voll</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.VVPP">Partizip Perfekt, voll</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS.XY">Nichtwort, Sonderzeichen enthaltend</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS._KOMMA">Komma</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS._SONST">sonstige Satzzeichen; satzintern</interp>
+ <interp xml:id="PRO.DUD.BSP.2013.01.POS._ENDE">Satzbeendende Interpunktion</interp>
+ </interpGrp>
+ </ab>
+ </interpretation>
+</teiHeader>
diff --git a/t/sgbr/PRO-DUD/header.xml b/t/sgbr/PRO-DUD/header.xml
new file mode 100644
index 0000000..1ceb692
--- /dev/null
+++ b/t/sgbr/PRO-DUD/header.xml
@@ -0,0 +1,6 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<?xml-model href="header.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
+<!DOCTYPE idsCorpus PUBLIC "-//IDS//DTD IDS-XCES 1.0//EN" "http://corpora.ids-mannheim.de/idsxces1/DTD/ids.xcesdoc.dtd">
+<teiHeader>
+<korpusSigle>PRO-DUD</korpusSigle>
+</teiHeader>