Added test files
diff --git a/t/example/NKJP/header.xml b/t/example/NKJP/header.xml
new file mode 100644
index 0000000..f4f10a0
--- /dev/null
+++ b/t/example/NKJP/header.xml
@@ -0,0 +1,131 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<idsHeader type="corpus"
+            pattern="text"
+            status="new"
+            version="1.1"
+            TEIform="teiHeader">
+   <fileDesc>
+      <titleStmt>
+         <korpusSigle>NKJP</korpusSigle>
+         <c.title xml:lang="pl">Narodowy Korpus Języka Polskiego -- podkorpus zawierający 1 milion słów</c.title>
+         <c.title xml:lang="en">National Corpus of Polish -- the 1 million word subcorpus</c.title>
+      </titleStmt>
+      <publicationStmt>
+         <availability>
+            <p>This 1 million word subcorpus of the National Corpus of Polish is available publicly for free.</p>
+         </availability>
+      </publicationStmt>
+   </fileDesc>
+   <encodingDesc>
+      <classDecl>
+         <taxonomy xml:id="taxonomy-NKJP-type">
+            <category xml:id="typ_lit">
+               <desc xml:lang="pl">literatura piękna</desc>
+               <desc xml:lang="en">fiction</desc>
+            </category>
+            <category xml:id="typ_fakt">
+               <desc xml:lang="pl">literatura faktu</desc>
+               <desc xml:lang="en">non-fiction novel</desc>
+            </category>
+            <category xml:id="typ_publ">
+               <desc xml:lang="pl">publicystyka i wiadomości prasowe</desc>
+               <desc xml:lang="en">journalism</desc>
+            </category>
+            <category xml:id="typ_nd">
+               <desc xml:lang="pl">naukowo-dydaktyczny</desc>
+               <desc xml:lang="en">academic writing</desc>
+            </category>
+            <category xml:id="typ_inf-por">
+               <desc xml:lang="pl">informacyjno-poradnikowy</desc>
+               <desc xml:lang="en">informative and instructive writing</desc>
+            </category>
+            <category xml:id="typ_nklas">
+               <desc xml:lang="pl">książka niebeletrystyczna niesklasyfikowana</desc>
+               <desc xml:lang="en">unclassified non-fiction book</desc>
+            </category>
+            <category xml:id="typ_inne_pisane">
+               <desc xml:lang="pl">inne teksty pisane</desc>
+               <desc xml:lang="en">miscellaneous (written)</desc>
+               <category xml:id="typ_urzed">
+                  <desc xml:lang="pl">urzędowo-kancelaryjny</desc>
+                  <desc xml:lang="en">legal and official</desc>
+               </category>
+            </category>
+            <category xml:id="typ_internet">
+               <desc xml:lang="pl">Internet</desc>
+               <desc xml:lang="en">Internet</desc>
+            </category>
+            <category xml:id="typ_konwers">
+               <desc xml:lang="pl">konwersacyjne</desc>
+               <desc xml:lang="en">conversational</desc>
+            </category>
+            <category xml:id="typ_media">
+               <desc xml:lang="pl">mówione medialne</desc>
+               <desc xml:lang="en">spoken from the media</desc>
+            </category>
+            <category xml:id="typ_qmow">
+               <desc xml:lang="pl">quasi-mówione</desc>
+               <desc xml:lang="en">quasi-spoken</desc>
+            </category>
+         </taxonomy>
+      </classDecl>
+      <classDecl>
+         <taxonomy xml:id="taxonomy-NKJP-channel">
+            <category xml:id="kanal_prasa">
+               <desc xml:lang="pl">prasa</desc>
+               <desc xml:lang="en">press</desc>
+               <category xml:id="kanal_prasa_dziennik">
+                  <desc xml:lang="pl">dziennik</desc>
+                  <desc xml:lang="en">daily</desc>
+               </category>
+               <category xml:id="kanal_prasa_tygodnik">
+                  <desc xml:lang="pl">tygodnik</desc>
+                  <desc xml:lang="en">weekly</desc>
+               </category>
+               <category xml:id="kanal_prasa_miesiecznik">
+                  <desc xml:lang="pl">miesiecznik</desc>
+                  <desc xml:lang="en">monthly</desc>
+               </category>
+               <category xml:id="kanal_prasa_inne">
+                  <desc xml:lang="pl">inne prasowe</desc>
+                  <desc xml:lang="en">other press</desc>
+               </category>
+            </category>
+            <category xml:id="kanal_ksiazka">
+               <desc xml:lang="pl">książka</desc>
+               <desc xml:lang="en">book</desc>
+            </category>
+            <category xml:id="kanal_internet">
+               <desc xml:lang="pl">Internet</desc>
+               <desc xml:lang="en">internet</desc>
+            </category>
+            <category xml:id="kanal_mowiony">
+               <desc xml:lang="pl">mówiony</desc>
+               <desc xml:lang="en">spoken</desc>
+            </category>
+            <category xml:id="kanal_ulotka">
+               <desc xml:lang="pl">ulotki, ogłoszenia, reklamy</desc>
+               <desc xml:lang="en">leaflets, announcemnets, ads</desc>
+            </category>
+         </taxonomy>
+      </classDecl>
+      <classDecl>
+         <taxonomy xml:id="ukd">
+            <bibl>
+               <title xml:lang="pl">Uniwersalna Klasyfikacja Dziesiętna</title>
+               <title xml:lang="en">Universal Decimal Classification</title>
+               <edition>UDC-P058</edition>
+            </bibl>
+         </taxonomy>
+      </classDecl>
+      <classDecl>
+         <taxonomy xml:id="bn">
+            <bibl>
+               <title xml:lang="pl">Klasyfikacja Biblioteki Narodowej</title>
+               <title xml:lang="en">Polish National Library Classification</title>
+               <edition>Słownik języka haseł przedmiotowych Biblioteki Narodowej. Wyd. 5 popr. i rozsz., stan na dzień 31 grudnia 2004 roku.</edition>
+            </bibl>
+         </taxonomy>
+      </classDecl>
+   </encodingDesc>
+</idsHeader>