blob: f9987d6a69c2bb6f4217b248878f7a2b1917ba8a [file] [log] [blame]
Joachim Bingel11d5b152014-02-11 21:33:47 +00001bsp1.json: "Der Mann"
2bsp2.json: "Der /+w1:3 Mann"
3bsp3.json: "Der /+w1:3,s1 Mann"
4bsp4.json: "(Der /+w1:3,s1 Mann) /+w5 geht"
5bsp5.json: "(Der /+w1:3,s1 Mann) /-w5 geht"
Joachim Bingel0207d5e2014-02-12 14:18:41 +00006bsp6.json: "(Der /+w1:3,s1 Mann) /+w5 (geht weg)"
7
8cosmas1.json: "Buch"
9cosmas2.json: "das Buch" // to demonstrate token sequences
10cosmas3.json: "das /+w1:3 Buch" // word-distance constraint
11cosmas4.json: "das /+w1:3,s1 Buch" // combined word-distance and sent-distance constraint
12cosmas5.json: "(das /+w1:3,s1 Buch) /+w5 Tisch" // complex distance constraint on sequences
13cosmas6.json: "(das /+w1:3,s1 Buch) /-w5 Tisch" // negative distance -> precedence
14cosmas7.json: "(das /+w1:3,s1 Buch) /+w5 (auf dem Tisch)"
15cosmas8.json: "Institut für Deutsche Sprache" // spelling variations: deutsche/Deutsche
16cosmas9.json: "Institut für deutsche Sprache"
17cosmas10.json: "Institut für $deutsche Sprache" // finds both
18cosmas11.json: "Institut für &deutsch Sprache" // finds both if base form (lemma) is annotated
19cosmas12.json: "Institut für /+w2 Sprache" // finds institutes for any language
20cosmas13.json: "Institut für %+w1 deutsche Sprach e" // finds institutes for anything
21cosmas14.json: "Institut für MORPH(A) Sprache" // finds institutes for any language
22cosmas15.json: "wegen #IN(L) <s>" // finds 'wegen' at beginning of sentence
23cosmas16.json: "$wegen #IN(L) <s>" // finds 'wegen' at beginning of sentence, also when capitalised
24cosmas17.json: "#BED($wegen , +sa)" // equivalent to above
25cosmas18.json: "#BEG(#ELEM(S))" // finds every sentence-initial word
26cosmas19.json: "MORPH(V) #IN(L) #ELEM(S)" // e.g. questions
27cosmas20.json: "MORPH(V) #IN(R) #ELEM(S)" // e.g. subordinate clauses