Fix some false positives
Change-Id: Ifaec3023569865919c524dc4cd72a4a418949711
diff --git a/test/data/gender.conllu b/test/data/gender.conllu
index 9319d7c..e764a9e 100644
--- a/test/data/gender.conllu
+++ b/test/data/gender.conllu
@@ -138,3 +138,77 @@
7 die _ DET ART _ _ _ _ _
8 Hilfe _ NOUN NN _ _ _ _ _
+# --- Regression tests: false-positive prevention --------------------------
+# Tokens *, Y, per, EL, EM, Ey, sin must NOT be tagged as neo-pronouns when
+# they appear mid-sentence in uppercase or are known false positives.
+
+# foundry = base
+# filename = TEST/gender/000013/base/tokens.xml
+# text_id = GENDER_TEST.000013
+# text = Hinweis auf * und Y sowie per Einschreiben
+1 Hinweis _ NOUN NN _ _ _ _ _
+2 auf _ ADP APPR _ _ _ _ _
+3 * _ PUNCT $( _ _ _ _ _
+4 und _ CCONJ KON _ _ _ _ _
+5 Y _ NOUN NN _ _ _ _ _
+6 sowie _ CCONJ KON _ _ _ _ _
+7 per _ ADP APPR _ _ _ _ _
+8 Einschreiben _ NOUN NN _ _ _ _ _
+
+# foundry = base
+# filename = TEST/gender/000014/base/tokens.xml
+# text_id = GENDER_TEST.000014
+# text = Verweise auf EL EM Ey sin im Text
+1 Verweise _ NOUN NN _ _ _ _ _
+2 auf _ ADP APPR _ _ _ _ _
+3 EL _ NOUN NN _ _ _ _ _
+4 EM _ NOUN NN _ _ _ _ _
+5 Ey _ ITJ ITJ _ _ _ _ _
+6 sin _ NOUN NN _ _ _ _ _
+7 im _ ADP APPRART _ _ _ _ _
+8 Text _ NOUN NN _ _ _ _ _
+
+# foundry = base
+# filename = TEST/gender/000015/base/tokens.xml
+# text_id = GENDER_TEST.000015
+# text = Jeder Mensch hat Würde
+1 Jeder _ DET PIAT _ _ _ _ _
+2 Mensch _ NOUN NN _ _ _ _ _
+3 hat _ AUX VAFIN _ _ _ _ _
+4 Würde _ NOUN NN _ _ _ _ _
+
+# --- Regression tests: correct neo-pronoun recognition -------------------
+# Lowercase forms and sentence-initial capitalised neo-pronouns must still
+# be tagged; only mid-sentence uppercase ambiguous forms are suppressed.
+
+# foundry = base
+# filename = TEST/gender/000016/base/tokens.xml
+# text_id = GENDER_TEST.000016
+# text = dankte el und em für ey und y
+1 dankte _ VERB VVFIN _ _ _ _ _
+2 el _ _ _ _ _ _ _ _
+3 und _ CCONJ KON _ _ _ _ _
+4 em _ _ _ _ _ _ _ _
+5 für _ ADP APPR _ _ _ _ _
+6 ey _ _ _ _ _ _ _ _
+7 und _ CCONJ KON _ _ _ _ _
+8 y _ _ _ _ _ _ _ _
+
+# foundry = base
+# filename = TEST/gender/000017/base/tokens.xml
+# text_id = GENDER_TEST.000017
+# text = mensch fragte und Mensch antwortete
+1 Mensch _ _ _ _ _ _ _ _
+2 fragte _ VERB VVFIN _ _ _ _ _
+3 und _ CCONJ KON _ _ _ _ _
+4 Mensch _ NOUN NN _ _ _ _ _
+5 antwortete _ VERB VVFIN _ _ _ _ _
+
+# foundry = base
+# filename = TEST/gender/000018/base/tokens.xml
+# text_id = GENDER_TEST.000018
+# text = Mensch traf xier
+1 Mensch _ _ _ _ _ _ _ _
+2 traf _ VERB VVFIN _ _ _ _ _
+3 xier _ _ _ _ _ _ _ _
+