Helge | b4c098c | 2022-10-04 16:26:38 +0200 | [diff] [blame] | 1 | % layout 'main', title => 'KorAP: COSMAS II'; |
| 2 | |
| 3 | %= page_title |
| 4 | |
| 5 | <p> Diese Dokumentation geht auf einige Aspekte der in KorAP implementierten Version der Suchanfragesprache COSMAS II ein. |
| 6 | Weitere Informationen finden Sie in der <%= ext_link_to 'Online-Hilfe von COSMAS II', "http://www.ids-mannheim.de/cosmas2/web-app/hilfe/suchanfrage/eingabe-zeile/syntax/allgemein.html" %>. </p> |
| 7 | |
| 8 | <section id="queryterms"> |
| 9 | |
| 10 | |
| 11 | <h3>Suchbegriffe</h3> |
| 12 | |
| 13 | |
| 14 | <p>Ein Suchbegriff in COSMAS II kann ein Wort, ein Satzzeichen oder eine Zahl sein.</p> |
| 15 | |
| 16 | |
| 17 | |
| 18 | %= doc_query cosmas2 => 'Baum' |
| 19 | |
| 20 | |
| 21 | %= doc_query cosmas2 => '4000' |
| 22 | |
| 23 | |
| 24 | <blockquote class="missing"> |
| 25 | |
| 26 | <p>Interpunktionen werden derzeit von KorAP nicht unterstützt.</p> |
| 27 | |
| 28 | |
| 29 | </blockquote> |
| 30 | |
| 31 | |
| 32 | <h4>Platzhalteroperatoren</h4> |
| 33 | |
| 34 | <p>Darüber hinaus können Suchbegriffe mehrere Platzhalter enthalten, z. B. <code>?</code> (für genau ein beliebiges Zeichen), <code>+</code> (für entweder ein beliebiges oder kein Zeichen) |
| 35 | |
| 36 | oder <code>*</code> (für eine beliebige Folge beliebiger Zeichen oder kein Zeichen).</p> |
| 37 | |
| 38 | |
| 39 | <%= doc_query cosmas2 => 'Bau?m' %> |
| 40 | |
| 41 | <%= doc_query cosmas2 => 'Bau+m' %> |
| 42 | |
| 43 | <%= doc_query cosmas2 => 'Bau*m' %> |
| 44 | |
| 45 | %# TODO: |
| 46 | %# <p>To escape placeholder symbols (i.e. to prevent these symbols from being interpreted as placeholders), they need to be prepended by a <code>\</code> symbol.</p> |
| 47 | %# <%= doc_query cosmas2 => 'Student\*in' %> |
| 48 | %# <p>To escape the backslash symbol, another backslash is required (<code>\\</code>).</p> |
| 49 | |
| 50 | <h4>Lemmaoperator</h4> |
| 51 | |
| 52 | <p>Der Lemmaoperator <code>&</code> ermöglicht die Suche nach Flexionsformen eines Wortes, indem dem Lemma (wenn es in der <%= embedded_link_to 'doc', 'default foundry', 'data', 'annotation'%> annotiert wurde) ein <code>&</code> vorangestellt wird. Die Form des Lemmas hängt von der Annotation ab.</p> |
| 53 | % # <p>Der Lemmaoperator & ermöglicht nicht nur die Suche nach Flexions-, sondern auch nach Wortbildungsformen // to be extended by the time glemm is ready .. </p> |
| 54 | |
| 55 | <%= doc_query cosmas2 => '&laufen' %> |
| 56 | |
| 57 | |
| 58 | <h4>Groß- und Kleinschreibung</h4> |
| 59 | |
| 60 | <p>Wenn Sie dem Begriff ein <code>$</code> voranstellen, wird bei der Suche die Groß-/Kleinschreibung nicht berücksichtigt.</p> |
| 61 | |
| 62 | <%= doc_query cosmas2 => '$Lauf' %> |
| 63 | |
| 64 | |
| 65 | <h4>Reguläre Ausdrücke</h4> |
| 66 | |
| 67 | <p>Mit dem Operator <code>#REG(...)</code> können in Suchbegriffen <%= embedded_link_to 'doc', 'reguläre Ausdrücke', 'ql', 'regexp'%> verwendet werden.</p> |
| 68 | |
| 69 | <%= doc_query cosmas2 => '#REG(Archi.*ung)' %> |
| 70 | |
| 71 | |
| 72 | <blockquote class="missing"> |
| 73 | |
| 74 | <p>Reguläre Ausdrücke in COSMAS II sind in KorAP noch nicht vollständig implementiert. Wenn Sie reguläre Ausdrücke verwenden möchten, können Sie stattdessen <%= embedded_link_to 'doc', 'Poliqarp', 'ql', 'poliqarp-plus#regexp' %> verwenden.</p> |
| 75 | |
| 76 | |
| 77 | </blockquote> |
| 78 | |
| 79 | |
| 80 | </section> |
| 81 | |
| 82 | |
| 83 | <section id="logical-operators"> |
| 84 | |
| 85 | |
| 86 | <h3>Logische Operatoren</h3> |
| 87 | |
| 88 | |
| 89 | <p>Suchbegriffe können mit den logischen Operatoren <code>and</code>, <code>or</code> und <code>not</code> kombiniert werden. Die deutschen Formen werden ebenfalls unterstützt: <code>und</code>, <code>oder</code> und <code>nicht</code>.</p> |
| 90 | |
| 91 | <p>Diese Operatoren arbeiten auf der Textebene. So führt die folgende Anfrage zu Ergebnissen, wenn beide Begriffe an einer beliebigen Stelle im selben Text vorkommen.</p> |
| 92 | |
| 93 | <%= doc_query cosmas2 => 'anscheinend und scheinbar' %> |
| 94 | |
| 95 | <p>Bei der nächsten Anfrage muss mindestens einer der Begriffe an einer beliebigen Stelle im Text vorkommen:</p> |
| 96 | |
| 97 | <%= doc_query cosmas2 => 'anscheinend oder scheinbar' %> |
| 98 | |
| 99 | <p> Die folgende Anfrage führt zu Ergebnissen, wenn der erste Begriff im Text vorkommt und der zweite Begriff nicht im selben Text auftaucht.</p> |
| 100 | |
| 101 | <%= doc_query cosmas2 => 'Kegel nicht Kind' %> |
| 102 | |
| 103 | %# <h4>Logische Operatoren in Suchbegriffen</h4> |
| 104 | <p>Verwendet man logische Operatoren in Suchbegriffen müssen diese in Anführungszeichen gesetzt werden.</p> |
| 105 | |
| 106 | <%= doc_query cosmas2 => 'Mann "und" Maus' %> |
| 107 | |
| 108 | </section> |
| 109 | |
| 110 | |
| 111 | <section id="distance-operators"> |
| 112 | |
| 113 | <h3>Abstandsoperatoren</h3> |
| 114 | |
| 115 | <p>Abstandsoperatoren ermöglichen, nach zwei und mehr Suchbegriffen zu suchen, die in einem bestimmten Abstand auftreten.</p> |
| 116 | |
| 117 | <p>Treffereinschließende Operatoren (<code>/</code>) ermöglichen die Suche nach zwei und mehr Suchbegriffen, die in |
| 118 | einem bestimmten Abstand zueinander vorkommen. Trefferausschließende Operatoren(<code>%</code>) ermöglichen die Suche |
| 119 | nach einem Suchbegriff, bei dem in einem bestimmten Abstand ein zweiter Suchbegriff nicht vorkommt.</p> |
| 120 | |
| 121 | <h4>Treffer-Reihenfolge</h4> |
| 122 | <ul> |
| 123 | <li> |
| 124 | Das <code>+</code> im Operator (z.B. <code>/+w2</code>) bedeutet, dass der in der Suchanfrage zuerst stehende Suchbegriff vor dem zweiten Suchbegriff auftreten muss. |
| 125 | </li> |
| 126 | <li> |
| 127 | Das <code>-</code> im Operator (z.B. <code>/-w2</code>) bedeutet, dass der in der Suchanfrage zuerst stehende Suchbegriff nach dem zweiten Suchbegriff auftreten muss. |
| 128 | </li> |
| 129 | </ul> |
| 130 | |
| 131 | <p>Ohne <code>+</code> und <code>-</code> ist die Reihenfolge der Suchbegriffe beliebig.</p> |
| 132 | |
| 133 | <h4>Maximal- und Intervallabstand</h4> |
| 134 | <ul> |
| 135 | <li> |
| 136 | Enthält ein Abstandsoperator nur eine Zahl MAX (z. B. in <code>/+s4</code>), so ist der von Ihnen angegebene Abstand ein Maximalwert. Demzufolge sind alle gefundenen Suchbegriffe mit einem kleineren Abstand zueinander (inklusive 0-Abstand) als dem angegebenen ebenfalls Bestandteil des Suchergebnisses. |
| 137 | </li> |
| 138 | <li> |
| 139 | Enthält ein Abstandsoperator zwei durch einen Doppelpunkt getrennte Zahlen MAX:MIN (z. B. in <code>/s4:2</code>), so arbeitet der Abstandsoperator mit einer Intervallangabe. Demzufolge sind nur diejenigen Suchbegriffe Bestandteil des Suchergebnisses, deren Abstand im angegebenen Intervall liegt. |
| 140 | </li> |
| 141 | </ul> |
| 142 | |
| 143 | <p>Abstandsoperatoren basieren auf der Tokenisierung und der Annotation der <%= embedded_link_to 'doc', 'default foundry', 'data', 'annotation'%> |
| 144 | für Dokumentstrukturen.</p> |
| 145 | |
| 146 | <p>Wenn eine Suchanfrage mehrere Abstandsoperatoren enthält, müssen diese in Klammern gesetzt werden:</p> |
| 147 | |
| 148 | %= doc_query cosmas2 => '(Tag /+w2 offenen) /+w1 Tür' |
| 149 | |
| 150 | <h4>Wortabstandsoperator</h4> |
| 151 | |
| 152 | <p>Der Wortabstandsoperator <code>w</code> definiert, wie viele Wörter zwischen zwei Suchbegriffen vorkommen.</p> |
| 153 | <p>Suche nach zwei Suchbegriffen im Abstand von bis zu vier Wörtern, wobei die Reihenfolge beliebig ist:</p> |
| 154 | %= doc_query cosmas2 => 'Gegenwart /w4 Zukunft' |
| 155 | |
| 156 | <p>Suche nach zwei Suchbegriffen im Abstand von drei bis vier Wörtern, dabei muss der erste Suchbegriff vor dem zweiten Suchbegriff stehen:</p> |
| 157 | %= doc_query cosmas2 => 'Gegenwart /+w4:3 Zukunft' |
| 158 | |
| 159 | <p>Suche nach zwei direkt aufeinanderfolgenden Suchbegriffen in der angegebenen Reihenfolge:</p> |
| 160 | %= doc_query cosmas2 => 'Gegenwart /+w1:1 Zukunft' |
| 161 | |
| 162 | <p>Suche nach dem ersten Suchbegriff, wobei weder unmittelbar vor noch nach dem Suchbegriff der zweite Suchbegriff vorkommen darf:</p> |
| 163 | %= doc_query cosmas2 => 'Gegenwart %w1 die' |
| 164 | |
| 165 | <h4>Satzabstandsoperator</h4> |
| 166 | |
| 167 | <p>Der Satzabstandsoperator <code>s</code> definiert, wie viele Sätze zwischen zwei Suchbegriffen vorkommen.</p> |
| 168 | <p>Der Satzabstand basiert auf den Annotationen der <%= embedded_link_to 'doc', 'default foundry', 'data', 'annotation'%> für Dokumentstrukturen.</p> |
| 169 | <p>Suche nach zwei Suchbegriffen, die im selben oder im nachfolgenden Satz in beliebiger Reihenfolge vorkommen:</p> |
| 170 | %= doc_query cosmas2 => 'offen /s1 Geschäft' |
| 171 | |
| 172 | <p>Suche nach zwei Suchbegriffen, die im selben Satz vorkommen, wobei der erste Suchbegriff vor dem zweiten steht: </p> |
| 173 | %= doc_query cosmas2 => 'offen /+s0 Geschäft' |
| 174 | |
| 175 | <p>Suche nach zwei Suchbegriffen, wobei der zweite nicht im gleichen Satz vorkommen darf:</p> |
| 176 | %= doc_query cosmas2 => 'Gegenwart %s0 Zukunft' |
| 177 | |
| 178 | |
| 179 | <h4>Absatzabstandsoperator</h4> |
| 180 | |
| 181 | <p>Der Absatzabstandsoperator <code>p</code> definiert, wie viele Absätze zwischen zwei Suchbegriffen vorkommen dürfen.</p> |
| 182 | |
| 183 | <p>Der Absatzabstand hängt von den Annotationen der <%= embedded_link_to 'doc', 'default foundry', 'data', 'annotation'%> für Dokumentstrukturen ab.</p> |
| 184 | |
| 185 | |
| 186 | <p>Suche nach zwei Suchbegriffen, die im selben oder in einem folgenden Absatz in beliebiger Reihenfolge vorkommen:</p> |
| 187 | %= doc_query cosmas2 => 'offen /p1 Geschäft' |
| 188 | |
| 189 | |
| 190 | <p>Suche nach zwei Suchbegriffen, die im selben Absatz vorkommen, wobei der zweite Suchbegriff dem ersten nachfolgt:</p> |
| 191 | %= doc_query cosmas2 => 'offen /+p0 Geschäft' |
| 192 | |
| 193 | |
| 194 | <p>Suche nach zwei Suchbegriffen, die nicht im selben Absatz vorkommen:</p> |
| 195 | %= doc_query cosmas2 => 'Gegenwart %p0 Zukunft' |
| 196 | |
| 197 | <blockquote class="warning"> |
| 198 | <p>Bei Suchen mit Absatzabstandsoperatoren kommt es häufig vor, dass die Länge eines Treffers die maximal erlaubte Länge überschreitet, daher wird das Ergebnis entsprechend gekürzt.</p> |
| 199 | </blockquote> |
| 200 | |
| 201 | |
| 202 | |
| 203 | <h4> Multi-Abstandsoperatoren</h4> |
| 204 | |
| 205 | <p>Abstandsoperatoren können kombiniert werden, um die Ergebnismenge weiter einzuschränken. Sie werden durch ein Komma (ohne Leerzeichen) getrennt.</p> |
| 206 | |
| 207 | <p>Suche nach zwei direkt aufeinanderfolgenden Wörtern in einem Satz:</p> |
| 208 | |
| 209 | %= doc_query cosmas2 => 'ein /+w1,s0 Fest' |
| 210 | |
| 211 | |
| 212 | |
| 213 | <h4>Weggelassener Verknüpfungsoperator</h4> |
| 214 | |
| 215 | <p>Wenn der Abstandsoperator zwischen zwei Operanden weggelassen wird, sucht KorAP nach einem <code>/+w1</code> Abstand:</p> |
| 216 | |
| 217 | %= doc_query cosmas2 => 'runder Tisch' |
| 218 | |
| 219 | </section> |
| 220 | |
| 221 | |
| 222 | <section id="annotation-operators"> |
| 223 | <h3>Annotationsoperatoren</h3> |
| 224 | %= under_construction |
| 225 | %# MORPH and ELEM |
| 226 | </section> |
| 227 | |
| 228 | <section id="combination-operators"> |
| 229 | <h3>Kombinationsoperatoren</h3> |
| 230 | %= under_construction |
| 231 | %# IN and OV |
| 232 | </section> |
| 233 | |
| 234 | <section id="area-operators"> |
| 235 | <h3>Textbereich-Operatoren</h3> |
| 236 | %= under_construction |
| 237 | %# LINKS, RECHTS, INKLUSIVE, EXKLUSIVE, BED |
| 238 | </section> |
| 239 | |