blob: 794e4defc77f57e0daed38ff0d09df437cf1b8f7 [file] [log] [blame]
Helgeb4c098c2022-10-04 16:26:38 +02001% layout 'main', title => 'KorAP: COSMAS II';
2
3%= page_title
4
5<p> Diese Dokumentation geht auf einige Aspekte der in KorAP implementierten Version der Suchanfragesprache COSMAS II ein.
6Weitere Informationen finden Sie in der <%= ext_link_to 'Online-Hilfe von COSMAS II', "http://www.ids-mannheim.de/cosmas2/web-app/hilfe/suchanfrage/eingabe-zeile/syntax/allgemein.html" %>. </p>
7
8<section id="queryterms">
9
10
11<h3>Suchbegriffe</h3>
12
13
14<p>Ein Suchbegriff in COSMAS II kann ein Wort, ein Satzzeichen oder eine Zahl sein.</p>
15
16
17
18%= doc_query cosmas2 => 'Baum'
19
20
21%= doc_query cosmas2 => '4000'
22
23
24<blockquote class="missing">
25
26<p>Interpunktionen werden derzeit von KorAP nicht unterstützt.</p>
27
28
29</blockquote>
30
31
32<h4>Platzhalteroperatoren</h4>
33
34<p>Darüber hinaus können Suchbegriffe mehrere Platzhalter enthalten, z. B. <code>?</code> (für genau ein beliebiges Zeichen), <code>+</code> (für entweder ein beliebiges oder kein Zeichen)
35
36oder <code>*</code> (für eine beliebige Folge beliebiger Zeichen oder kein Zeichen).</p>
37
38
39<%= doc_query cosmas2 => 'Bau?m' %>
40
41<%= doc_query cosmas2 => 'Bau+m' %>
42
43<%= doc_query cosmas2 => 'Bau*m' %>
44
45%# TODO:
46%# <p>To escape placeholder symbols (i.e. to prevent these symbols from being interpreted as placeholders), they need to be prepended by a <code>\</code> symbol.</p>
47%# <%= doc_query cosmas2 => 'Student\*in' %>
48%# <p>To escape the backslash symbol, another backslash is required (<code>\\</code>).</p>
49
50<h4>Lemmaoperator</h4>
51
52<p>Der Lemmaoperator <code>&amp;</code> ermöglicht die Suche nach Flexionsformen eines Wortes, indem dem Lemma (wenn es in der <%= embedded_link_to 'doc', 'default foundry', 'data', 'annotation'%> annotiert wurde) ein <code>&amp;</code> vorangestellt wird. Die Form des Lemmas hängt von der Annotation ab.</p>
53% # <p>Der Lemmaoperator & ermöglicht nicht nur die Suche nach Flexions-, sondern auch nach Wortbildungsformen // to be extended by the time glemm is ready .. </p>
54
55<%= doc_query cosmas2 => '&laufen' %>
56
57
58<h4>Groß- und Kleinschreibung</h4>
59
60<p>Wenn Sie dem Begriff ein <code>$</code> voranstellen, wird bei der Suche die Groß-/Kleinschreibung nicht berücksichtigt.</p>
61
62<%= doc_query cosmas2 => '$Lauf' %>
63
64
65<h4>Reguläre Ausdrücke</h4>
66
67<p>Mit dem Operator <code>#REG(...)</code> können in Suchbegriffen <%= embedded_link_to 'doc', 'reguläre Ausdrücke', 'ql', 'regexp'%> verwendet werden.</p>
68
69<%= doc_query cosmas2 => '#REG(Archi.*ung)' %>
70
71
72<blockquote class="missing">
73
74<p>Reguläre Ausdrücke in COSMAS II sind in KorAP noch nicht vollständig implementiert. Wenn Sie reguläre Ausdrücke verwenden möchten, können Sie stattdessen <%= embedded_link_to 'doc', 'Poliqarp', 'ql', 'poliqarp-plus#regexp' %> verwenden.</p>
75
76
77</blockquote>
78
79
80</section>
81
82
83<section id="logical-operators">
84
85
86<h3>Logische Operatoren</h3>
87
88
89<p>Suchbegriffe können mit den logischen Operatoren <code>and</code>, <code>or</code> und <code>not</code> kombiniert werden. Die deutschen Formen werden ebenfalls unterstützt: <code>und</code>, <code>oder</code> und <code>nicht</code>.</p>
90
91<p>Diese Operatoren arbeiten auf der Textebene. So führt die folgende Anfrage zu Ergebnissen, wenn beide Begriffe an einer beliebigen Stelle im selben Text vorkommen.</p>
92
93<%= doc_query cosmas2 => 'anscheinend und scheinbar' %>
94
95<p>Bei der nächsten Anfrage muss mindestens einer der Begriffe an einer beliebigen Stelle im Text vorkommen:</p>
96
97<%= doc_query cosmas2 => 'anscheinend oder scheinbar' %>
98
99<p> Die folgende Anfrage führt zu Ergebnissen, wenn der erste Begriff im Text vorkommt und der zweite Begriff nicht im selben Text auftaucht.</p>
100
101<%= doc_query cosmas2 => 'Kegel nicht Kind' %>
102
103%# <h4>Logische Operatoren in Suchbegriffen</h4>
104<p>Verwendet man logische Operatoren in Suchbegriffen müssen diese in Anführungszeichen gesetzt werden.</p>
105
106<%= doc_query cosmas2 => 'Mann "und" Maus' %>
107
108</section>
109
110
111<section id="distance-operators">
112
113<h3>Abstandsoperatoren</h3>
114
115<p>Abstandsoperatoren ermöglichen, nach zwei und mehr Suchbegriffen zu suchen, die in einem bestimmten Abstand auftreten.</p>
116
117<p>Treffereinschließende Operatoren (<code>/</code>) ermöglichen die Suche nach zwei und mehr Suchbegriffen, die in
118einem bestimmten Abstand zueinander vorkommen. Trefferausschließende Operatoren(<code>%</code>) ermöglichen die Suche
119nach einem Suchbegriff, bei dem in einem bestimmten Abstand ein zweiter Suchbegriff nicht vorkommt.</p>
120
121<h4>Treffer-Reihenfolge</h4>
122<ul>
123 <li>
124 Das <code>+</code> im Operator (z.B. <code>/+w2</code>) bedeutet, dass der in der Suchanfrage zuerst stehende Suchbegriff vor dem zweiten Suchbegriff auftreten muss.
125 </li>
126 <li>
127 Das <code>-</code> im Operator (z.B. <code>/-w2</code>) bedeutet, dass der in der Suchanfrage zuerst stehende Suchbegriff nach dem zweiten Suchbegriff auftreten muss.
128 </li>
129</ul>
130
131<p>Ohne <code>+</code> und <code>-</code> ist die Reihenfolge der Suchbegriffe beliebig.</p>
132
133<h4>Maximal- und Intervallabstand</h4>
134<ul>
135 <li>
136 Enthält ein Abstandsoperator nur eine Zahl MAX (z. B. in <code>/+s4</code>), so ist der von Ihnen angegebene Abstand ein Maximalwert. Demzufolge sind alle gefundenen Suchbegriffe mit einem kleineren Abstand zueinander (inklusive 0-Abstand) als dem angegebenen ebenfalls Bestandteil des Suchergebnisses.
137 </li>
138 <li>
139 Enthält ein Abstandsoperator zwei durch einen Doppelpunkt getrennte Zahlen MAX:MIN (z. B. in <code>/s4:2</code>), so arbeitet der Abstandsoperator mit einer Intervallangabe. Demzufolge sind nur diejenigen Suchbegriffe Bestandteil des Suchergebnisses, deren Abstand im angegebenen Intervall liegt.
140 </li>
141</ul>
142
143<p>Abstandsoperatoren basieren auf der Tokenisierung und der Annotation der <%= embedded_link_to 'doc', 'default foundry', 'data', 'annotation'%>
144für Dokumentstrukturen.</p>
145
146<p>Wenn eine Suchanfrage mehrere Abstandsoperatoren enthält, müssen diese in Klammern gesetzt werden:</p>
147
148%= doc_query cosmas2 => '(Tag /+w2 offenen) /+w1 Tür'
149
150<h4>Wortabstandsoperator</h4>
151
152<p>Der Wortabstandsoperator <code>w</code> definiert, wie viele Wörter zwischen zwei Suchbegriffen vorkommen.</p>
153<p>Suche nach zwei Suchbegriffen im Abstand von bis zu vier Wörtern, wobei die Reihenfolge beliebig ist:</p>
154%= doc_query cosmas2 => 'Gegenwart /w4 Zukunft'
155
156<p>Suche nach zwei Suchbegriffen im Abstand von drei bis vier Wörtern, dabei muss der erste Suchbegriff vor dem zweiten Suchbegriff stehen:</p>
157%= doc_query cosmas2 => 'Gegenwart /+w4:3 Zukunft'
158
159<p>Suche nach zwei direkt aufeinanderfolgenden Suchbegriffen in der angegebenen Reihenfolge:</p>
160%= doc_query cosmas2 => 'Gegenwart /+w1:1 Zukunft'
161
162<p>Suche nach dem ersten Suchbegriff, wobei weder unmittelbar vor noch nach dem Suchbegriff der zweite Suchbegriff vorkommen darf:</p>
163%= doc_query cosmas2 => 'Gegenwart %w1 die'
164
165<h4>Satzabstandsoperator</h4>
166
167<p>Der Satzabstandsoperator <code>s</code> definiert, wie viele Sätze zwischen zwei Suchbegriffen vorkommen.</p>
168<p>Der Satzabstand basiert auf den Annotationen der <%= embedded_link_to 'doc', 'default foundry', 'data', 'annotation'%> für Dokumentstrukturen.</p>
169<p>Suche nach zwei Suchbegriffen, die im selben oder im nachfolgenden Satz in beliebiger Reihenfolge vorkommen:</p>
170%= doc_query cosmas2 => 'offen /s1 Geschäft'
171
172<p>Suche nach zwei Suchbegriffen, die im selben Satz vorkommen, wobei der erste Suchbegriff vor dem zweiten steht: </p>
173%= doc_query cosmas2 => 'offen /+s0 Geschäft'
174
175<p>Suche nach zwei Suchbegriffen, wobei der zweite nicht im gleichen Satz vorkommen darf:</p>
176%= doc_query cosmas2 => 'Gegenwart %s0 Zukunft'
177
178
179<h4>Absatzabstandsoperator</h4>
180
181<p>Der Absatzabstandsoperator <code>p</code> definiert, wie viele Absätze zwischen zwei Suchbegriffen vorkommen dürfen.</p>
182
183<p>Der Absatzabstand hängt von den Annotationen der <%= embedded_link_to 'doc', 'default foundry', 'data', 'annotation'%> für Dokumentstrukturen ab.</p>
184
185
186<p>Suche nach zwei Suchbegriffen, die im selben oder in einem folgenden Absatz in beliebiger Reihenfolge vorkommen:</p>
187%= doc_query cosmas2 => 'offen /p1 Geschäft'
188
189
190<p>Suche nach zwei Suchbegriffen, die im selben Absatz vorkommen, wobei der zweite Suchbegriff dem ersten nachfolgt:</p>
191%= doc_query cosmas2 => 'offen /+p0 Geschäft'
192
193
194<p>Suche nach zwei Suchbegriffen, die nicht im selben Absatz vorkommen:</p>
195%= doc_query cosmas2 => 'Gegenwart %p0 Zukunft'
196
197<blockquote class="warning">
198<p>Bei Suchen mit Absatzabstandsoperatoren kommt es häufig vor, dass die Länge eines Treffers die maximal erlaubte Länge überschreitet, daher wird das Ergebnis entsprechend gekürzt.</p>
199</blockquote>
200
201
202
203<h4> Multi-Abstandsoperatoren</h4>
204
205<p>Abstandsoperatoren können kombiniert werden, um die Ergebnismenge weiter einzuschränken. Sie werden durch ein Komma (ohne Leerzeichen) getrennt.</p>
206
207<p>Suche nach zwei direkt aufeinanderfolgenden Wörtern in einem Satz:</p>
208
209%= doc_query cosmas2 => 'ein /+w1,s0 Fest'
210
211
212
213<h4>Weggelassener Verknüpfungsoperator</h4>
214
215<p>Wenn der Abstandsoperator zwischen zwei Operanden weggelassen wird, sucht KorAP nach einem <code>/+w1</code> Abstand:</p>
216
217%= doc_query cosmas2 => 'runder Tisch'
218
219</section>
220
221
222<section id="annotation-operators">
223<h3>Annotationsoperatoren</h3>
224%= under_construction
225%# MORPH and ELEM
226</section>
227
228<section id="combination-operators">
229<h3>Kombinationsoperatoren</h3>
230%= under_construction
231%# IN and OV
232</section>
233
234<section id="area-operators">
235 <h3>Textbereich-Operatoren</h3>
236 %= under_construction
237 %# LINKS, RECHTS, INKLUSIVE, EXKLUSIVE, BED
238</section>
239