Rebecca Wilm | 45e9afe | 2024-11-07 15:17:29 +0100 | [diff] [blame^] | 1 | % layout 'main', title => 'KorAP: ANNIS QL'; |
| 2 | |
| 3 | %= page_title |
| 4 | |
| 5 | <p><%= ext_link_to 'ANNIS Query Language (auch ANNIS QL oder AQL genannt)', "http://korpling.github.io/ANNIS/4/user-guide/aql/" %> ist eine Anfragesprache des <%= ext_link_to 'Korpussuchtools ANNIS', "https://corpus-tools.org/annis/" %>. Sie wurde speziell für den Umgang mit komplexen linguistischen Korpora entwickelt, für die mehrere Annotationsebenen (z.B. Morphologie) unterschiedlicher Annotationstypen (z.B. Attribut-Wert-Paare, Relationen) vorhanden sind. Man kann sich AQL konzeptuell als eine Suche nach Knotenelementen und Kanten, die sie verbinden, vorstellen. Bei einem Knotenelement kann es sich dabei um ein Token oder ein Attribut-Wert-Paar handeln.</p> |
| 6 | |
| 7 | <p>KorAP unterstützt die folgenden Schlüsselwörter. Dabei werden die <%= embedded_link_to 'doc', 'Standardfoundries', 'data', 'annotation' %> verwendet.</p> |
| 8 | <dl> |
| 9 | <dt><code>node</code></dt> |
| 10 | <dd>ein Knotenelement</dd> |
| 11 | <dt><code>tok</code></dt> |
| 12 | <dd>ein Token</dd> |
| 13 | <dt><code>cat</code> oder <code>c</code></dt> |
| 14 | <dd>eine Konstituente</dd> |
| 15 | <dt><code>lemma</code> oder <code>l</code></dt> |
| 16 | <dd>ein Knoten mit Lemma-Annotation</dd> |
| 17 | <dt><code>pos</code> oder <code>p</code></dt> |
| 18 | <dd>ein Knoten mit Part-of-Speech-Annotation</dd> |
| 19 | <dt><code>m</code></dt> |
| 20 | <dd>ein morphologisch annotierter Knoten</dd> |
| 21 | </dl> |
| 22 | |
| 23 | <blockquote class="warning"> |
| 24 | <p>In KorAP ist es aktuell nicht möglich, innerhalb von AQL-Anfragen Bedingungen zu stellen, die Metadaten betreffen; das Präfix "meta::" wird nicht unterstützt. Metadaten-Bedingungen werden in KorAP von Suchanfragen getrennt und können in Form von Korpusanfragen, die virtuelle Korpora definieren, gestellt werden.</p> |
| 25 | </blockquote> |
| 26 | |
| 27 | <section id="examples"> |
| 28 | <h3>Knotenelemente</h3> |
| 29 | |
| 30 | <p>Einfache Tokens</p> |
| 31 | %= doc_query annis => '"liebe"', cutoff => 1 |
| 32 | |
| 33 | <p>Attribut-Wert-Paare</p> |
| 34 | %= doc_query annis => 'tok="liebe"', cutoff => 1 |
| 35 | |
| 36 | <p>AQL-Namensräume werden in KorAP als eine Kombination zwischen Foundry und Annotationsebene realisiert. Sie sind dann von Bedeutung, wenn von speziellen Tools (Foundries) erstellte Annotationsebenen in Suchanfragen eine Rolle spielen. Die folgende Anfrage sucht zum Beispiel nach nebenordnenden Konjunktionen laut Part-of-Speech-Annotationsebene der TreeTagger-Foundry.</p> |
| 37 | %= doc_query annis => 'tt/p="KON"', cutoff => 1 |
| 38 | |
| 39 | <h3>Reguläre Ausdrücke</h3> |
| 40 | %= doc_query annis => 'tok =/m.*keit/', cutoff => 1 |
| 41 | |
| 42 | <h3>Sequenzanfragen</h3> |
| 43 | <p>Zwei aufeinanderfolgende Tokens</p> |
| 44 | %= doc_query annis => '"der"."Bär"', cutoff => 1 |
| 45 | |
| 46 | <p>Finite Verben, auf die indirekt ein Adverb folgt, wobei eine beliebige Anzahl von Tokens dazwischen stehen kann</p> |
| 47 | %= doc_query annis => 'pos="VVFIN" .* pos="ADV"', cutoff => 1 |
| 48 | |
| 49 | <h3>Negation</h3> |
| 50 | <p>In KorAP wird die Negation (z.B. von Tokens) nur innerhalb von Sequenzanfragen unterstützt.</p> |
| 51 | %= doc_query annis => '"Katze" . pos != "VVFIN"', cutoff => 1 |
| 52 | |
| 53 | <h3>Gerichtete Relationen</h3> |
| 54 | <p>Gerichtete Relationen beschreiben direkte Beziehungen zwischen zwei Knotenelementen. Es kann sich zum Beispiel um Dependenzrelationen handeln.</p> |
| 55 | |
| 56 | <p>Suche nach allen <code>"SUBJ"</code>-Dependenzrelationen</p> |
| 57 | %= doc_query annis => 'node ->malt/d[func="SUBJ"] node', cutoff => 1 |
| 58 | |
| 59 | <p>Suche nach <code>"SUBJ"</code>-Dependenzrelationen, deren Startknoten das Token <code>"ich"</code> ist</p> |
| 60 | %= doc_query annis => '"ich" ->malt/d[func="SUBJ"] node', cutoff => 1 |
| 61 | |
| 62 | <p>Suche nach <code>"SUBJ"</code>-Dependenzrelationen, deren Startknoten das Token <code>"ich"</code> und deren Zielknoten ein Vollverb im Partizip Perfekt ist</p> |
| 63 | %= doc_query annis => '"ich" ->malt/d[func="SUBJ"] pos="VVPP"', cutoff => 1 |
| 64 | |
| 65 | <h3>Referenzierung von Knotenelementen</h3> |
| 66 | <p>Knotenelemente können durch <code>#</code> gefolgt von ihrer Position in der Anfrage referenziert werden. Zum Beispiel:</p> |
| 67 | %= doc_query annis => '"ich" & pos="VVPP" & #1 ->malt/d[func="SUBJ"] #2', cutoff => 1 |
| 68 | %= doc_query annis => '"ich" & pos="VVPP" & #1 . #2', cutoff => 1 |
| 69 | |
| 70 | %# Bug in Krill |
| 71 | %# <p>"ich" & pos="VVFIN" & #1 ->malt/d[func="SUBJ"] #2 & #1 . #2</p> |
| 72 | |
| 73 | <blockquote class="warning"> |
| 74 | <p>Unäre Operatoren wie <code>arity</code> oder <code>tokenarity</code> sind in KorAP noch nicht implementiert worden.</p> |
| 75 | </blockquote> |
| 76 | |
| 77 | |
| 78 | <!-- Noch nicht in Krill implementiert |
| 79 | |
| 80 | <h3>Unäre Operatoren</h3> |
| 81 | <dl>Arity</dl> |
| 82 | <dt>die Anzahl der direkt dominierten Kinder eines Knotens</dt> |
| 83 | <p>Suche nach Adverbialphrasen, die genau zwei direkte Kinder haben</p> |
| 84 | <p>cat="AVP" & #1:arity=2</p> |
| 85 | |
| 86 | <dl>Tokenarity</dl> |
| 87 | <dt>die Anzahl von Tokens innerhalb eines Knotens</dt> |
| 88 | <p>Suche nach Adverbialphrasen, die aus genau zwei Tokens bestehen</p> |
| 89 | <p>cat="AVP" & #1:tokenarity=2</p> |
| 90 | |
| 91 | <h3>Suche innerhalb eines Baumes</h3> |
| 92 | <h4>Dominanz</h4> |
| 93 | <p>AQL beschreibt hierarchische Relationen zwischen Knoten eines Baumes und nutzt dabei ein Konzept der Dominanz. Knoten A dominiert Knoten B, wenn A sich im Baum in einer höheren Positions befindet als B. Darüber hinaus wird B von A <strong>direkt dominiert</strong>, wenn sich A genau über B befindet und es keine anderen Knoten dazwischen gibt.</p> |
| 94 | |
| 95 | <p>Direkte Dominanz</p> |
| 96 | <p></p> |
| 97 | |
| 98 | <p>Indirekte Dominanz</p> |
| 99 | <p></p> |
| 100 | |
| 101 | --> |
| 102 | </section> |