Rebecca Wilm | c81e10d | 2024-08-29 15:48:14 +0200 | [diff] [blame] | 1 | % layout 'main', title => 'KorAP: Reguläre Ausdrücke'; |
| 2 | |
| 3 | %= page_title |
| 4 | |
| 5 | <p>Bei regulären Ausdrücken handelt es sich um Suchmuster, die Mengen von Zeichenketten beschreiben.</p> |
| 6 | <p>Im Backend von KorAP wird eine große Bandbreite von Operatoren unterstützt. Für die folgenden Operatoren kann garantiert werden, dass sie zuverlässig über das ganze System hinweg funktionieren:</p> |
| 7 | |
| 8 | <section id="quantifiers"> |
| 9 | <h3>Operatoren</h3> |
| 10 | <dl> |
| 11 | <dt><code>.</code> - Platzhalter</dt> |
| 12 | <dd>Beliebiges Zeichen</dd> |
| 13 | <dt><code>()</code> - Gruppe</dt> |
| 14 | <dd>Bildet eine Gruppe von Operanden</dd> |
| 15 | <dt><code>|</code> - Alternative</dt> |
| 16 | <dd>Stellt eine Alternative zwischen Operanden dar</dd> |
| 17 | <dt><code>[]</code> - Zeichenklasse</dt> |
| 18 | <dd>Entspricht einem beliebigen der in eckige Klammern gesetzen Zeichen</dd> |
| 19 | <dt><code>\</code> - Escapezeichen</dt> |
| 20 | <dd>Hebt die Sonderbedeutung des darauffolgenden Zeichens auf, damit dieses nicht als Operator oder Quantor, sondern als normales Zeichen behandelt wird</dd> |
| 21 | </dl> |
| 22 | |
| 23 | %= doc_query poliqarp => '".eine" Frau', cutoff => 1 |
| 24 | %= doc_query poliqarp => '"Fr..de"', cutoff => 1 |
| 25 | %= doc_query poliqarp => '"Fr(ie|eu)de" []{,3} Eierkuchen', cutoff => 1 |
| 26 | %= doc_query poliqarp => '"Fre[um]de"', cutoff => 1 |
| 27 | %= doc_query poliqarp => '"b.w\."', cutoff => 1 |
| 28 | </section> |
| 29 | |
| 30 | <section id="quantifiers"> |
| 31 | <h3>Quantoren</h3> |
| 32 | |
| 33 | <p>Quantoren werden genutzt, um Operanden in regulären Ausdrücken zu quantifizieren, d.h., um anzugeben, wie viele Male in Folge ein Operand in einer Zeichenkette vorkommen darf. Die folgenden Quantoren werden von KorAP unterstützt:</p> |
| 34 | |
| 35 | <dl> |
| 36 | <dt><code>?</code></dt> |
| 37 | <dd>0 oder 1 Vorkommen</dd> |
| 38 | <dt><code>*</code></dt> |
| 39 | <dd>0 oder mehrere Vorkommen</dd> |
| 40 | <dt><code>+</code></dt> |
| 41 | <dd>1 oder mehrere Vorkommen</dd> |
| 42 | <dt><code>{n}</code></dt> |
| 43 | <dd><code>n</code> Vorkommen</dd> |
| 44 | <dt><code>{n,}</code></dt> |
| 45 | <dd>Mindestens <code>n</code> Vorkommen</dd> |
| 46 | <dt><code>{n,m}</code></dt> |
| 47 | <dd>Mindestens <code>n</code>, aber höchstens <code>m</code> Vorkommen</dd> |
| 48 | </dl> |
| 49 | %= doc_query poliqarp => '"Schif+ahrt"', cutoff => 1 |
| 50 | %= doc_query poliqarp => '"kl?eine" Kinder', cutoff => 1 |
| 51 | %= doc_query poliqarp => '"Schlos{2,3}traße"', cutoff => 1 |
| 52 | %= doc_query poliqarp => '"Rha(bar){2}"', cutoff => 1 |
| 53 | </section> |