blob: a7f92683d9454a44caf4da3e7b9c34c5a4bbc3f1 [file] [log] [blame]
Akroned4efe32020-11-16 17:21:18 +01001package de.ids_mannheim.korap.plkexport;
2
3import java.io.IOException;
4
5import static org.junit.Assert.assertEquals;
6import static org.junit.Assert.assertNull;
7import static org.junit.Assert.assertTrue;
8import static org.junit.Assert.assertFalse;
9import static org.junit.Assert.fail;
10import org.junit.Test;
11
12import de.ids_mannheim.korap.plkexport.Snippet;
13
14public class SnippetTest {
15
16 @Test
17 public void testSimple () {
18 Snippet s = new Snippet("<span class=\"context-left\">Der </span><span class=\"match\"><mark>Plagegeist</mark></span><span class=\"context-right\"> ging um</span>");
Akronea77cb42020-11-18 14:04:21 +010019 assertEquals(s.getLeft(),"Der ");
20 assertEquals(s.getRight()," ging um");
Akroned4efe32020-11-16 17:21:18 +010021 assertEquals(s.getMark(),"Plagegeist");
Akron1c8a7682020-11-16 19:06:02 +010022 assertFalse(s.hasMoreLeft());
23 assertFalse(s.hasMoreRight());
Akroned4efe32020-11-16 17:21:18 +010024 };
Akronc408ccb2020-11-16 18:22:12 +010025
26 @Test
27 public void testReal () {
28 Snippet s = new Snippet("<span class=\"context-left\"><span class=\"more\"></span>und wie ich in einem Buch von Bernhard Karlgren gelesen habe, wird da eine alte Bedeutung &quot;Blutegel&quot; für dieses Zeichen angenommen, bzw. auch andere Ungeziefer konnten wohl gemeint sein. Der ma-Teil des Worts wurde also ursprünglich wahrscheinlich im Sinne von &quot;</span><span class=\"match\"><mark>Plagegeist</mark></span><span class=\"context-right\">&quot; verwendet, folglich war 蚂蚁 ursprünglich frei übersetzt eine &quot;Sch...-Ameise&quot; ;-) -- 18:21, 30. Apr. 2007 (CEST) Hallo Allgaeuer, mag sein, dass es für dich ein Hammer ist, aber es ist Stand der aktuellen Forschung in der Sinologie. Schriften von Karlgren u.<span class=\"more\"></span></span>");
29 assertEquals(s.getLeft(),
30 "und wie ich in einem Buch von Bernhard Karlgren "+
31 "gelesen habe, wird da eine alte Bedeutung "+
32 "\"Blutegel\" "+
33 "für dieses Zeichen angenommen, bzw. auch andere "+
34 "Ungeziefer konnten wohl gemeint sein. Der ma-Teil "+
35 "des Worts wurde also ursprünglich wahrscheinlich "+
36 "im Sinne von \"");
37 assertEquals(s.getRight(),"\" verwendet, folglich war 蚂蚁 ursprünglich frei übersetzt eine \"Sch...-Ameise\" ;-) -- 18:21, 30. Apr. 2007 (CEST) Hallo Allgaeuer, mag sein, dass es für dich ein Hammer ist, aber es ist Stand der aktuellen Forschung in der Sinologie. Schriften von Karlgren u.");
38 assertEquals(s.getMark(),"Plagegeist");
Akron1c8a7682020-11-16 19:06:02 +010039 assertTrue(s.hasMoreLeft());
40 assertTrue(s.hasMoreRight());
Akronc408ccb2020-11-16 18:22:12 +010041 };
Akronea77cb42020-11-18 14:04:21 +010042
43 @Test
44 public void testMultipleMarks () {
45 Snippet s = new Snippet("<span class=\"context-left\"><span class=\"more\"></span>Figueras (gegen 1030, Kopialbuch der Abtei von Saint-Pé-de-Bigorre), Figeres (1154, laut Pierre de Marcas Buch Histoire de Béarn), Figueres (1421, Urkunden der Vicomté von Béarn), Higueres (1750, Karte von Cassini), Higueres (1793, Notice Communale) und Higueres und Higuères (1801, Bulletin </span><span class=\"match\"><mark><mark class=\"class-2 level-0\">des <mark class=\"class-1 level-1\">lois</mark></mark><mark class=\"class-1 level-1\">). Toponyme</mark></mark></span><span class=\"context-right\"> und Erwähnungen von Souye waren: Soyge und Soya (1538 bzw. 1547, Manuskriptsammlung des 16. bis 18. Jahrhunderts), Souia (1645, Volkszählung von Morlaàs), Souge und Souie (1675 bzw. 1682, Manuskriptsammlung des 16. bis 18. Jahrhunderts), Souge (1750, Karte von Cassini), Souye<span class=\"more\"></span></span>");
46 assertEquals(s.getLeft(), "Figueras (gegen 1030, Kopialbuch der Abtei von Saint-Pé-de-Bigorre), Figeres (1154, laut Pierre de Marcas Buch Histoire de Béarn), Figueres (1421, Urkunden der Vicomté von Béarn), Higueres (1750, Karte von Cassini), Higueres (1793, Notice Communale) und Higueres und Higuères (1801, Bulletin ");
47 assertEquals(s.getRight()," und Erwähnungen von Souye waren: Soyge und Soya (1538 bzw. 1547, Manuskriptsammlung des 16. bis 18. Jahrhunderts), Souia (1645, Volkszählung von Morlaàs), Souge und Souie (1675 bzw. 1682, Manuskriptsammlung des 16. bis 18. Jahrhunderts), Souge (1750, Karte von Cassini), Souye");
48 assertEquals(s.getMark(),"des lois). Toponyme");
49 assertTrue(s.hasMoreLeft());
50 assertTrue(s.hasMoreRight());
51 };
Akron9e3229f2020-11-18 14:41:50 +010052
53 @Test
54 public void testCuttedAndEmptyContext () {
55 Snippet s = new Snippet("<span class=\"context-left\"></span><span class=\"match\"><mark>Und dafür musstest Du extra ne neue Socke erstellen? Wieso traust Du Dich nicht, mit Deinem Account aufzutreten? - -- ωωσσI - talk with me 09:17, 17. Dez. 2011 (CET) Der ist doch gesperrt. -- 09:21, 17. Dez. 2011 (CET) WWSS1, weil ich normalerweise mit IP schreibe und in dem Fall nicht möchte, dass</mark><span class=\"cutted\"></span></span><span class=\"context-right\"> meine IP öffentlich angezeigt wird. Über die IP kann man auf den Wohnort, den Provider und bei Aufenthalt am Arbeitsplatz auf den Arbeitgeber schließen, über Konto nicht. -- 09:24, 17. Dez. 2011 (CET) Bist Du denn nicht mehr selber Arbeitgeber? -- 09:31<span class=\"more\"></span></span>");
56 assertEquals(s.getLeft(), "");
57 assertEquals(s.getRight()," meine IP öffentlich angezeigt wird. Über die IP kann man auf den Wohnort, den Provider und bei Aufenthalt am Arbeitsplatz auf den Arbeitgeber schließen, über Konto nicht. -- 09:24, 17. Dez. 2011 (CET) Bist Du denn nicht mehr selber Arbeitgeber? -- 09:31");
58 assertEquals(s.getMark(),"Und dafür musstest Du extra ne neue Socke erstellen? Wieso traust Du Dich nicht, mit Deinem Account aufzutreten? - -- ωωσσI - talk with me 09:17, 17. Dez. 2011 (CET) Der ist doch gesperrt. -- 09:21, 17. Dez. 2011 (CET) WWSS1, weil ich normalerweise mit IP schreibe und in dem Fall nicht möchte, dass");
59 assertTrue(s.isCutted());
60 assertFalse(s.hasMoreLeft());
61 assertTrue(s.hasMoreRight());
62
63 };
Akroned4efe32020-11-16 17:21:18 +010064};