Added waste tokenizer
Change-Id: I9cd4b2d17e5123860cf188a5f3e11f97b0a445ab
diff --git a/Dockerfile b/Dockerfile
index 72315c7..bcef4e5 100644
--- a/Dockerfile
+++ b/Dockerfile
@@ -122,6 +122,26 @@
#################
+# Install Waste #
+#################
+RUN mkdir Waste && \
+ cd Waste && \
+ wget https://cudmuncher.de/~moocow/mirror/projects/moot/moot-2.0.20-1.tar.gz && \
+ wget https://kaskade.dwds.de/waste/waste-models/waste-data.de-dstar-tiger.tar.gz && \
+ tar -xvzf moot-2.0.20-1.tar.gz && \
+ tar -xvzf waste-data.de-dstar-tiger.tar.gz
+
+RUN cd ./Waste/moot-2.0.20-1 && \
+ ./configure && \
+ make && \
+ make install && \
+ ldconfig && \
+ echo "abbrevs /euralex/Waste/de-dstar-dtiger/abbr.lex\nstopwords /euralex/Waste/de-dstar-dtiger/stop.lex\nconjunctions /euralex/Waste/de-dstar-dtiger/conj.lex\nmodel /euralex/Waste/de-dstar-dtiger/model.hmm" > /euralex/Waste/waste.rc
+
+RUN echo "Waste\n" && cat ./example.txt | waste -N --rcfile=./Waste/waste.rc
+
+
+#################
# Install Datok #
#################
@@ -135,7 +155,6 @@
RUN echo "DATOK\n" && cat example.txt | ./Datok/datok tokenize -t ./Datok/testdata/tokenizer.matok -
-
###########################
# Install KorAP-Tokenizer #
###########################