add an excerpt from NKJP 1M v 1.2: infrastructure files in the root and the KOT subcorpus
Change-Id: I56a68249bb41821f6e5a6b33303182ed75ee73cf
diff --git a/nkjp2korap_sample1/README b/nkjp2korap_sample1/README
new file mode 100755
index 0000000..e5a61a0
--- /dev/null
+++ b/nkjp2korap_sample1/README
@@ -0,0 +1,13 @@
+Katalog zawiera ręcznie anotowany podkorpus milionowy, stworzony przez próbkowanie tekstów na bazie podzbioru Narodowego Korpusu Języka Polskiego.
+Dokładniejszy opis znajduje się w pliku NKJP_1M_header.xml, a wyczerpujący - w podręczniku "Narodowy Korpus Języka Polskiego" (Wydawnictwa Naukowe PWN, Warszawa 2012).
+
+Podkorpus dostępny jest na licencji CC BY 3.0 PL (Uznanie autorstwa 3.0 Polska). Więcej informacji: https://creativecommons.org/licenses/by/3.0/pl/.
+
+
+
+
+The directory contains the manually annotated 1-million word subcorpus sampled from texts of a subset of the National Corpus of Polish.
+More detailed description can be found in NKJP_1M_header.xml, and the exhaustive description (in Polish only) - in the user manual
+"Narodowy Korpus Języka Polskiego" (Wydawnictwa Naukowe PWN, Warszawa 2012).
+
+The subcorpus is available on CC BY 3.0 PL licence (Attribution 3.0 Unported). More information: https://creativecommons.org/licenses/by/3.0/.