add an excerpt from NKJP 1M v 1.2: infrastructure files in the root and the KOT subcorpus Change-Id: I56a68249bb41821f6e5a6b33303182ed75ee73cf

commit: 973a7efd7627002dd0e1a93505d311e00c4381bd [log] [tgz]
author: bansp <bansp@o2.pl> Thu Nov 18 17:19:27 2021 +0100
committer: bansp <bansp@o2.pl> Thu Nov 18 17:19:27 2021 +0100
tree: f692ebe9917136f269d25c4c45f6918492bec102
parent: 25b0fc1617c595bfc30b9bb96b4db4bbc193f532 [diff] [blame]
diff --git a/nkjp2korap_sample1/README b/nkjp2korap_sample1/README
new file mode 100755
index 0000000..e5a61a0
--- /dev/null
+++ b/nkjp2korap_sample1/README

@@ -0,0 +1,13 @@
+Katalog zawiera ręcznie anotowany podkorpus milionowy, stworzony przez próbkowanie tekstów na bazie podzbioru Narodowego Korpusu Języka Polskiego. 
+Dokładniejszy opis znajduje się w pliku NKJP_1M_header.xml, a wyczerpujący - w podręczniku "Narodowy Korpus Języka Polskiego" (Wydawnictwa Naukowe PWN, Warszawa 2012).
+
+Podkorpus dostępny jest na licencji CC BY 3.0 PL (Uznanie autorstwa 3.0 Polska). Więcej informacji: https://creativecommons.org/licenses/by/3.0/pl/.
+
+
+
+
+The directory contains the manually annotated 1-million word subcorpus sampled from texts of a subset of the National Corpus of Polish. 
+More detailed description can be found in NKJP_1M_header.xml, and the exhaustive description (in Polish only) - in the user manual 
+"Narodowy Korpus Języka Polskiego" (Wydawnictwa Naukowe PWN, Warszawa 2012). 
+
+The subcorpus is available on CC BY 3.0 PL licence (Attribution 3.0 Unported). More information: https://creativecommons.org/licenses/by/3.0/.
commit	973a7efd7627002dd0e1a93505d311e00c4381bd	[log] [tgz]
author	bansp <bansp@o2.pl>	Thu Nov 18 17:19:27 2021 +0100
committer	bansp <bansp@o2.pl>	Thu Nov 18 17:19:27 2021 +0100
tree	f692ebe9917136f269d25c4c45f6918492bec102
parent	25b0fc1617c595bfc30b9bb96b4db4bbc193f532 [diff] [blame]