Blame - Changes - KorAP/KorAP-XML-CoNLL-U

blob: f87e8c38af2acb0d18ce178a923e6c8d3815679d [file] [log] [blame]

Marc Kupietz	12f64e4	2022-09-29 08:58:16 +0200	[diff] [blame^]	1	0.5.0 2022-09-29
				2	- korapxml2conllu:
				3	- --word2vec\|lm-training-data option added to print word2vec input format
				4	- --extract-metadata-regex added to extract some metadata values as context input for language model training
				5	- by default sentence boundary information is now read from structure.xml files (use --s-bounds-from-morpho otherwise)
				6	- use morpho.xml if present when run on base zips
				7	- new option -c <columns>
				8	- conllu2korapxml:
				9	- ignore _-lemmas
				10	- handle UDPipe comments
				11	- ignore non-interpretable comments
				12	- improve error handling for missing text ids and offsets
Marc Kupietz	f1fdc19	2021-10-08 13:29:59 +0200	[diff] [blame]	13
Marc Kupietz	a7d90c6	2021-07-31 23:48:13 +0200	[diff] [blame]	14	0.4.1 2021-07-31
				15	- korapxml2conllu: fix patterns not extracted for last texts in archive
				16
Marc Kupietz	6beca9d	2021-07-29 18:26:09 +0200	[diff] [blame]	17	0.4 2021-07-29
Marc Kupietz	eb7d06a	2021-03-19 16:29:16 +0100	[diff] [blame]	18	- korapxml2conllu option -e <regex> added to extract element/attributes to comments
Marc Kupietz	0ab8a2c	2021-03-19 16:21:00 +0100	[diff] [blame]	19
Marc Kupietz	22858f8	2021-02-15 14:22:05 +0100	[diff] [blame]	20	0.3 2021-02-15
Marc Kupietz	79ba1e5	2021-02-12 17:26:54 +0100	[diff] [blame]	21	- Provide conllu2korapxml to convert from ConLL-U to KorAP-XML zip
				22
Marc Kupietz	b96c386	2021-02-12 08:33:44 +0100	[diff] [blame]	23	0.2 2021-02-12
Marc Kupietz	d845583	2021-02-11 17:30:29 +0100	[diff] [blame]	24	- Convert also KorAP-XML base zips
				25
Marc Kupietz	396b4d6	2021-02-12 08:29:35 +0100	[diff] [blame]	26	0.1 2020-09-23
				27	- Initial release to GitHub.