Blame - t/annotation/xip_constituency.t - KorAP/KorAP-XML-Krill

blob: 026321faf628e063def69ba1c6742fb4426a146a [file] [log] [blame]

Akron	ca9dbb3	2016-01-05 20:54:34 +0100	[diff] [blame]	1	#!/usr/bin/env perl
				2	use strict;
				3	use warnings;
				4	use utf8;
				5	use Test::More;
				6	use Scalar::Util qw/weaken/;
				7	use Data::Dumper;
Akron	5c460e4	2016-03-14 20:12:14 +0100	[diff] [blame^]	8	use lib 't/annotation';
Akron	b5d3461	2016-01-18 19:07:56 +0100	[diff] [blame]	9	use TestInit;
Akron	ca9dbb3	2016-01-05 20:54:34 +0100	[diff] [blame]	10
Akron	b5d3461	2016-01-18 19:07:56 +0100	[diff] [blame]	11	ok(my $tokens = TestInit::tokens('0001'), 'Parse tokens');
Akron	ca9dbb3	2016-01-05 20:54:34 +0100	[diff] [blame]	12
				13	ok($tokens->add('XIP', 'Constituency'), 'Add Structure');
				14
				15	my $data = $tokens->to_data->{data};
				16	like($data->{foundries}, qr!xip/constituency!, 'data');
				17	like($data->{layerInfos}, qr!xip/c=spans!, 'data');
				18
				19	# The length includes the punct - but that doesn't matter
				20	is($data->{stream}->[0]->[1], '<>:xip/c:PREP$<b>64<i>0<i>3<i>1<b>3', 'Prep phrase');
Akron	e7bc37d	2016-02-26 00:21:16 +0100	[diff] [blame]	21	is($data->{stream}->[0]->[2], '<>:xip/c:PP$<b>64<i>0<i>30<i>4<b>2', 'pp phrase');
				22	is($data->{stream}->[0]->[4], '<>:xip/c:TOP$<b>64<i>0<i>129<i>17<b>0', 'top phrase');
				23	is($data->{stream}->[0]->[5], '<>:xip/c:MC$<b>64<i>0<i>129<i>17<b>1', 'mc phrase');
Akron	ca9dbb3	2016-01-05 20:54:34 +0100	[diff] [blame]	24	is($data->{stream}->[-1]->[0], '<>:xip/c:VERB$<b>64<i>124<i>128<i>18<b>4', 'Noun phrase');
				25
Akron	e7bc37d	2016-02-26 00:21:16 +0100	[diff] [blame]	26
Akron	ca9dbb3	2016-01-05 20:54:34 +0100	[diff] [blame]	27	done_testing;
				28
				29	__END__
				30
				31
				32
				33