Fix sentence splitting tests

commit: 6e70dc81dcc9e3e15be53f6e06f383087bb041df [log] [tgz]
author: Akron <nils@diewald-online.de> Wed Aug 11 11:33:18 2021 +0200
committer: Akron <nils@diewald-online.de> Wed Aug 11 11:33:18 2021 +0200
tree: a75319367e599f903ba44b85d9842399539e6a06
parent: 1594cb82c4658840872752f2e62757d584851ad8 [diff] [blame]
diff --git a/datokenizer.go b/datokenizer.go
index d862164..c37aaeb 100644
--- a/datokenizer.go
+++ b/datokenizer.go

@@ -1347,6 +1347,7 @@
 				fmt.Println("-> Flush buffer: [", string(data), "]")
 			}
 			writer.Write(data)
+
 			if dat.isTokenEnd(t) {
 				writer.WriteRune('\n')
 				if DEBUG {
@@ -1355,6 +1356,16 @@
 			}
 		}
 
+		// Add an additional sentence ending, if the file is over but no explicit
+		// sentence split was reached. This may be controversial and therefore
+		// optional via parameter.
+		if !dat.isTokenEnd(t0) {
+			writer.WriteRune('\n')
+			if DEBUG {
+				fmt.Println("-> Newline")
+			}
+		}
+
 		// There may be a new line at the end, from an epsilon, so we go on!
 		return true
 	}
commit	6e70dc81dcc9e3e15be53f6e06f383087bb041df	[log] [tgz]
author	Akron <nils@diewald-online.de>	Wed Aug 11 11:33:18 2021 +0200
committer	Akron <nils@diewald-online.de>	Wed Aug 11 11:33:18 2021 +0200
tree	a75319367e599f903ba44b85d9842399539e6a06
parent	1594cb82c4658840872752f2e62757d584851ad8 [diff] [blame]