Update corpus mapping rules
Change-Id: I445798472f4494ab29db796fa19ad2b09339b1ac
diff --git a/mappings/wiki-dereko.yaml b/mappings/wiki-dereko.yaml
new file mode 100644
index 0000000..83b4815
--- /dev/null
+++ b/mappings/wiki-dereko.yaml
@@ -0,0 +1,98 @@
+id: wiki-dereko
+type: corpus
+desc: Mapping between Wikipedia and DeReKo textClass categories
+fieldA: wikiCat
+fieldB: textClass
+mappings:
+ # Academic_disciplines (7171 files): wissenschaft.populaerwissenschaft=30.6%, kultur.literatur=24.2%
+ - "Academic_disciplines <> ((wissenschaft & populaerwissenschaft) | (kultur & literatur))"
+ # Communication (2568 files): technik-industrie.edv-elektronik=31.0%, wissenschaft.populaerwissenschaft=25.1%
+ - "Communication <> ((technik-industrie & edv-elektronik) | (wissenschaft & populaerwissenschaft))"
+ # Concepts (2646 files): freizeit-unterhaltung.reisen=23.9%, wissenschaft.populaerwissenschaft=21.7%
+ - "Concepts <> ((freizeit-unterhaltung & reisen) | (wissenschaft & populaerwissenschaft))"
+ # Entities (13372 files): wissenschaft.populaerwissenschaft=30.4%, technik-industrie.edv-elektronik=21.9%
+ - "Entities <> ((wissenschaft & populaerwissenschaft) | (technik-industrie & edv-elektronik))"
+ # Food_drink (4456 files): freizeit-unterhaltung.reisen=37.9%, wissenschaft.populaerwissenschaft=23.2%
+ - "Food_drink <> ((freizeit-unterhaltung & reisen) | (wissenschaft & populaerwissenschaft))"
+ # Health (1952 files): wissenschaft.populaerwissenschaft=30.0%, gesundheit-ernaehrung.gesundheit=28.7%
+ - "Health <> ((wissenschaft & populaerwissenschaft) | (gesundheit-ernaehrung & gesundheit))"
+ # History (59767 files): freizeit-unterhaltung.reisen=22.6%, kultur.literatur=20.6%
+ - "History <> ((freizeit-unterhaltung & reisen) | (kultur & literatur))"
+ # Mathematics (10035 files): wissenschaft.populaerwissenschaft=54.1%, kultur.literatur=24.1%
+ - "Mathematics <> ((wissenschaft & populaerwissenschaft) | (kultur & literatur))"
+ # Philosophy (10961 files): kultur.literatur=51.8%, wissenschaft.populaerwissenschaft=27.3%
+ - "Philosophy <> ((kultur & literatur) | (wissenschaft & populaerwissenschaft))"
+ # Religion (7875 files): staat-gesellschaft.kirche=37.1%, freizeit-unterhaltung.reisen=31.0%
+ - "Religion <> ((staat-gesellschaft & kirche) | (freizeit-unterhaltung & reisen))"
+ # Science (31185 files): wissenschaft.populaerwissenschaft=42.3%, kultur.literatur=21.8%
+ - "Science <> ((wissenschaft & populaerwissenschaft) | (kultur & literatur))"
+ # Sports (49599 files): sport.vermischtes=37.5%, sport.fussball=28.8%
+ - "Sports <> ((sport & vermischtes) | (sport & fussball))"
+ # Time (1023 files): wissenschaft.populaerwissenschaft=29.8%, kultur.film=27.2%
+ - "Time <> ((wissenschaft & populaerwissenschaft) | (kultur & film))"
+ # Culture (21448 files): freizeit-unterhaltung.reisen=37.1%
+ - "Culture <> (freizeit-unterhaltung & reisen)"
+ # Economy (13283 files): wissenschaft.populaerwissenschaft=20.0%
+ - "Economy <> (wissenschaft & populaerwissenschaft)"
+ # Education (7560 files): staat-gesellschaft.bildung=37.1%
+ - "Education <> (staat-gesellschaft & bildung)"
+ # Energy (1642 files): wissenschaft.populaerwissenschaft=41.8%
+ - "Energy <> (wissenschaft & populaerwissenschaft)"
+ # Engineering (10318 files): wissenschaft.populaerwissenschaft=33.6%
+ - "Engineering <> (wissenschaft & populaerwissenschaft)"
+ # Entertainment (1033 files): kultur.musik=34.2%
+ - "Entertainment <> (kultur & musik)"
+ # Geography (18082 files): freizeit-unterhaltung.reisen=68.4%
+ - "Geography <> (freizeit-unterhaltung & reisen)"
+ # Government (6594 files): politik.ausland=45.8%
+ - "Government <> (politik & ausland)"
+ # Human_behavior (10855 files): politik.ausland=35.7%
+ - "Human_behavior <> (politik & ausland)"
+ # Humanities (6897 files): kultur.literatur=31.8%
+ - "Humanities <> (kultur & literatur)"
+ # Information (1480 files): technik-industrie.edv-elektronik=55.0%
+ - "Information <> (technik-industrie & edv-elektronik)"
+ # Internet (1694 files): technik-industrie.edv-elektronik=67.7%
+ - "Internet <> (technik-industrie & edv-elektronik)"
+ # Knowledge (4832 files): wissenschaft.populaerwissenschaft=59.5%
+ - "Knowledge <> (wissenschaft & populaerwissenschaft)"
+ # Language (60359 files): kultur.literatur=64.5%
+ - "Language <> (kultur & literatur)"
+ # Law (26387 files): politik.ausland=42.5%
+ - "Law <> (politik & ausland)"
+ # Life (3117 files): politik.ausland=21.5%
+ - "Life <> (politik & ausland)"
+ # Lists (22019 files): freizeit-unterhaltung.reisen=21.0%
+ - "Lists <> (freizeit-unterhaltung & reisen)"
+ # Mass_media (21707 files): kultur.film=32.1%
+ - "Mass_media <> (kultur & film)"
+ # Military (27580 files): politik.ausland=32.0%
+ - "Military <> (politik & ausland)"
+ # Nature (5573 files): freizeit-unterhaltung.reisen=42.6%
+ - "Nature <> (freizeit-unterhaltung & reisen)"
+ # Politics (9887 files): politik.ausland=48.7%
+ - "Politics <> (politik & ausland)"
+ # Society (12187 files): wissenschaft.populaerwissenschaft=49.4%
+ - "Society <> (wissenschaft & populaerwissenschaft)"
+ # Technology (11385 files): wissenschaft.populaerwissenschaft=44.0%
+ - "Technology <> (wissenschaft & populaerwissenschaft)"
+ # Universe (1967 files): wissenschaft.populaerwissenschaft=41.1%
+ - "Universe <> (wissenschaft & populaerwissenschaft)"
+ # freizeit-unterhaltung.reisen → History, Geography, Culture (AND)
+ - "(History | Geography | Culture) <> (freizeit-unterhaltung & reisen)"
+ # technik-industrie.edv-elektronik → Entities, Internet (AND)
+ - "(Entities | Internet) <> (technik-industrie & edv-elektronik)"
+ # kultur.literatur → Language, History (AND)
+ - "(Language | History) <> (kultur & literatur)"
+ # politik.ausland → Law, Military (AND)
+ - "(Law | Military) <> (politik & ausland)"
+ # Health (1952 files): gesundheit-ernaehrung.gesundheit=28.7%
+ - "Health <> (gesundheit-ernaehrung & gesundheit)"
+ # Religion (7875 files): staat-gesellschaft.kirche=37.1%
+ - "Religion <> (staat-gesellschaft & kirche)"
+ # Science (31185 files): wissenschaft.populaerwissenschaft=42.3%
+ - "Science <> (wissenschaft & populaerwissenschaft)"
+ # Sports (49599 files): sport.fussball=28.8%
+ - "Sports <> (sport & fussball)"
+ # Sports (49599 files): sport.vermischtes=37.5%
+ - "Sports <> (sport & vermischtes)"