Initial setup with corpora and conversion script

Change-Id: Ia0248f569de6db406d64712f962ecda67528263f
diff --git a/ICC-GA-XML/ICC-GA-WLH-009.txt b/ICC-GA-XML/ICC-GA-WLH-009.txt
new file mode 100644
index 0000000..b4bbd33
--- /dev/null
+++ b/ICC-GA-XML/ICC-GA-WLH-009.txt
@@ -0,0 +1,68 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<TEI xmlns="http://www.tei-c.org/ns/1.0">
+    <teiHeader>
+        <fileDesc n="ICC-GA-WLH-009">
+            <titleStmt>
+                <title>Léirmheas ar "Legal Lexicography: A Comparative Perspective" [Extract]</title>
+                <respStmt>
+                    <resp>compiled for ICC</resp>
+                    <name>ICC: EUD</name>
+                </respStmt>
+            </titleStmt>
+            <publicationStmt>
+                <distributor><note>NOT FOR DISTRIBUTION</note>
+                    <note>Comhar Taighde</note></distributor>
+                <idno>https://doi.org/10.18669/ct.2017.09</idno>
+            </publicationStmt>
+            <sourceDesc>
+                <bibl type="Learned:Humanities">
+                    <author>Ní Ghallchobhair, Fidelma</author>
+                    <title>Léirmheas ar "Legal Lexicography: A Comparative Perspective"
+					</title>
+                    <pubPlace>PLACE</pubPlace>
+                    <publisher>NAME</publisher>
+                    <date when="2017">2017</date>
+                    <availability>
+                      <licence>CC-BY-NC</licence>
+                    </availability>
+                </bibl>
+            </sourceDesc>
+        </fileDesc>
+        <encodingDesc>
+            <samplingDecl>
+               <p>Extract: pages 2-5</p>
+            </samplingDecl>
+        </encodingDesc>
+        <profileDesc>
+            <textClass>
+               <classCode scheme="ICC">Learned_Humanities</classCode>
+            </textClass>
+        </profileDesc>
+        <revisionDesc>
+            <change when="2023-06-16" who="EUD">Plain text formatting</change>
+        </revisionDesc>
+    </teiHeader>
+    <text xml:lang="ga">
+        <body>
+            <div>
+<p>EAGRÁN 3, Deireadh Fómhair 2017 Léirmheas ar "Legal Lexicography: A Comparative Perspective" </p>
+<p>Sa chúig aiste dhéag sa leabhar léannta seo pléitear gnéithe de théarmaíocht an dlí, idir dhiacronach agus sioncronach, i ndeich gcinn de dhlínsí éagsúla, a bhformhór acu sin san Eoraip, cuid eile i Meiriceá Thuaidh agus ceann amháin sa Nua-Shéalainn. I measc na n-údar tá ollúna, léachtóirí agus taighdeoirí i réimsí an dlí, teangacha, na teaneolaíochta, na dlítheangeolaíochta, an aistriúcháin dhlíthiúil, mar aon le foclóirithe agus údair i réimse an dlí, na foclóireachta agus na téarmeolaíochta dlí. Orthu sin tá Gael amháin: Maolmhaodhóg Ó Ruairc, fear a chaith na blianta mar aistritheoir Gaeilge sa Chomhairle Eorpach sa Bhruiséil agus a bhfuil mórán saothar foilsithe aige faoi chúrsaí aistriúcháin agus chúrsaí gramadaí i measc téamaí eile. Sula ndíreofar ar aiste Mhaolmhaodhóg Uí Ruairc, áfach, ní miste spléachadh a thabhairt ar théamaí na n-aistí eile. Meabhraítear dúinn sa Bhrollach gur minic a thosaíonn an staidéar ar an dlí le foclóir, go mbíonn dlíodóirí, dlí-eolaithe, aistritheoirí agus breithiúna ar fad ag brath ar fhoclóirí, agus gurb é an seánra is sine den litríocht dhlíthiúil ná foclóirí de théarmaí dlí (xix).</p>
+<p>Sa Réamhrá, léirítear an dlúthcheangal idir focail - uirlisí an dlíodóra - agus an dlí:</p>
+<gap/>
+<p>Is féidir na haistí a ghrúpáil de réir téama: baineann caibidlí 1–2 le stair téarmaí dlí in dhá theanga éagsúla; baineann caibidlí 3, 4, 6, 8, 9 agus 10 le tuairiscí ar thionscadail éagsúla sa téarmfhoclóireacht dlí; baineann caibidlí 5 agus 7 le meastóireacht chriticiúil ar fhoclóirí dlí; baineann caibidlí 11–13 le hanailísí ar ghné amháin de théarmaíocht an dlí i ndlínsí faoi leith; agus baineann caibidlí 14–15, ar deireadh, le gnéithe de théarmaí dlí in dhá mhionteanga. Ba sa Laidin a tiomsaíodh na chéad fhoclóirí dlí in iarthar na hEorpa, gné a d'imir tionchar ar théarmaíocht an dlí sna teangacha náisiúnta ina dhiaidh sin. Tagraíonn an t-eagarthóir don chaoi a mbíonn an foclóirí idir dhá thine Bhealtaine óir, bíodh is gur eolaíochtúil scolártha a cheird, is táirge praiticiúil a theastaíonn ó úsáideoirí foclóirí (1). Sa chéad aiste, a scríobh Pierre-Nicolas Barenot, tugtar spléachadh ar stair fhoclóireacht an dlí shibhialta sa Fhrainc, tógtha ar obair na Rómhánach, ón dara haois déag go dtí an naoú haois déag. Pléann an t-údar forbairt foclóirí aonteangacha dlí sa Fhrainc agus deireadh sheánra na Répertoires a d'fhéach le hiomlán an dlí a chuimsiú in aon saothar amháin (27). Téarmaí dlí sa Luath-Bhéarla Moch is ábhar don dara haiste le Ian Lancashire agus Janet Damianopoulos. Tuairiscítear cé mar a pléadh leis an athrú ó Fhraincis go Béarla mar theanga an dlí choitinn sa Bhreatain sa chéad fhoclóir aonteangach Béarla i 1523 ó pheann an dlíodóra agus an drámadóra John Rastall a d'aistrigh na téarmaí go Béarla, foclóir a ndearnadh 27 eagrán de idir sin agus 1685 agus a spreag tiomsú foclóirí aonteangacha cruafhocal ó fhoclóirithe eile (30–31). Luaitear cé mar a thug foclóirithe dlí éagsúla téarmaíocht an dlí shibhialta agus an dlí choitinn le chéile le linn an tseachtú haois déag. Ba é John Cowell a d'fhorbair agus a mhínigh téarmaíocht an dlí shibhialta, a mhúintí trí Laidin amháin ag an am, ina shaothar The Interpreter (1607) ina ndearnadh plé ar an dlí coiteann chomh maith. Gné ar leith de shaothar Cowell ab ea na tagairtí do leabhair agus lámhscríbhinní sna hiontrálacha, gné a bhláthaigh i saothair fhoclóireachta ina dhiaidh sin, m.sh. saothar mór Samuel Johnson agus an OED féin (39).</p>
+<p>Foclóirí agus ollamh le dlí in Texas is ea údar an tríú haiste, Bryan A. Garner, agus scríobhann seisean faoi phróiseas na foclóireachta dlí. Cíorann sé buncheisteanna ar nós an fearr cloí le sainmhínithe gonta nó le hiontrálacha ciclipéideacha; an fearr féachaint le bunsaothar a scríobh nó bailiúchán de shainmhínithe breithiúnacha a thiomsú; an gá deachleachtais foclóireachta a leanúint chomh fada is atá cúram ceart déanta den dlí; ar chóir d'fhoclóirithe an lae inniu brath ar chruinneas na bhfoclóirithe a chuaigh rompu; agus cén chaoi a bhfaightear an t-ábhar le cur san fhoclóir (45).</p>
+<p>Abhcóide parlaiminte agus foclóirí dlí sa Ríocht Aontaithe is ea údar an cheathrú haiste, Daniel Greenberg. Tugann seisean aghaidh ar na dúshláin a bhaineann le foclóir dlí a thiomsú agus tosaíonn le ceist an-bhunúsach a chuirtear go mion is go minic: cad is téarma dlí ann — téarma a bhaineann le cúrsaí dlí nó téarma a luaitear sa dlí? Tá, dá réir sin, dhá chineál foclóirí dlí ann — cineál ina sainmhínítear téarmaí atá dlíthiúil, agus cineál eile ina sainmhínítear téarmaí nó frásaí nach gá go mbeadh aon bhaint acu leis an dlí ach a sainmhíníodh le linn cásanna áirithe nó i reachtanna ar leith, m.sh. gairdín. Nuair atá foclóir dlí á bheartú, mar sin, is gá cinneadh a dhéanamh ón tús cén cineál foclóra atá le tiomsú. Agus fós, tá roinnt mhaith téarmaí ann a mbeifí ag súil leo sa dá chineál foclóra, m.sh. éigniú, agus míníonn an t-údar go ngabhann dúshlán leis an méid eolais is fearr a thabhairt faoi cheanntéarma mar sin sa dá chineál foclóra (59–60).</p>
+<p>Foclóirí dlí dátheangacha is ábhar don chúigiú haiste leis an Dr Coen J. P. van Laer as an Ísiltír. I gcás ábhair faoi thionchar cultúrtha mar a bhíonn i gceist i réimse an dlí, bíonn eolas ciclipéideach riachtanach don aistritheoir chun na téarmaí cearta a roghnú sa sprioctheanga (75). Moltar go léireodh foclóirí dlí dátheangacha méid na coibhéise idir an buntéarma agus an téarma atá á mholadh sa sprioctheanga, agus maítear go dteastaíonn dhá shainmhíniú reachtacha ar mhaithe le comparáid agus le méid na coibhéise a dheimhniú. Léirítear é seo le samplaí de théarmaí agus sainmhínithe reachtacha ón Ísiltíris agus ón nGearmáinis (76–77). Déantar iniúchadh comparáideach ar na téarmaí 'náisiúntacht' agus 'saoránacht' agus ar na sainmhínithe a ghabhann leo i gcúig cinn d'fhoclóirí dátheangacha agus léirítear nár tugadh dóthain eolais iontu le léiriú don aistritheoir cé acu téarma le roghnú (79–85). Sa séú haiste, scríobhann Pierre Lerat, foclóirí sa Fhrainc agus saineolaí i réimse na dteangacha sainfheidhme, faoi chur chuige maidir le bunachar ilteangach de théarmaíocht an dlí a thiomsú do shaoránaigh an AE, ar an mbonn go bhfuil go leor i bpáirt idir bhunchoincheapa chórais dlí na Fraince, na Gearmáine, na hIodáile agus, go fiú, na Ríochta Aontaithe:</p>
+<gap/>
+<p>Leagann Lerat béim ar dhá chritéir ar leith chun téarmaí a roghnú do thionscadal dá leithéid: dáileadh agus comhchuimsiú ('subsomption'). Scrúdaíonn sé dhá shampla as foclóir dlí dátheangach barántúil, áit a léiríonn sé lúba ar lár ó thaobh loighce de agus ó thaobh na ngaol idir na coincheapa (91–92). Molann sé sainmhínithe den íosmhéid sonraí chun idirdhealú idir an leibhéal áitiúil (séimiseolaíoch) agus an leibhéal domhanda (onamaiseolaíoch) mar chur chuige praiticiúil le freastal ar shaoránaigh an AE (96). Ansin molann sé cloí le gnáthchritéir na téarmeolaíochta: tosú leis an gcoincheap seachas le foca(i)l an téarma iasachta; sainmhíniú soiléir gonta a sholáthar; gan ach buneolas gramadaí a thabhairt; na comhlogaíochtaí is coitianta a thabhairt; samplaí úsáide ábhartha a thabhairt; foinsí a lua agus dáta ceadaithe i gcás ábhair ón ngréasán domhanda; agus ordlathas na gcoincheap a léiriú trí na gaolta éagsúla eatarthu a lua — cineálach, rannaíoch, seicheamhach, feidhmeach (98–99). Ba é a scríobh an seachtú haiste Thierry Grass ó Ollscoil Strasbourg, saineolaí ar an aistriúchán dlíthiúil sa phéire teangacha Gearmáinis is Fraincis. Tráchtann seisean ar phrionsabail chun bunachar a dhearadh do théarmaíocht lárnach an dlí shibhialta sa Fhraincis agus sa Ghearmáinis mar áis d'aistritheoirí an phéire teangacha sin. Molann sé múnla bunaithe ar chaighdeáin ábhartha ISO do struchtúr bunachar sonraí chun téarmaí dhlí sibhialta na Fraince a aistriú go Gearmáinis.</p>
+<p>Ní as féin a fhaightear an téarma dlí ach i gcomhthéacs coinbhinsiúin, rialacháin nó cinneadh dlí. Dá réir sin, léiríonn léacsacan an dlí ilghnéitheacht coincheap agus iad faoi lánseol. Dar leis an údar, is den riachtanas é in obair aistriúcháin leibhéal trasteangach a chur isteach idir an leibhéal léacsach agus leibhéal na gcoincheap a bhain go traidisiúnta le haon chóras amháin (105). Deir sé gur gá do mhacrastruchtúr agus go háirithe do mhicreastruchtúr foclóra rialacha réamhshainithe a chomhlíonadh go dílis. Molann sé dá réir sin go gcuimseofaí sa mhionsaothrú ar théarma, ar an gcuid is lú de, na catagóirí sonraí seo thíos de réir chaighdeán ISO 12620: - ceanntéarma; - gramadach (an roinn chainte, inscne agus uimhir d'ainmfhocal, aistreacht do bhriathar, etc); - comhthéacs (ar a laghad sampla fianaithe amháin); - foinse an tsampla comhthéacs; - nóta úsáide (107).</p>
+<p>Agus molann sé na trí réimse seo a chur leis an iontráil, agus foréimse gramadaí a chur le gach ceann díobh:</p>
+<p>- comhchiallach (ar an gcoincheap céanna); - hipearainm (ar an bhforchoincheap); - comh-hiopainm (ar fhochoincheap comhordanáideach) (107–8).</p>
+<p>Meabhraítear don léitheoir gur sna comhlogaíochtaí a léirítear saintréithe teanga ar bith, agus gur chóir go léireodh tiontú na gcomhlogaíochtaí sainiúlacht agus titim cainte na sprioctheanga (seachas na teanga foinsí). Dá réir sin, áitítear go bhfuil réimse comhlogaíochtaí riachtanach don aistritheoir mar go soiléirítear ansin feidhmiú téarma na teanga foinsí agus na sprioctheanga agus é neadaithe ina thitim cainte nádúrtha. Agus moltar réimse breise ina ndéanfaí nótaí tráchta comparáideacha faoi na comhlogaíochtaí agus iad in úsáid sa dá theanga. Mar sin, is gá dhá mhór-réimse a bheith i mbunachar téarmaíochta dírithe ar chúrsaí aistriúcháin: ceann mínitheach do shainmhíniú an téarma, agus ceann léiritheach chun úsáid na dteangacha a léiriú (109). San ochtú haiste le Marta Chroma, saineolaí ar an mBéarla dlíthiúil, ar theangeolaíocht dhlíthiúil agus ar aistriúchán dlíthiúil sa phéire teangacha Seicis is Béarla, dírítear ar léirmhíniú teangeolaíoch agus dlíthiúil coincheap agus téacsanna dlí chun críche an aistriúcháin, chomh maith le ceisteanna coibhéise agus anailís coincheap i gcomhair na foclóireachta. Áitíonn Chroma go mbíonn an dlí nua-aimseartha neadaithe sna heolaíochtaí sóisialta, go mbíonn sé ag brath ar thimpeallacht pholaitiúil, agus é féin agus an teanga trína gcuirtear in iúl é múnlaithe ag stair, traidisiúin agus cultúr na sochaí lena mbaineann, agus ag an gcultúr dlíthiúil a forbraíodh taobh istigh den chultúr sin. Ní hionann agus Lerat thuas, maíonn Chroma: Although the issue of globalization of legal language has been whispered [cf. Tiersma (2012: 25)], the everyday practice of legal translators proves that they have to cope with many cross-cultural clashes even between legal systems from the same family (for example Austrian or German Law on the one hand and Czech Law on the other) — and all the more so, if philosophically different or remote legal systems are at issue (for example Common Law v. Civil Law v. sharia) (118).</p>
+<p>Tugann Chroma aghaidh ar na riachtanais a bhaineann le foclóirí dlí aonteangacha agus dátheangacha a thiomsú. Luann sí na buncheisteanna a chuir Bryan Garner thuas faoi fhoclóir dlí aonteangach a thiomsú agus pléann dhá cheann acu ó thaobh foclóir dátheangach a thiomsú (1. cén chaoi a bhfaightear an t-ábhar le cur san fhoclóir; agus 2. ar chóir d'fhoclóirithe an lae inniu brath ar chruinneas na bhfoclóirithe a chuaigh rompu). Ansin cuireann sí ceist eile dá cuid féin: cé chomh mór is ba chóir don fhoclóirí díriú ar théarmaí dlí seachas ar na coda móra eile den teanga dhlíthiúil (125–126)? Caitear an chuid eile den aiste seo ag cíoradh na dtrí cheist sin (126–136).</p>
+<p>Sa naoú haiste, fiafraíonn Peter Sandrini ó Ollscoil Innsbruck an féidir téarmaíocht ó chórais dlí éagsúla a chur i láthair go héifeachtach i bhfoclóir aibítreach páipéir. Tosaíonn sé le trí bhunphrionsabal na téarmeolaíochta (1. an coincheap a bheith lárnach; 2. coincheapa a bheith idirghaolmhar; 3. aonghuthacht coincheapa agus téarma) agus pléitear iad i gcomhthéacs téarmaí dlí agus córais éagsúla dlí, agus déanann na torthaí maidir le tiomsú acmhainní téarmaíochta a mheas (141).</p>
+<p>Maidir le lárnacht an choincheapa, áitíonn sé gur chóir breathnú ar choincheapa ó pheirspictíocht a réimse (nó a bhforéimse) féin. Is féidir na gaolta idir coincheapa réimse ar leith a léiriú le cabhair mapaí coincheap, nó trí naisc a chur in acmhainní téarmaíochta. Bíonn difríochtaí móra idir coincheapa i gcórais dlí éagsúla mar go mbíonn gach coincheap acu leabaithe i gcóras coincheap eile. Mar sin, is é an paraiméadar is tábhachtaí i gcás téarmaí dlí ná a mbaint le córas dlí ar leith — rialaíonn sin an próiseas maidir le coibhéis a aithint idir coincheapa, mar is féidir coincheapa ó chórais dlí éagsúla a chur i gcomparáid beag beann ar theangacha a dtéarmaí (143).</p>
+            </div>
+        </body>
+    </text>
+</TEI>