Initial setup with corpora and conversion script

Change-Id: Ia0248f569de6db406d64712f962ecda67528263f
diff --git a/ICC-GA-XML/ICC-GA-WLH-003.txt b/ICC-GA-XML/ICC-GA-WLH-003.txt
new file mode 100644
index 0000000..12b4ff3
--- /dev/null
+++ b/ICC-GA-XML/ICC-GA-WLH-003.txt
@@ -0,0 +1,68 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<TEI xmlns="http://www.tei-c.org/ns/1.0">
+    <teiHeader>
+        <fileDesc n="ICC-GA-WLH-003">
+            <titleStmt>
+                <title>'Is libhse an chathair' — Pop Up Gaeltacht agus nuachainteoirí na Gaeilge [Extract]</title>
+                <respStmt>
+                    <resp>compiled for ICC</resp>
+                    <name>ICC: EUD</name>
+                </respStmt>
+            </titleStmt>
+            <publicationStmt>
+                <distributor><note>NOT FOR DISTRIBUTION</note>
+                    <note>Comhar Taighde</note></distributor>
+                <idno>http://dx.doi.org/10.18669/ct.2018.05</idno>
+            </publicationStmt>
+            <sourceDesc>
+                <bibl type="Learned:Humanities">
+                    <author>Seoighe, Stiofán</author>
+                    <title>‘Is libhse an chathair’ — Pop Up Gaeltacht agus nuachainteoirí na Gaeilge</title>
+                    <pubPlace>PLACE</pubPlace>
+                    <publisher>NAME</publisher>
+                    <date when="2018">2018</date>
+                    <availability>
+                      <licence>CC-BY-NC</licence>
+                    </availability>
+                </bibl>
+            </sourceDesc>
+        </fileDesc>
+        <encodingDesc>
+            <samplingDecl>
+               <p>Extract: pages 3-6</p>
+            </samplingDecl>
+        </encodingDesc>
+        <profileDesc>
+            <textClass>
+               <classCode scheme="ICC">Learned_Humanities</classCode>
+            </textClass>
+        </profileDesc>
+        <revisionDesc>
+            <change when="2023-06-16" who="EUD">Plain text formatting</change>
+        </revisionDesc>
+    </teiHeader>
+    <text xml:lang="ga">
+        <body>
+            <div>
+<p>EAGRÁN 4, Samhain 2018 'Is libhse an chathair' — Pop Up Gaeltacht agus nuachainteoirí na Gaeilge</p>
+<p>Réamhrá</p>
+<p>Le roinnt blianta anuas tá borradh tagtha faoin taighde ar nuachainteoirí mionteangacha sa tsochtheangeolaíocht chriticiúil agus scoláirí ag iarraidh dúshlán a thabhairt do thuiscintí agus d'idé-eolaíochtaí stairiúla a shamhlaigh teangacha, agus cainteoirí na dteangacha sin, mar nithe aonchineálacha, doathraithe agus teoranta (Bucholtz 2003; Doerr 2009; O'Rourke et al. 2015; Ó Murchadha et al. 2018). Leagtar béim sa taighde sin ar chleachtas teanga nuachainteoirí agus ar an iarracht ghníomhach a dhéanann siad chun deiseanna úsáide a bhaint amach i spásanna sóisialta nua, spásanna a fheidhmíonn mar phobail chleachtais dóibh ar uairibh (Walsh agus Lane 2014). Tógtar ar an taighde comhaimseartha sin san alt seo trí lionsa anailíse an nuachainteora, mar a mhínítear thíos é, a chur i bhfeidhm ar spás sóisialta nua d'úsáid na Gaeilge i gcomhthéacs uirbeach na hÉireann, Pop Up Gaeltacht (PUG as seo amach). Tá dhá phríomhaidhm leis an alt seo. Ar an gcéad dul síos is mian liom anailís a dhéanamh ar thábhacht agus ar thionchar spásanna nua sóisialta d'úsáid na teanga i gcomhthéacs na Gaeilge trí bhíthin sampla amháin den chineál spáis úd, PUG Bhaile Átha Cliath, a iniúchadh. Léireofar go bhfeidhmíonn PUG mar láthair thábhachtach shochtheangeolaíoch do chainteoirí Gaeilge éagsúla, nuachainteoirí uirbeacha na teanga ina measc, ar mian leo pobal cleachtais a fhorbairt. Taispeánfar chomh maith go bhféadfadh ócáidí PUG muda teangeolaíoch — pointe claochlaithe nuair a athraíonn cleachtas teanga an duine (Puigdevall et al. 2018) — a spreagadh. Ina theannta sin, ba mhaith liom ceisteanna dlisteanachta, féiniúlachta agus barántúlachta, faoi mar a bhaineann siad le nuachainteoirí na Gaeilge, a scagadh agus tionchar féideartha PUG ar na ceisteanna sin a thabhairt chun solais.</p>
+<p>Coincheap simplí a bhí sa PUG ón tús, is é sin go mbaileodh lucht labhartha na Gaeilge i mBaile Átha Cliath le chéile i dtithe tábhairne éagsúla chun deoch a ól agus chun Gaeilge a labhairt lena chéile. Cé go bhfuil PUG tar éis scaipeadh ar fud na tíre agus go hidirnáisiúnta — coincheap foinse oscailte, ón mbun aníos agus gan baint aige le heagraíochtaí teanga is ea é — dírítear san alt seo ar PUG Bhaile Átha Cliath amháin toisc gurb é an PUG is iomadúla, is leanúnaí agus is rathúla ó thaobh líon na ndaoine a fhreastalaíonn air go rialta. Dá thairbhe sin, is iad ócáidí PUG na hardchathrach a tharraingíonn an aird is suntasaí sna meáin chumarsáide, idir Ghaeilge agus Bhéarla.</p>
+<p>Lionsa anailíse an nuachainteora</p>
+<p>Fearacht sochtheangeolaithe eile i gcomhthéacsanna mionteangacha (féach Smith-Christmas et al. 2018, mar shampla), baintear feidhm as coincheap an nuachainteora san alt seo mar lionsa anailíse, seachas mar chatagóir nó lipéad beacht teangeolaíoch, chun ransú a dhéanamh ar phobail urlabhra mhionteangacha, pobal na Gaeilge sa chás seo, atá ag athrú ó bhonn. Míníonn Jaffe an t‑athru seo agus í ag tagairt do chomhthéacs na Corsaicise. Scríobhann sí go bhfuil na pobail sin 'populated by people with different kinds of knowledge, acquired through different means than in the past and embedded in new regimes of value' (2015: 4). Sainmhínítear 'nuachainteoir' mar dhuine a shealbhaíonn agus a bhaineann úsáid rialta, ghníomhach as teanga, ach nach cainteoir dúchais traidisiúnta de chuid na teanga sin í nó é. Is sainmhíniú réasúnta leathan é sin a thugann aitheantas d'ilghnéitheacht agus d'éagsúlacht na gcainteoirí a chuimsítear leis an gcoincheap (O'Rourke et al. 2015: 5). Is ceist thábhachtach í an líofacht, dar ndóigh, agus is minic gur slat tomhais shuibiachtúil í agus cainteoirí éagsúla á rangú. Cé go bhfuil fráma tagartha tábhachtach idirnáisiúnta ar fáil dúinn i gComhchreat Tagartha na hEorpa um Theangacha (Comhairle na hEorpa 2001), is fráma tagartha é sin nach mbaineann le líofacht ná cumarsáid labhartha amháin. Leibhéal C1 an Chreata Eorpaigh a úsáideann Ortega et al. (2015: 89) i dtaca le nuachainteoirí na Bascaise, mar shampla, ach d'fhéadfaí leibhéal B2 a úsáid mar shlat tomhais freisin toisc go mbaineann foghlaimeoirí inniúlacht an úsáideora neamhspleáigh amach ag an bpointe sin. Míníonn Ó Murchadha et al. go n-úsáidtear coincheap an nuachainteora le hanailís a dhéanamh ar réimse leathan cainteoirí, ó dhaoine a bhfuil teorainn shoiléir lena gcumas sa teanga go nuachainteoirí 'saineolacha' a bhfuil ardchumas teanga iontu (2018: 4). Go minic, áirítear tréithe de chanúintí traidisiúnta le hurlabhra na gcainteoirí saineolacha sin ó thaobh na fóineolaíochta, na deilbhíochta is na comhréire de (Piller 2001: 180). Idirdhealaítear an foghlaimeoir ón nuachainteoir, ní hamháin de réir líofachta, ach de réir na hiarrachta gníomhaí a dhéanann sí nó sé an teanga a labhairt i gcomhthéacsanna sóisialta éagsúla lasmuigh den chóras oideachais (féach Sallabank agus Marquis 2018: 71, mar shampla).</p>
+<p>Tugann coincheap an nuachainteora dúshlán d'idéeolaíocht stairiúil an chainteora dúchais (Doerr 2009: 18) agus don rud a dtugann Bucholtz 'cumha na sochtheangeolaíochta' ('nostalgia of sociolinguistics') (2003: 399) air. Samhlaíonn Bucholtz cumha na sochtheangeolaíochta le gort taighde a dhíríonn orthu siúd a bhí ina gcainteoirí 'dlisteanacha' agus 'údarásacha' amháin agus míníonn sí go raibh an cur chuige sin i réim sa teangeolaíocht ar feadh i bhfad. Cruthaíodh ordlathas teangeolaíoch de dheasca na ndearcthaí úd a bhronn dlisteanacht agus údarás ar chainteoirí áirithe a raibh an urlabhra ba bharántúla acu (Ó Murchadha et al. 2018: 6). Tugann coincheap an nuachainteora, mar sin, dúshlán do na tuiscintí stairiúla sin agus féachtar freisin le 'bogadh ar aghaidh ó chuid de na sean-choincheapa agus na seanlipéid' (Walsh et al. 2015: 6) a úsáideadh le cur síos easnamhach nó fulangach a dhéanamh orthu siúd nár chainteoirí dúchais iad, lipéid ar nós 'cainteoir T2,' 'foghlaimeoir,' agus 'cainteoir dátheangach' (ibid.). Ina ionad sin, leagtar béim ar an bhféidearthacht agus ar ghníomhúchán an duine. Ní ar mhaithe le beag is fiú a dhéanamh de chainteoirí dúchais, ámh, a fhorbraítear na tuiscintí nua sin, mar a shoiléiríonn Walsh agus Lane agus iad ag míniú dhoiléireacht agus dhúshláin na lipéad teangeolaíoch:</p>
+<gap/>
+<p>Tá athrú as cuimse tagtha ar thimpeallacht shochtheangeolaíoch na Gaeilge agus borradh tagtha ar líon na nuachainteoirí sa chomhthéacs sin. In Éirinn an lae inniu tá 72% (53,217 duine) de chainteoirí laethúla na Gaeilge (lasmuigh den chóras oideachais) ina gcónaí lasmuigh de Ghaeltachtaí oifigiúla traidisiúnta (An Phríomh-Oifig Staidrimh 2017: 7). Tuairiscítear go bhfuil tuairim is 200,000 nuachainteoir in Éirinn, má chuirtear cainteoirí laethúla is seachtainiúla, thuaidh agus theas san áireamh (Walsh et al. 2015: 10). Molann údair na tuarascála céanna go mba cheart forbairt a dhéanamh ar 'spásanna sábháilte' d'úsáid shóisialta na teanga i mbailte móra agus i gcathracha na tíre go háirithe (ibid.: 61). Is mian liom a léiriú san alt seo gurb amhlaidh a fheidhmíonn PUG mar spás sábháilte do nuachainteoirí áirithe.</p>
+<p>Saintréith amháin de chuid nuachainteoirí mionteangacha is ea go mbíonn sé de nós acu dul sa tóir ar phobail chleachtais nua chun deiseanna d'úsáid shóisialta na teanga a chruthú (Walsh agus Lane 2014: 3). Mar a leagadh amach thuas is sainchomhartha riachtanach é an gníomhúchán sin chun idirdhealú a dhéanamh idir nuachainteoirí agus foghlaimeoirí teanga. Míníonn Ortega et al. go mbraitheann nuachainteoirí na Bascaise, teanga mhionlaithe eile, níos dlisteanaí mar chainteoirí nuair a éiríonn leo úsáid rialta a bhaint aisti i bpobail chleachtais nua (2015: 97). Is féidir leis na pobail chleachtais ina bhfuil nuachainteoirí gníomhach tionchar a imirt ar a bhféiniúlacht mar chainteoirí Gaeilge chomh maith (Walsh agus O'Rourke 2015: 66). Má ghlacaimid le tuiscint Ortega et al. ar an bhféiniúlacht theangeolaíoch mar 'a socially constructed notion that is negotiated and signalled through social interaction, rather than a given' (2015: 93), is léir go mbaineann tairbhe leis an bpobal cleachtais mar fhráma anailíse chun na bealaí ina ndéanann cainteoirí éagsúla gnéithe difriúla dá bhféiniúlacht a léiriú (Swann et al. 2008: 44).</p>
+<p>Idé-eolaíochtaí teanga</p>
+<p>Is léir, mar sin, go mbaineann ábhar an ailt seo go dlúth le ceisteanna féiniúlachta agus idé-eolaíochta. Dar le Kroskrity gur creidimh nó mothúcháin faoi theangacha mar a úsáidtear iad ina dtimpeallachtaí sóisialta is ea hidé-eolaíochtaí teanga (2004: 498) agus chuige sin, chun scrúdú a dhéanamh ar idéeolaíochtaí teanga nuachainteoirí na Gaeilge, caithfear na hidé-eolaíochtaí teanga a chothaítear ina dtimpeallachtaí sóisialta agus ina bpobail chleachtais a iniúchadh chomh maith céanna. Scríobhann Woolard faoi thairbhe lionsa na hidé-eolaíochta teanga mar pharaidím anailíse chun taighde ar leibhéal na micrea-shochtheangeolaíochta (.i. insintí na rannpháirtithe sna hagallaimh bheathaisnéiseacha) a leabú i dtuiscintí níos leithne ar an maicrea-leibhéal (.i. timpeallachtaí sóisialta na rannpháirtithe): 'it allows us to relate the microculture of communicative action to political economic considerations and social inequality, to confront macrosocial constraints on language behaviour, and to connect discourse with lived experiences' (1998: 37). Is díol spéise, mar sin, ról spásanna sóisialta fearacht PUG agus a dtionchar ar idé-eolaíochtaí teanga nuachainteoirí a mheas. Leagtar amach modheolaíocht an taighde thíos, ach le linn na n‑agallamh tháinig PUG chun cinn go minic agus na rannpháirtithe ag labhairt faoina gcleachtas teanga agus faoi na spásanna sóisialta ina n‑úsáideann siad an Ghaeilge. Cuireadh in iúl go mbaineann tábhacht le PUG mar shuíomh sochtheangeolaíoch a éascaíonn úsáid shóisialta na Gaeilge do nuachainteoirí líofa agus féideartha araon i gcomhthéacs chathair Bhaile Átha Cliath. Dá thairbhe sin, socraíodh anailís níos grinne a dhéanamh ar PUG chun na 'frith-idé-eolaíochtaí teanga' (Armstrong 2012: 161) a chothaíonn sé a aithint agus a spíonadh agus chun dearcthaí nuachainteoirí na Gaeilge ina leith a scagadh. Míníonn Urla go dtugann dioscúrsaí agus cleachtais ghluaiseacht na Bascaise, ina bhfuil nuachainteoirí lárnach (Ortega et al. 2015: 85), dúshlán d'idé-eolaíochtaí teanga ceannasacha, idé-eolaíocht aonteangach na Caistílise (cf. Woolard 2016: 40) sa chomhthéacs sin, agus do na tróip choitianta a úsáidtear chun tréithe diúltacha a chur i leith chainteoirí na teanga sin: 'that Basque is archaic, belongs to a fading rural life, is unsystematic or too difficult to learn. The advocates in minority language movements question taken-for-granted ideas and in doing so make them objects of ideological debate' (2012: 12). Tagrófar thíos do dhíospóireachtaí idé-eolaíocha chomhthéacs na Gaeilge chun tionchar PUG orthu a léiriú.</p>
+<p>Féiniúlacht an nuachainteora - dlisteanacht agus barántúlacht</p>
+<p>Tá ceisteanna dlisteanachta agus barántúlachta fite fuaite leis an bplé a dhéantar ar fhéiniúlachtaí nuachainteoirí. Próiseas leanúnach is ea próiseas an dlisteanaithe faoi mar a bhaineann sé le nuachainteoirí mionteangacha (Ortega et al. 2016: 183). Nochtadh tuairimí na rannpháirtithe i leith a ndlisteanachta mar chainteoirí Gaeilge le linn na n‑agallamh agus tabharfar cúpla sampla den dioscúrsa sin thíos roimh dom ról féideartha PUG i bpróiseas dlisteanaithe an nuachainteora a léiriú. Is é an t‑údarás a mhothaíonn nuachainteoirí, nó a bhronntar orthu, mar chainteoirí Gaeilge atá i gceist agam le 'dlisteanacht,' mar a mhíníonn Costa: 'Legitimate language is not a given. It is constantly negotiated among users, and what constitutes legitimate language may vary according to the setting in which it is used' (2015: 129). Aithníonn sochtheangeolaithe go mbíonn nuachainteoirí éiginnte faoina stádas mar chainteoirí dlisteanacha ar uairibh toisc go n‑airionn siad go mbaineann easpa barántúlachta lena n‑urlabhra (Ó Murchadha et al. 2018: 5–6). Déanann McLeod agus O'Rourke (2015: 157) cur síos ar cheisteanna barántúlachta agus úinéireachta i gcomhthéacs Ghaeilge na hAlban agus is ann don aighneas céanna sa Ghailís freisin (O'Rourke agus Ramallo 2013: 293). Tugtar dioscúrsaí comhchosúla faoi deara i gcomhthéacs na Bascaise chomh maith. Míníonn Ortega et al. go ndéanann nuachainteoirí na Bascaise tréaniarracht chun deiseanna úsáide agus pobail chleachtais a chruthú agus go gcothaíonn rannpháirtíocht sna spásanna sin deiseanna chun a bhféiniúlacht mar chainteoirí Bascaise a dhlisteanú (2015: 96). Léiríonn a dtaighde siúd 'the importance that habitual usage of Basque can have for identification with the Basque-speaking community' (2015: 97). Míníonn Woolard an cheist sin i dtéarmaí na hidé-eolaíochta, idé-eolaíocht na barántúlachta, agus tionchar na hidé-eolaíochta sin ar chainteoirí:</p>
+<gap/>
+<p>Áirítear fréamhacha na hidé-eolaíochta sin i ndioscúrsaí an rómánsachais agus an eitneanáisiúnachais lenar samhlaíodh an bharántúlacht leo siúd a raibh nascanna bitheolaíocha, tíreolaíocha agus stairiúla acu leis an bpobal urlabhra agus a labhair leagan traidisiúnta den teanga ar samhlaíodh údarás stairiúil leis (O'Rourke et al. 2015: 7).</p>
+<p>Modheolaíocht</p>
+<p>Tá ábhar an ailt seo bunaithe ar shonraí a bailíodh ó nuachainteoirí óga Gaeilge idir 18–31 bliain d'aois trí mheán agallaimh leathstruchtúrtha bheathaisnéiseacha. Áirítear na rannpháirtithe taighde anseo mar nuachainteoirí toisc go mbaineann siad úsáid rialta, ghníomhach as an nGaeilge go sóisialta lasmuigh den chóras oideachais (an áit ar shealbhaigh siad an teanga). Aimsíodh rannpháirtithe a ghlacann páirt i spásanna nó grúpaí uirbeacha éagsúla d'úsáid shóisialta na Gaeilge, PUG ina measc. Cé go mbaineann na nuachainteoirí seo úsáid rialta as an teanga i gcomhthéacsanna sóisialta agus gairmiúla éagsúla, san alt seo dírítear ar PUG amháin de bharr na béime a leag na rannpháirtithe féin ar thábhacht na hócáide sin mar dheis úsáide.</p>
+            </div>
+        </body>
+    </text>
+</TEI>