Mar gheall ar rabharta iarrachtaí atá déanta in Éirinn agus thar lear leis an Ghaeilge a neartú, ar dhiaspóra beo bríomhar, ar líon mór daoine atá ag foghlaim na Gaeilge, agus ar stádas na nGaeilgeoirí mar luathghlacadóirí teicneolaíochta, is iomaí acmhainn leictreonach atá ar fáil go héasca do chainteoirí agus d’fhoghlaimeoirí na teanga: foclóirí, corpais, agus uirlisí foghlama eile san áireamh. Mar sin féin, tá srianta fós ann i dtaca leis na feidhmchláir atá ábalta cuardach a dhéanamh ar mhíreanna na Gaeilge (réimíreanna, iarmhíreanna, agus táthmhíreanna). Ina theannta sin, níl feidhmchláir ann a chuireann rím san áireamh, agus cé go bhfuil foclóir ríme ann, níl aon fhoclóir ríme láidir ann a chuireann éagsúlachtaí canúna san áireamh ach an oiread.
Cás-staidéar agus machnamh pearsanta is ea an páipéar seo, a phléifidh tionscadal idirdhisciplíneach atá fós ag dul ar aghaidh idir taighdeoir Gaeilge agus eolaí sonraí, agus an feidhmchlár a chruthaigh siad le dul i ngleic leis na fadhbanna a luaitear thuas: Míreadóir (mireadoir.ie), uirlis chuardaigh d’fhotheaghráin sa Ghaeilge. Déanfaidh muid machnamh ar an réasúnaíocht taobh thiar den fheidhmchlár ar dtús mar chuidiú aistriúcháin, agus pléifidh muid an dóigh ar mhéadaigh a húsáid go foclóir ríme agus uirlis taighde chomh maith. Faoi dheireadh, pléifidh muid ár gcéad chéimeanna eile chun an feidhmchlár a leathnú agus a fheabhsú.
Cúlra & Réasúnaíocht
Is iomaí uair a dúradh linn gur chóir go dtosófaí píosa scríbhneoireachta le seanfhocal, agus ní eisceacht é an páipéar seo, mar is le seanfhocal a tosaíodh an tionscadal seo ar fad: traduttore, traditore. I gcaitheamh na mblianta, cruthaíodh meafair agus natháin éagsúla ar mhaithe le cur síos a dhéanamh ar phróiseas an aistriúcháin agus ar thoradh an phróisis sin; nathanna a thugann léargas don taighdeoir sa lá atá inniu ann ar an dóigh a ndearnadh machnamh ar choincheap an aistriúcháin ag an am a cruthaíodh iad agus nathanna a bhfuil – in amanna – buanaithe i Léann an Aistriúcháin go dtí an lá inniu. Ar thaobh amháin, mar shampla, samhlaíodh an t-aistritheoir mar fharantóir, ag tabhairt na teanga ó thaobh amháin den chuan go taobh eile, nó mar thógálaí ag déanamh bóithre idir teangacha. Rud maith dearfach is ea an t-aistriúchán, mar sin, a thugann teangacha agus cultúir le chéile. Ach ar an taobh eile, meastar fosta gur ciontach an t-aistritheoir, agus gurb ionann an t-aistriúchán agus feall: ‘the betrayal of the secrets of the tribe to the outside, who then becomes privy to knowledge which only the members of the tribe should have’ (Bery, 2007, 113; Strümper-Krobb, 2021: 22). Is ball den dara catagóir é traduttore, traditore. Nathán seanbhunaithe a tháinig ón Iodáilis ó thús, a deir gurb ionann an t-aistritheoir agus tréatúir. Tá an nath fós in úsáid i Léann an Aistriúcháin agus é mór le rá sa disciplín sin. Agus aistriúcháin den nath go teangacha eile ann (mar shampla, translator traitor), bhí na húdair ag iarraidh leagan Gaeilge de a chumadh. Bhí muid ag súil le leagan a choinneodh rím agus uaim thosaigh an bhunleagain, agus bhí a fhios againn go raibh orainn ‘aistritheoir’ a úsáid sa tslí sin, ach cad a bheadh ann ina dhiaidh? Ní bheadh ach focal a chríochnaíonn le ‘-eoir’ nó ‘-theoir’ fóirsteanach, ach níor rith aon rud linn.
Is cinnte gurbh iad acmhainní leictreonacha na Gaeilge na chéad fhoinsí a d’úsáidfeadh muid, téarma.ie agus an cuardach casta go háirithe. Go deimhin, leis an fheidhmchlár seo a cheadaíonn saoróga [wildcards] (‘carachtar speisialta […] is féidir a úsáid chun carachtar amháin nó breis a léiriú’ (tearma.ie, 2024)), d’fhéadfadh muid an fhadhb thosaigh a bhí againn a réiteach, ach bheadh orainn dhá chuardach a dhéanamh chun é seo a bhaint amach. Thairis sin, leis an chuardach casta ar tearma.ie, thug ‘a%eoir’ 86 toradh ar ais, ach níor chomhlíon toradh ar bith na critéir a bhí againn don aistriúchán. Thug cuardach eile ar an téarma ‘á%eoir’ réiteach fóirsteanach dúinn: aistritheoir áibhirseoir

Figiúr 1: Cuardach ar tearma.ie leis an téarma cuardaigh ‘a%eoir’
Le linn an phróisis seo, agus leis an thóraíocht seo, thug muid faoi deara go raibh bearna ann d’uirlis a bheadh ábalta cuardach mar seo a dhéanamh ar fhotheaghráin na Gaeilge ar bhealach níos solúbtha, agus gur cheart go mbeadh gnéithe breise ar fáil i bhfeidhmchlár mar seo, gnéithe nach raibh ar fáil i bhfeidhmchlár eile go dtí seo.
Ar an gcéad dul síos, thuig muid go mbeadh tairbhe ann d’úsáideoirí uirlis níos simplí a bheith ar fáil dóibh nach bhfuil ach an rochtain aici cuardach inmheánach Gaeilge–Gaeilge a dhéanamh ar fhotheaghráin sa Ghaeilge. Thairis sin, ní cosúil go dtacaíonn téarma.ie le ceisteanna regex, agus dá bhrí sin, ní raibh muid in ann úsáid a bhaint as carachtair ar nós “|” nó réalta Kleane (*) inar gcuardach féin. Chun cuidiú le húsáid ár n-uirlise a thabhairt mar sin, bhí gá le cheatsheet a sholáthar d’úsáideoirí gan cúlra teicniúil chomh maith[1].
Ar an dara dul síos, bhí orainn dhá chuardach a dhéanamh: cuardach amháin leis an síneadh fada agus cuardach eile gan é. I gcanúint Uladh (canúint atá ag údair an ailt seo), ní athraíonn an síneadh fada fuaim an fhocail sa dóigh chéanna is a n-athraíonn sé an focal i gcanúintí eile. Dá bhrí sin, bhí sé loighciúil dúinne cuardach normalaithe úsáideach a chruthú, a ligeann do mheaitseanna páirteacha i dtaca le síntí fada, sa chás go raibh an dá thoradh (leis an síneadh fada nó dá uireasa) de dhíth orainn. B’in an smaointeoireacht a spreag muid uirlis a bheadh dírithe ar an aistriúchán a chruthú; uirlis a éascaíonn cuardach de réir ríme agus uama de, agus uirlis a bheadh solúbtha d’úsáideoirí pé canúint a bheadh acu. Chomh maith leis sin, theastaigh uainn torthaí a thaispeántar ar an fheidhmchlár a chur ar fáil i bhformáid atá éasca a íoslódáil agus inúsáidte ó thaobh ríomhchlárúcháin de, ionas go bhféadfadh úsáideoirí obair leis na torthaí dá mba mhian leo.
Ar deireadh, tá sé tábhachtach a lua go ligeann téarma.ie d’úsáideoirí ‘téarmaí gaolmhara’ a aimsiú, rud atá thar a bheith úsáideach i gcomhthéacsanna áirithe. Lena chois sin, ceadaíonn foclóir.ie agus teanglann.ie cuardach a dhéanamh de réir réimíre. Mar chuid dár gcuid oibre, bhí muid ag iarraidh tacar sonraí a chruthú ina bhfuil focail lipéadaithe de réir iarmhíre; rud nach bhfuil ar fáil leis na feidhmchláir eile, a léiríonn bearna sna teicneolaíochtaí reatha, agus go dtí go mbeadh bealach malartach ar fáil d’úsáideoirí chun focail ghaolmhara a chuardach.[2]
Mar sin agus lenár dtochas féin a mhaolú, chruthaigh muid Míreadóir (mireadoir.ie): uirlis chuardaigh d’fhotheaghráin na Gaeilge, agus is é an feidhmchlár Míreadóir ábhar an pháipéir seo. Déanfaidh muid machnamh ar ár dtionscadal; na dúshláin agus deacrachtaí a bhaineann le cruthú an fheidhmchláir Míreadóir, agus na hionaí a tháinig as a úsáid mar fhoclóir ríme, mar uirlis taighde, agus mar chuidiú scríbhneoireachta, chomh maith lena phríomhúsáid beartaithe mar uirlis chuidithe aistriúcháin.
Suirbhé ar Acmhainní Reatha
Mar a luadh thuas, is iomaí acmhainn leictreonach atá ar fáil do chainteoirí agus d’fhoghlaimeoirí na Gaeilge (féach Ó Coimín, 2024; Corbett, 2025). Tá foclóirí Gaeilge–Béarla, Béarla–Gaeilge, agus Gaeilge–Gaeilge ar fáil dúinn ar potafocal.com, teanglann.ie agus foclóir.ie, a bhfuil níos mó ná iontrálacha iontu. Tá faisnéis ghramadaí, cuidiú foghraíochta agus comhaid fuaime, cluichí, agus an Draoi Gramadaí fosta, agus suíomhanna ar nós abair.ie a chuidíonn le foghraíocht chomh maith; foclóirí Gaeilge–Gàidhlig agus Gaeilge–Gaelg ar intergaelic.com; bunachar téarmaíochta (téarma.ie); agus foclóir comparáideach do theangacha an Aontais Eorpaigh (iate.europa.eu), agus iad uilig saor in aisce. Thairis sin, tá corpais agus uirlisí foghlama eile ar fáil ar líne nach bhfuil baint acu leis an ghramadach agus le stór focal na Gaeilge go díreach, ach atá sár-úsáideach don chainteoir agus don fhoghlaimeoir Gaeilge mar sin féin; aistear.ie, corpas.ie, duchas.ie, agus gaois.ie san áireamh.
Fiú leis an dornán maith uirlisí ar líne agus na bealaí éagsula a bhféadfadh siad cuidiú a thabhairt don úsáideoir, is cosúil nach bhfuil aon uirlis ar leith ann a ligeann d’úsáideoirí téarmaí a chuardach go díreach de réir moirféime díorthaithí (.i. cuid d’fhocal a iompraíonn brí ar leith), go háirithe i dtaca le hiarmhíreanna na Gaeilge. Tá cuardach casta ag foclóir.ie, áfach. Má bhaineann úsáideoirí úsáid as, feicfidh siad go bhfuil an rogha ann cuardach a dhéanamh de réir ‘réimír’ nó ‘iarmhír’ faoi ‘rann cainte’. Tá iarmhíreanna Béarla curtha in oiriúint dá gcomhiarmhreanna sa Ghaeilge (i. mapped to) anseo fosta, ach nuair a rinne údair an pháipéir cuardach ar iarmhíreanna sa Ghaeilge sa phróiseas céanna, níor aimsigh muid iarmhír Ghaeilge ar bith. Maidir le teanglann.ie, de réir mar a thuigtear d’údair an páipéar seo, tá 538 réimír ann le hiontrálacha ar leith acu ar an tsuíomh (agus gach iontráil ag críochnú le ‘-’) agus bíonn siad le feiceáil go minic in éineacht le focail ghaolmhara mholta. Ach arís, ní cosúil go bhfuil aon iontráil ar teanglann.ie a thosaíonn le ‘-’, agus díríonn roghanna cuardaigh ar an tsuíomh níos mó ar aimsiú foirmeacha infhillte, nó ar an dóigh a dtosaíonn téarmaí (féach thíos). Maidir leis an úsáid a bhí i gceist againn féin, áfach, ba iad deirí focal an rud ba thábhachtaí dúinn.

Figiúr 2: Roghanna cuardaigh ar fáil ar teanglann.ie
Mar sin, ba é an chéad chéim i dtreo réiteach ár bhfaidhbe ná uirlis chuardaigh d’fhotheaghrán sa Ghaeilge a chruthú. Chun an téarma ‘fotheaghrán’ a mhíniú, áfach, tá sé níos éasca amharc ar cad is ‘teaghrán’ (‘string’) ann ar dtús. Seicheamh carachtar i bhfeidhmchlár ríomhaire é ‘teaghrán’, a d’fhéadfadh a bheith ina litreacha, ina uimhreacha, nó ina siombailí, agus a bhfuil comharthaí athfhriotail timpeall orthu de ghnáth: ‘hello’ agus ‘world’, mar shampla. Tá fotheaghráin le feiceáil laistigh de theaghráin mar sin, ach bíonn siad ina seicheamh carachtar iad féin (BBC Bitesize, 2025).
Is mó an tábhacht atá ag míreanna agus fotheaghráin sa Ghaeilge, agus iarmhíreanna go háirithe. Is féidir le hiarmhíreanna díochlaonadh, inscne, tuiseal, agus uimhir in ainmfhocail a chur in iúl, agus tá an tuiscint ar mhíreanna na Gaeilge ar cheann de na príomhghnéithe gramadaí a fhoghlaimíonn scoláirí Gaeilge ar dtús, rud a dhéanann próiseas foghlama na Gaeilge níos éasca dá bharr agus na míreanna siúd fite fuaite sa Ghaeilge. Mar shampla, glactar leis mar theoir ghinearálta go gcríochnaíonn ainmfhocail fhirinscneacha le ‘án’, ‘eadh’/ ‘adh’, agus ‘eo’ i measc deirí eile, agus go gcríochnaíonn focail bhaininscneacha le ‘áid’, ‘aíl’/ ‘íl’ nó ‘úint’. Sa dóigh chéanna, is féidir linn a aithint gur sa cheathrú díochlaonadh atá an focal ‘cailín’ agus sa dara díochlaonadh atá ‘bialann’ mar gheall ar a n-iarmhír (Gaelchultúr Teoranta, 2014; Ó Coileáin, 2017).
Is féidir le húsáideoirí fotheaghráin Ghaeilge a chuardach (fotheaghráin ag deireadh an fhocail san áireamh) leis an ríomhchlár WinGléacht (2012); leagan leictreonach den Fhoclóir Uí Dhónaill (1977). I mbosca cuardaigh an fheidhmchláir, tig leis an úsáideoir saoróg [wildcard] a úsáid agus iad sa tóir ar tháthmhír ar bith. Úsáidtear dhá shaoróg sa ríomhchlár; “?” a sheasann d’aon charachtar aonair i bhfocal, agus “*” a sheasann do cibé líon litreacha a d’fheadfadh a bheith in easnamh i bhfocal ar bith. Mar sin féin, mar gheall ar infhaighteacht tearma.ie ar líne, a fhoinsí sonraí nuashonraithe, agus a ghnéithe cuardaigh láidre a pléadh thuas, baintear úsáid as téarma.ie sa dóigh chéanna a n-úsáidtí WinGléacht (2012) tráth.
Modheolaíocht Forbartha agus Feidhmiúchán an Fheidhmchláir
Agus na húdair ag baint leas as a gcuid taithí i réimse an aistriúcháin agus san eolaíocht sonraí, d’fhorbair siad fréamhshamhail chun an bhearna seo i dteicneolaíocht agus i dteanga na Gaeilge a líonadh. Chun é seo a bhaint amach mar sin, chruthaigh siad an feidhmchlár, Míreadóir, atá ar fáil faoi láthair ag mireadoir.ie.[3] Ón uair a roinneadh an feidhmchlár den chéad uair, tá uasdátú dinimiciúil á dhéanamh ar an fheidhmchlár go minic agus cuirtear gnéithe nua leis. Seo mar a chuirtear síos ar leagan reatha an fheidhmchláir ó mhí Eanáir 2025 amach. Is sa teanga ríomhchlarúcháin Python a chuirtear Míreadóir i bhfeidhm go hiomlán. Rinneadh cnuaschóipeáil ar stór focal de chuid teanglann.ie le ceadúnas ó Fhoras na Gaeilge chun focail agus na URL a bhaineann leo a aisghabháil. Sábháiltear sonraí go comhad csv (comhad athróige camógdheighilte) agus lódáiltear é i bhfráma sonraí de chuid Pandas. Úsáidtear Streamlit widgets mar bhonn faoi chomhéadan úsáideora an fheidhmchláir. Nuair a bhi an chéad leagan den fheidhmchlár réidh, seoladh chuig ár dtástálaithe é (a phléifear go mion níos moille sa pháipéar seo).
Is uirlis chuardaigh fotheaghrán é Míreadóir go príomha. Fuair muid amach go bhfuil sé fíorúsáideach a bheith ábalta fiosrúcháin sholúbtha a dhéanamh, rud a ligeann do Míreadóir feidhmiú mar fhoclóir ríme, beag beann ar an chanúint. Tá sé mar sprioc ag Míreadóir mar sin go mbeidh úsáideoirí ábalta cuardach a dhéanamh ar mhoirféim ar leith, iarmhíreanna, réimíreanna, agus táthmhíreanna eile san áireamh. Faoi láthair, tá breis agus 5000 focal lipéadaithe ag na húdair lena n-iarmhíreanna mar chuid den sprioc sin, cé nach bhfuil an obair seo comhtháite san fheidhmchlár go fóill.
Feidhmiú Míreadóir
Le Míreadóir a úsáid, cuireann an t-úsáideoir fotheaghrán isteach sa bhosca cuardaigh ar phríomhleathanach an fheidhmchláir. Sa bhosca anuas, is féidir leis an úsáideoir a roghnú ansin ar mhaith leo torthaí a thosaíonn le, nó a chríochnaíonn le, mír ar leith nó torthaí atá le haimsiú laistigh den fhocal. Tá an rogha ag an úsáideoir fosta, meaits páirteach agus meaits cruinn a roghnú. Cuirtear meaitseanna páirteacha le síntí fada agus gan síntí fada san áireamh i dtórthaí meaits pháirteach, feidhmiú nach bhfuil ar fáil, de réir cosúlachta, in aon uirlis eile atá ar fáil faoi láthair. B’fhéidir gurb í an ghné is úsáidí ar fad atá ag Míreadóir ná gur féidir úsáideoirí an rogha chuardaigh regex a úsáid, áfach. Tá treoracha simplí, dátheangacha maidir le húsáid Míreadóir (chomh maith lena úsáid mar fhoclóir ríme) le regex ar fáil ar an fheidhmchlár féin.
Nuair a chliceálann an t-úsáideoir ar an chnaipe cuardaigh ansin, gheobhaidh siad liosta torthaí in ord aibítre a thagann as teanglann.ie le hipearnasc don iontráil ar an tsuíomh a osclaítear i bhfuinneog nua, chomh maith le líon torthaí san iomlán:

Figiúr 3: Míreadóir i mbun cuardaigh. Úsáidtear an iarmhír ‘eoir’ mar shampla agus í an iarmhír a chruthaigh an trioblóid seo ar fad.
Leis an leagan Míreadóir mar atá, d’fhéadfadh úsáideoirí cuardach a dheanamh de réir moirféime, ach seans go bhfaigheadh siad toradh bréagdheimhneach; focal a litrítear ar an bhealach céanna ach a bhfuil ciall dhifriúil leis, agus focal leis an fhocal cuardaigh san áireamh ann (.i. go bhfaigheadh úsáideoirí torthaí leis an seicheamh litreacha céanna ach seans nach bhfuil ag na torthaí seo an mhoirféim cuardaithe). Mar shampla, má dhéanann úsáideoir cuardach ar fhocal a thosaíonn le ‘fear’, gheobhadh siad torthaí a bhfuil an bhunchiall ‘fear’ istigh ann (mar shampla ‘fearachas’, ‘fearas’, ‘fearúlacht’), ach gheobhadh siad torthaí nach bhfuil aon bhaint acu leis an fhocal ionchurtha ó thaobh sanasaíochta de, agus nach bhfuil an moirféim ‘fear’ (‘man’) i gceist, ach a bhfuil an fotheaghrán céanna, f-e-a-r istigh ann, (mar shampla, ‘fearg’, ‘feargach’, ‘fearb’). Tá an deacracht chéanna le feiceáil i dteideal an pháipéir seo fosta. Cé go bhfuil an focal ‘deoir’ ann san fhocal ‘taighdeoir’, ní moirféim é sa chás seo, agus níl baint aige le bunchiall an fhocail ‘deoir’ mar atá leis féin, agus níl ann ach seicheamh litreacha ag deireadh an fhocail.
Torthaí Agus Plé
Roinneadh Míreadóir lenar ‘mbéite-thástálaithe’; comhghleacaithe agus cairde i saol na Gaeilge; mic léinn tríú leibhéal, agus gairmithe in earnálacha na hiriseoireachta, agus an oideachais, agus foghlaimeoirí Gaeilge, cainteoirí Gaeilge T2, agus cainteoirí dúchais san áireamh. I mí Lúnasa 2024, bhí deis againn fosta Míreadóir a roinnt le comhghleacaithe Ghaeilge na hAlban i gcoláiste Shabhal Mòr Ostaig agus na húdair ar chúrsa Ghaeilge na hAlban ann. Sa mhí chéanna, bhí deis ag na húdair Míreadóir a phlé le lucht ríomheolaíochta ag caint mhíosúil de chuid Python Ireland, eagraíocht dheonach a chuireann an teanga ríomhchlárúcháin Python chun cinn in Éirinn, agus bhí muid in ann páipéar ar an fheidhmchlár a thabhairt ag comhdháil bliaintúil de chuid Python Ireland, PyCon Ireland, i mí na Samhna 2024.[4]
Agus an feidhmchlár roinnte leis na tástálaithe againn, tugadh faoi deara go bhfhéadfadh úsáid níos leithne a bhaint as an fheidhmchlár ná mar a shamhlaigh na cruthaitheoirí. Bhí réamhbharúil againn go mbainfí úsáid as Míreadóir mar uirlis chun cuidiú i gcásanna cosúil leo siúd a chuir tús leis an tionscadal ar fad, ach i ndairíre, d’úsáid tástálaithe Míreadóir é ar bhealaí ní ba leithne ná mar a shíl muid. Bhí ár dtástálaithe a bhí ina bhfoghlaimeoirí Gaeilge in ann Míreadóir a úsáid chun geminates (ar nós ‘nn’, ‘ll’, srl.) a chuardach agus a aimsiú, agus bhí siad in ann díochlaontaí ar leith a aimsiú ina staidéar neamhspleách le go bhféadfadh siad réimniú a chleachtadh.[5] Chomh maith leis seo, bhí taighdeoir tríú leibhéal ábalta úsáid a bhaint as an fheidhmchlár agus é ag déanamh iarrachta tras-scríbhinn a scríobh amach, a raibh deacrachtaí aige é a thuiscint mar gheall ar chaighdeán an taifeadta agus ar chanúint an chainteora. Agus an taighdeoir ábalta píosa den fhocal a phiocadh amach agus é sin a úsáid i gcuardach san fheidhmchlár, thug Míreadóir cuidiú dó an focal a scaoileadh.
Ach is é an ghné is nuaí agus is spreagúla a bhaineann leis an fheidhmchlár, áfach, ná a úsáid mar fhoclóir ríme. Cé go bhfuil foclóir ríme ar fáil sa Ghaeilge i bhformáid PDF (féach Ó Scanaill, 2019), ní chuireann sé na trí mhórchanúint san áireamh, ag díriú go mór ar an Ghaeilge chaighdeánach (nó ar ‘lárchanúint’ na Gaeilge). Mar shampla, bheadh ar úsáideoir as Cúige Uladh cuardach a dhéanamh ar fhocail a chríochnaíonn le ‘ú’, ‘adh’, nó ‘odh’ agus iad sa tóir ar fhocal a dhéanann rím le samhradh, ach i gcás úsáideoir as réigiúin eile, seans maith go mbeadh siad ag lorg focal a chríochnaíonn le ‘a’ leis an rím chéanna a bhaint amach. D’fhéadfadh an ghné seo den fheidhmchlár a bheith an-spéisiúil i gcomhthéacs an aistriúcháin idirdhialachtaichiúil, i. aistriúchán inteangach ó chanúint amháin go ceann eile sa teanga chéanna (Jakobson, 1992: 145). Mar shampla, nuair ba mhaith le hamhránaí leagan dá gcuid féin d’amhrán traidisiúnta ó chúige eile a dhéanamh agus a chur ina gcanúint féin, agus an rím a choinneáil. Dá réir sin, tá sé mar sprioc reatha de chuid Míreadóir a ábaltacht mar fhoclóir ríme a leathnú agus a éascú amach anseo.
Plé ar Roghanna Dearaidh agus ar Bhuntáistí a Bhaineann leis an Dhearadh Sin
Agus an méid thuas ráite, is tábhachtach plé a dhéanamh ar an fháth ar thóg muid an feidhmchlár sa dóigh seo chun an fhadhb thosaigh a bhí againn a réiteach, agus cén fáth nár úsáid muid Samhail Teanga Mhór (Large Language Model; LLM) do Míreadóir. Ar an gcéad dul síos, is próiseas in-athdhéanta é úsáid ár bhfeidhmchláir, le toradh cinntitheach gach uair. Dá réir sin, is dócha go bhfuil ár réiteach i bhfad níos éifeachtaí ó thaobh fuinnimh de, agus níos fabhraí don timpeallacht ná LLM a cheistiú arís agus arís eile. Chomh maith leis sin, deirtear gur féidir le húsáid LLManna teacht i bhfeidhm go diúltach,[6] ar chruthaitheacht an aistritheora san aistriúchán cruthaitheach nó san aistriúchán liteartha (féach Guerberof Arenas & Toral, 2022). Is minic a cheaptar gur próiseas focal-ar-fhocal é an t-aistriúchán, próiseas a tharlaíonn go ciúin gan mórán ionchuir (go cruthaitheach) ón aistritheoir féin.[7] Ní hamháin go mbíonn taithí phearsanta an aistritheora ina tionchar ar an aistriúchán (féach Novajra, 2023: 8), ach tá tuiscint chultúrtha agus teangeolaíochta an aistritheora ríthábhachtach don phróiseas aistriúcháin fosta. Cé gur féidir leis an meaisínaistriúchán a bheith úsáideach i dtéacsanna caighdeánaithe ar nós cáipéisí dlí nó le haistriúcháin theicniúla, is iad na huirlisí a thugann tacaíocht i dtaobh chruthaitheacht an aistritheora agus nach gcuireann bac uirthi na huirlisí is tábhachtaí i gcomhthéacs an aistriúcháin liteartha. Agus muid ag baint úsáid as LLM mar ghluais, thug muid faoi deara fosta go dtugann sé liosta i bhfad níos giorra de théarmaí féideartha, mar aon le míniú ar a roghanna, cé go bhféadfadh an toradh sin athrú de réir an spreagtha a thugtar dó. I gcomparáid leis sin, fuair na húdair amach gur chuidigh Míreadóir (agus a liosta fada roghanna) cruthaitheacht a spreagadh. Thug sé an deis dúinn machnamh a dhéanamh faoin fhocal a bheith oiriúnach dár gcomhthéacs sonrach, gan chomhairle ón uirlis í féin.
Ó thaobh forbairt bogearraí agus dea-chleachtais de, is gá sprioc ár bhfeidhmchláir a chur san áireamh chomh maith. Is féidir a áiteamh go mbíonn go leor d’aipeanna an lae inniu ag brath ar an Intleacht Shaorga (IS; AI) gan ghá. Chun meafar a úsáid, tig linn smaoineamh ar an chnagadóir fuinneoige (window knocker). Fadó, bhíodh daoine ag íoc as duine teacht chuig a dteach féin agus cnag ar a bhfuinneoga thuas staighre le cuaille fada chun iad a dhúiseacht agus lean an nós seo ar aghaidh go dtí gur cumadh an clog aláraim. Is dócha mar sin, go bhfuil go leor de ríomhchláraitheoirí an lae inniu ag déanamh meaisíní cnagála fuinneog in áit cloig aláraim. Mar shampla, d’fhéadfaí chatbot a úsáid in áit rúnaí chun coinní a chur in áirithe ach ní hé sin le rá go réitíonn sé an fhadhb a bhí ann ná go gcuireann sé le héifeachtúlacht, agus go ndéanfadh féilire roinnte cruthaithe gan IS an jab céanna (féach Montani, 2025).
Tá breithnithe a bhaineann le húsáid LLManna i bhfad níos tábhachtaí i gcomhthéacs teanga mhionlaigh mar d’fhéadfadh LLManna bréagaisnéis a chruthú. Murab ionann agus LLManna, ní dhéanann Míreadóir (atá bunaithe ar réiteach simplí, cinnte, agus cinntitheach) é seo, áfach. Is mar gheall ar na cúiseanna seo a chreideann muid mar sin ná cé go bhfuil cuma ar an scéal go bhfuil Míreadóir simplí go leor ó thaobh teicneolaíochta de, tá a fhiúntas agus a thábhacht le feiceáil sa tsimplíocht sin.
Chomh maith leis sin, is mór an díospóireacht faoi láthair ar thionchar na ríomhairí agus IS ar réimse an aistriúcháin é féin (féach CEATL, 2020; 2023), agus cé go dtugann roinnt scoláirí le fios nach bhfuil gairm aistritheoirí i mbaol nó ar tí a bheith i mbaol mar gheall ar IS (agus nach bhfuil ann ach gur athraigh an obair), is cnámh spáirne é IS fós i réimse an aistriúcháin, agus aird dírithe ar an ábhar ag comhdhálacha agus in irisí go sonrach (féach Pym, 2023, 25:41; CEATL, 2023; 2024).
Is éasca aistriúchán uathoibrithe a shamhlú: ag athrú teanga amháin go teanga eile go láithreach, gan dua ná deacracht, agus luathsmaoineamh ea ba é do scríbhneoirí ficsin agus saineolaithe araon (Silverberg, 2009: 6; Hadley, 2020: 14). Le toradh so-aitheanta (.i. téacs aistrithe) agus próiseas a bhfuil an chuma air go mbeadh sé éasca a bhaint amach, ní haon ionadh é mar sin gur shocraigh forbróirí an próisis aistriúcháin a uathoibriú. Dealraíonn sé nach n-iarrann forbróirí comhairle a fháil ó aistritheoirí ná ó theangeolaithe eile ina ngairm áfach, agus nach ndearnadh comhoibriú, cé gur mhó an tairbhe don dá pháirtí seo (Pym, 2023, 14:51–15:13).
Mar sin féin, ní Luddaigh muid na haistritheoirí, agus níl muid ag iarraidh a bheith inár Luddaigh ach an oiread; mar a deir Anthony Pym (2023), ‘refusing the advances of automation […] is not the way forward’ ach ba chóir dúinn a bheith cúramach go gcoinneoidh muidne – na haistritheoirí – i gcomhchaint leis na forbróirí, agus go mbainfeadh muid úsáid as an uathoibriú seo ar bhealach a théann lámh ar lámh lenár ngairm féin, agus ar bhealach a chinntíonn ‘that machines work for humans instead of humans working for machines’ (Hansen, 2023: 12). D’fhéadfadh uathoibriú na gnéithe is leadránaí dár gcuid oibre a dhéanamh dúinn, ag fágáil na ngnéithe is cruthaithí agus is tairbhí faoi na haistritheoirí, agus seachas a bheith ag póirseáil fríd an fhoclóir, tig leis an aistritheoir díriú ar an obair is fearr leo. D’fhéadfá a rá gur ábhar íoróine é feidhmchlár leictreonach a chruthú le haird a dhíriú ar an uathoibriú, ach feictear dúinn go seasann Míreadóir mar chéim sa treo ceart, mar eiseamláir d’aistritheoirí agus d’fhorbróirí ag obair lena chéile chun an méid is mó a bhaint as ár ngairmeacha féin.
Conclúid agus na Céad Chéimeanna Eile
Agus leagan Míreadóir mar atá sé againn faoi láthair, is léir gur baineadh amach príomhaidhm na n-údar mar a bheartaigh muid: feidhmchlár leictreonach a chruthú atá ábalta fotheaghráin sa Gaeilge a chuardach ar bhealach solúbtha. Ach ba as an phríomhaidhm seo a tháinig torthaí tánaisteacha nach raibh aon súil leo, agus Míreadóir ábalta feidhmiú mar chuidiú taighde agus foghlama, chomh maith lena phríomhúsáid beartaithe mar uirlis chuidithe aistriúcháin.
Ní ligfidh muid ár maidí le sruth chomh luath seo, áfach, agus athruithe agus gnéithe eile ar na bioráin againn agus muid ag súil go gcuirfidh sé leis an fheidhmchlár mar atá. Tá obair eile ar bun againn leis an mhéid is mó focal agus is féidir a roinnt ina moirféimí díorthacha, go dtí gur féidir cuardaigh ar bhonn moirféime a éascu. Níl bealach cruinn fós againn cuardach a dhéanamh ar mhoirféim ar leith, go háirithe agus comhainmneacha nó focail leis an seicheamh litreacha céanna ann i dteanga na Gaeilge, fadhb a luaitear níos luaithe sa pháipéar seo. Is é an tasc atá ag na húdair faoi láthair, mar sin, ná clibeáil cheart a dhéanamh ar na sonraí go dtí gur féidir linn fíor-cheisteanna moirféimí a chur i bhfeidhm.
Nuair atá sonraí lipéadaithe againn, déanfar uasdátú ar mireadoir.ie chun gur féidir fíor-iarratais moirféimí díorthach a chuardach. Sa tslí sin, tá muid ag amharc ar mhodhanna cinnteachaíocha agus staitistiúla san am i láthair leis an aidhm seo a bhaint amach, chomh maith le bunú tionscadail eolaíochta saoránach (citizen science project) gur féidir leis an phobal cuidiú a thabhairt leis an tasc ollmhór seo. Ábhar suimiúil is ea í an úsáid seo, agus seans go dtabharfadh sé tacaíocht d’aistritheoirí atá sa tóir ar aistriúcháin caol-ar-chaol nó go mbeadh sé suimiúil i bplé a bhaineann le tionchar an ionchomharthuithe fofhocail (sub-word tokenisation) ar thascanna NLP i dteangacha atá saibhir ó thaobh morfeolaíochta de chomh maith (Libovický & Helcl, 2024).
Mar chonclúid, is tábhachtach súil a chaitheamh ar an tionchar a bhí ag an fheidhmchlár é féin ar na húdair. Thug Míreadóir deis dúinn a bheith ag oibriú i ndisciplín coimhthíoch, taobh amuigh dár réimsí saineolais féin; a bheith ag obair le cara agus comhghleacaí, agus ag déanamh ár ndícheall fadhb a d’aithin muid féin a réiteach. Oscailt súl a bhí a ann a bheith ag múineadh agus ag foghlaim sa dóigh seo agus tá súil againn a bheith ag obair lena chéile ar Míreadóir amach anseo agus an comhar a choinneáil ag dul.
Buíochas
Ba mhaith leis na húdair a mbuíochas a ghabháil le Foras na Gaeilge as a gcuid tacaíochta leis an tionscadal seo, le Python Ireland as a gcuid misnithe agus comhairle, le Clíodhna Nic Giolla Chomhaill agus le Maitiú Ó Coimín.
[1] Tá an cheatsheet ar fáil ar shuíomh Míreadóir, mireadoir.ie
[2] Tá an tacar sonraí ar fáil ar iarratas.
[3] Maidir le sonraí teicniúla faoi fheidhmiú Míreadóir, tá an cód ar fáil ar GitHub (féach megajoules8, 2025).
[4] Ba é an páipéar ‘Taking the ‘-Deoir’ out of ‘Taighdeoir’: Creating a Substring Search Tool for the Irish Language’ an chéad uair a raibh an Ghaeilge mar ábhar plé ag comhdháil PyCon Ireland riamh, agus bhí sé sna trí cinn is fearr as 150 páipéar a cuireadh faoi bhráid na comhdhála.
[5] Sa dóigh seo, b’iontach an acmhainn é Míreadóir do mhúinteoirí fosta; ní bheidh orthu streachailt smaoineamh ar shampla eile de bhriathar le dhá shiolla a chríochnaíonn le consan caol ar an spota níos mó agus Míreadóir acu.
[6] Tá seans maith gur beag tionchar LLManna ar teangacha uasalacmhainne (high-resource languages), áfach (féach Castaldo et al., 2025.
[7] Thaispeáin Corbett [2022], mar shampla, gur minic a bhíonn léargais aonteangacha coitianta ag daoine nuair atá siad ag obair leis an aistriúchán, agus í ag plé faoin chóras oideachais i dTuaisceart Éireann agus an Ghaeilge. Níl sé deacair a shamhlú mar sin, gur tharla agus go dtarlaíonn an rud ceana céanna sa réimse seo agus daoine ag déanamh ríomhchlárúcháin. Lena chois sin, agus na húdair ag caint ag plé míosúil de chuid Python Ireland i mí Lúnasa 2024, iarradh orainn labhairt ar dhearcadh an aistritheora ar an aistriúchán agus ar an uathoibriú, agus a thaispeáin do ghrúpa ríomhchláraitheoirí a raibh i láthair cad é mar atá sé a bheith i d’aistritheoir. Tugann an ríomhchláraitheoir Ben Hamill (2017) faoi deara fosta go bhfuil tuairimí ag forbróirí bogearraí faoi theangacha nach dtagann leis an saol i ndairíre, go háirithe más cainteoir Béarla é an forbróir. Ní le haistriúchán nó le teangacha amháin a bhíonn fadhbanna ag forbróirí áfach (féach jamesIk, 2016) ach cuireann sé leis an smaoineamh go bhfuil míthuiscint sa réimse ar cad is aistriúchán ann agus go bhfuil obair le déanamh ann an mhíthuiscint seo a réiteach.