Deprecated: __autoload() is deprecated, use spl_autoload_register() instead in /home/s591357/leannteangaanreiviu.com/profiles/gardens/libraries/htmlpurifier/library/HTMLPurifier.autoload.php on line 17
Saothar Sheáin Mhic Giollarnáth ar Thaisclann Dhigiteach na hÉireann | Léann Teanga: An Reiviú

Error message

Deprecated function: The each() function is deprecated. This message will be suppressed on further calls in menu_set_active_trail() (line 2404 of /home/s591357/leannteangaanreiviu.com/includes/menu.inc).

Saothar Sheáin Mhic Giollarnáth ar Thaisclann Dhigiteach na hÉireann

Seathrún Ó Tuairisg
Rósmáire Ní Cholla
Piaras Ó Droighneáin

1. Réamhrá

Tá borradh faoi réimse na cartlannaíochta le déanaí, ar go leor cúiseanna díchosúla. Tá tuiscint níos láidre againn ar an tábhacht atá le caomhnú cuí a dhéanamh ar ár n-oidhreacht chultúrtha. Go dtí seo, is ag dul i bhfeidhm ar an oibiacht dhigiteach[1] mar aonán a bhí coincheap an chaomhnaithe dhigitigh, lena chinntiú go príomhúil go mairfeadh an oibiacht. Le déanaí, tá claochlú tagtha ar an gcoincheap seo, agus dár le Ross (2012) is éard atá i gceist anois ná:

…maintaining the semantic meaning of the digital object and its content, about maintaining its provenance and authenticity, about retaining its “interrelatedness,” and about securing information about the context of its creation and use. (2012: 45)

Ag imirt tionchair ar an athrú meoin seo tá an fás agus an fhorbairt atá tagtha ar theicneolaíochtaí ar-líne (Pinfield et al., 2014). Dá thoradh seo, tugann an comhtháthú, an idir-inoibritheacht agus an chomhoiriúnacht atá anois mar chroí-choincheapa i bhforbairtí sa gcartlannaíocht an deis dúinn – go teoiriciúil – úsáid níos éasca, níos éifeachtaí agus níos fearr a bhaint as na cartlanna agus na bailiúcháin digitithe atá inár seilbh.

Ina ainneoin seo, tá sé tugtha faoi deara ag taighdeoirí, ina measc,  Wu et al. (2012), go bhfuil mant sna seirbhísí ilteangacha atá ar fáil i réimse an chartlannaithe dhigitigh – seirbhísí cosúil le comhéadain chuardaigh ilteangach agus, uirlisí le haistriú agus le rangú a dhéanamh ar ábhair (bíodh sin i bhfoirm téacs, fuaime, físe srl.) ó réimsí eolais sainiúla.  Is beag freastal atá á dhéanamh ar mhionteangacha, ach go háirithe, i bpobal an chartlannaithe dhigitigh, in ainneoin ráiteas Nichols et al. (2005), a mhaíonn:

Digital libraries are powerful vehicles for preserving and revitalizing minority languages, provided that they allow language communities to take control of the technology and customize it to meet their needs. (2005: 154)

Ar an lámh eile, spreagtar suim i bpobal teanga nuair a chaomhnaítear agus nuair a chuirtear ábhar mionteangach ar fáil ar bhealach comhaimseartha – go háirithe do phobal atá ag éirí níos compordaí ag dul i ngleic le hábhar agus le hardáin dhigiteacha (Carew et al., 2015).  Anuas air sin, le húsáid níos mó á baint as ábhar cartlainne mar acmhainn oideachasúil, tá sé tábhachtach go bhfuil úsáideoirí in ann dul i ngleic leis an ábhar sin ina dteanga féin (Gorter, 2015, Petersen, 2015).

Sa chomhthéacs seo, tá údair an pháipéir seo páirteach i bhforbairt Thaisclann Dhigiteach na hÉireann (Digital Repository of Ireland, nó DRI uaidh seo i leith), ardán dátheangach d’ábhar cartlainne (Harrower et al., 2013). Déanann an páipéar seo cur síos ar ár n-iarrachtaí le hábhar cartlainne Gaeilge – Bailiúcháin Sheáin Mhic Giollarnáth – a chur ar fáil, i mbealach bríoch, ar an ardán seo. Déanfar cur síos ar an aistear a thóg an t-ábhar seo – ó mheán téacsbhunaithe go hoibiachtaí digiteacha ar-líne, le rochtain oscailte ag an bpobal orthu.

Tosaítear le cur síos gonta ar fhorbairtí úra i réimse an chartlannaithe dhigitigh, forbairt an DRI san áireamh, sula ndéanann muid cur síos ar Bhailiúchán Sheáin Mhic Giollarnáth.  Mínítear conas a chuamar i ngleic le struchtúir chasta theangeolaíocha sna meiteashonraí, agus cén chaoi ar dearadh comhéadan úsáideora na Taisclainne chun freastal a dhéanamh ar chumais teanga éagsúla na n-úsáideoirí agus iad ag iarraidh dul i ngleic leis an ábhar seo.  Críochnaítear le plé gearr ar bhealaí inar féidir tógáil ar an obair sa réimse seo sa todhchaí.

2. Taisclann Dhigiteach na hÉireann

Is córas í cartlann dhigiteach a stórálann, ar feadh tréimhse ama éiginnte, bailiúchán nó bailiúcháin d’oibiachtaí digiteacha. Cé go mbíonn cúiseanna éagsúla leis seo, tugtar tosaíocht i gcónaí don chaomhnú – faisnéis luachmhar a chosaint ionas gur féidir le glúnta eile rochtain a bheith acu air (Conway, 1990).  Tá dúshláin an phróisis chaomhnaithe seo – deacrachtaí teicniúla, costas, agus a bheith ag iarraidh sláine sonraí a chinntiú agus dífheidhmeacht a sheachaint – aitheanta le fada (Hedstrom, 1997).  Ach tá éabhlóid déanta ag coincheap an chartlannaithe dhigitigh le blianta beaga anuas, a thógann san áireamh castacht an ábhair dhigitigh chomhaimseartha agus riachtanais shofaisticiúla na n-úsáideoirí.

Le cartlann chomhaimseartha a fhorbairt, caithfear anois ‘the complex relationships between individual researchers, their organizations and subject communities, and their funders and governments’ (Pinfield et al., 2014) a aithint.  Tá réitigh againn: le teicneolaíochtaí ar nós faisnéisíochta, sonraí struchtúrtha agus líonraí séimeantacha, is féidir anois dúshaothrú níos iomláine a dhéanamh ar shonraí cartlainne.  Mar shampla, tugann sonraí nasctha saor-rochtana, bunaithe ar RDF[2], ointeolaíochtaí agus teicneolaíochtaí séimeantacha ar nós OWL[3] agus SPARQL[4], an cumas dúinn tacair shonraí ilchineálacha a nascadh d’fhonn breisluach a chur lenár mbailiúcháin (féach, mar shampla Brennan & Feeney, 2013; Shiri, 2014).

Ag tús na mílaoise seo aithníodh mantanna i mbonneagar cartlannaíochta na hÉireann, cleachtais chaomhnaithe agus rochtana i leabharlanna, iarsmalanna agus ollscoileanna ina measc (féach O’Carroll & Webb, 2012).  Mar gheall air seo, bunaíodh Taisclann Dhigiteach na hÉireann (DRI) – a seoladh i Meitheamh 2015.  Taisclann dhigiteach náisiúnta iontaofa le haghaidh sonraí daonnachtaí, eolaíochtaí sóisialta agus oidhreacht chultúrtha na hÉireann í DRI.  Caomhnaíonn sí ábhar stairiúil agus comhaimseartha na tíre, agus cuirtear rochtain lárnach ar-líne ar fáil, in éineacht le huirlisí ilmheánacha chun anailís a éascú.  Bhí sé freisin mar cheann de riachtanais DRI (Webb & McGoohan, 2015) go mbeadh an taisclann dátheangach (Gaeilge agus Béarla).  Mar bhaill d’fhoireann fhorbartha na taisclainne, chinn muid Bailiúchán Sheáin Mhic Giollarnáth a chur in oiriúint do DRI, agus DRI a chur in oiriúint do Bhailiúchán Mhic Giollarnáth.

3. Bailiúchán Sheáin Mhic Giollarnáth

Breitheamh cúirt dúiche, scríbhneoir agus bailitheoir béaloidis ab ea Seán Mac Giollarnáth (1880-1970).  Sa bhliain 1925 ceapadh é ina bhreitheamh Cúirt Dúiche i gConamara, agus d’fhan sé sa phost seo go ceann 25 bliain.  Bhí Conamara, agus ceantar Iorras Aintheach ach go háirithe, ar maos i dtraidisiún na scéalaíochta ag an am agus bhí ardmheas ar scéalaithe an cheantair.  Thug a chuid oibre mar bhreitheamh an deis do Mhac Giollarnáth bualadh leis na scéalaithe ba mhó le rá i gConamara ag an am, agus a gcuid scéalta a bhailiú uathu.

Is i mbailiúchán iomráiteach de lámhscríbhinní a rinne Mac Giollarnáth agus a chuid comhghleacaithe na scéalta agus an t-eolas seo a thaifead, bailiúchán a bronnadh le déanaí ar Ollscoil na hÉireann, Gaillimh.  Ábhar béaloidis atá i bhformhór na lámhscríbhinní ach tá lear suntasach de dhialanna, foclóirí, dréachtaí agus aistriúcháin ar an dúlra agus ar an bhfiadhúlra ach go háirithe i gceist iontu freisin.  Iarradh freisin ar na bailitheoirí ábhar a bhailiú a raibh baint aige le chuile ghné de shaol laethúil na ndaoine.  Mar sin tugtar sonraí sna lámhscríbhinní seo ní hamháin ar na scéalta, na paidreacha, na foclóirí agus na seanfhocail a bhailigh Mac Giollarnáth sa cheantar, ach thairis sin tugtar léargas iontu ar a réimse leathan ábhar spéise, ar a mhodh oibre agus ar an gcaidreamh a bhí aige leo siúd a chuidigh leis an t-ábhar seo a chruinniú.

D’fhoilsigh Mac Giollarnáth cuid mhór den ábhar béaloidis a bhailigh sé i dtéacsanna ar nós Loinnir Mac Leabhair agus Sgéalta Gaisgidh Eile (1936), Annála Beaga ó Iorrus Aithneach (1941) agus Peadar Chois Fhairrge (1944) agus mar ailt in irisí ar nós Béaloideas.  Ó na 1970í ar aghaidh chuir RTÉ Raidió na Gaeltachta saothar Mhic Giollarnáth i láthair do phobal úr i réimse clár faoina shaol agus a shaothar.  I measc na gclár a craoladh bhí Trian le Scéalaíocht (1976),  Bí Liom Seal Eile (1986), Annála Beaga ó Iorrus Aithneach (1986-1987) agus Leatsa Leagan i 1993.

4. Coimeádaíocht ar an Ábhar

4.1 Digitiú, Tras-scríobh agus Cóimheas

Chuir muid romhainn an bailiúchán d’ábhar ilchineálach seo a chlaochlú go cartlann chomhaimseartha dhigiteach.  Rinne muid na lámhscríbhinní a dhigitiú ag úsáid scanóir Bookeye, trealamh digitithe de chuid Leabharlann Shéamuis Uí Ardagáin, Ollscoil na hÉireann Gaillimh.  Thiontaigh sé seo gach leathanach sna lámhscríbhinní go híomhá ardtaifeach TIFF[5].  Ina dhiaidh sin, tiontaíodh na híomhánna seo go formáid neamhchaillteach PDF/A. Is fo-thacar é seo den ghnáthchaighdeán PDF[6], agus é curtha in oiriúint do chaomhnú fadtéarmach mar nach nglacann sé le teicneolaíochtaí iomarcacha ar nós scripteanna leabaithe (Strodl et al., 2007).  Cruthaíodh freisin leagan digiteach de gach lámhscríbhinn nuair a rinneadh na hoibiachtaí digiteacha cuí a chomhcheangal i gcomhad PDF/A. Socraíodh an dá fhormáid (leathanaigh aonair agus cáipéisí iomlána) a chur ar fáil don phobal, mar gur measadh go mba mhaith le húsáideoirí leathanaigh aonair a lua[7] nó a úsáid, chomh maith le lámhscríbhinní digiteacha iomlána a ionramháil.

Scríobh daoine éagsúla lámhscríbhinní Mhic Giollarnáth, agus dá bharr tá cuid acu níos inléite ná a chéile.  Mar sin, ar mhaithe le héascaíocht agus le hinúsáidteacht, rinneadh gach lámhscríbhinn a thras-scríobh.  Rinneadh eagarthóireacht ar na comhaid tras-scríofa seo ionas go ndearna gach leathanach scáthánú ar an leathanach fisiciúil, lámhscríofa. Cuireann sé sin ar chumas an léitheora comparáid dhíreach a dhéanamh idir leathanach tras-scríofa agus a mhacasamhail de leathanach lámhscríofa.  Tiontaíodh na comhaid téacs seo go caighdeán PDF/A chomh maith.

Léiríonn Figiúr 1 (thíos) an oibiacht dhigiteach a dhéanann tagairt don leathanach deireanach ó Lámhscríbhinn 12 de Bhailiúchán Sheáin Mhic Giollarnáth, in éineacht leis an oibiacht den leagan tras-scríofa. Cé nach ndéanfar mórán plé ar ábhar an bhailiúcháin sa pháipéar seo, is léir ón bhFigiúr thíos go bhfuil níos mó faisnéise sna lámhscríbhinní ná scéalta fuarchúiseacha amháin. Breacann Mac Giollarnáth síos nótaí pearsanta freisin a thugann spléachadh dúinn ar an gcairdeas a bhí aige le daoine eile, agus leis an scéalaí Micilín Mac Donnchadha ach go háirithe.

Figiúr 1: Íomhá de leathanach 129 de Lámhscríbhinn 12 ó Bhailiúchán Sheáin Mhic Giollarnáth (ar chlé) agus an leagan tras-scríofa (ar dheis).

Bhí sé mar sprioc againn taispeántas saibhir, ilghnéitheach, ilmheánach a chruthú a léireodh gnéithe éagsúla de shaothar Mhic Giollarnáth. Mar sin, shocraigh muid míreanna fuaime agus físe a chur leis an ábhar (thar a bheith téacs-bhunaithe) a bhí againn. D’aimsigh muid ábhar fótagrafach agus gearrshaolach a bhaineann le Seán Mac Giollarnáth ó Leabharlann Shéamuis Uí Ardagáin, agus fuair muid cead ó Chnuasach Bhéaloideas Éireann ábhar eile uathu a úsáid.  Chomh maith leis sin, d’úsáid muid míreanna ó Chartlann RTÉ Raidió na Gaeltachta (luaite thuas) – a bhí digitithe cheana féin. Cruthaíodh 7,750 oibiacht dhigiteach dhifriúil ón bpróiseas thuasluaite – leathanaigh aonair agus cáipéisí scanta agus tras-scríofa, fuaim agus íomhánna san áireamh. Léiríonn an líon oibiachtaí seo méid, fairsinge agus doimhneacht an bhailiúcháin.

4.2 An Scéimre Meiteashonraí

Is réamhriachtanas d’eispéireas maith taiscéalaíochta agus fionnachtana é córas meiteashonraí ar ardchaighdeán (McCarthy, 2015), agus is ‘glanadh sonraí’ nó ‘data cleaning’ an chéad chéim anseo.  Is é seo an próiseas chun earráidí a aimsiú, sonraí a chur in oiriúint do chaighdeáin áirithe, taifid mhíchruinne nó neamhfhóirsteanacha a scrios, agus a chinntiú go bhfuiltear ag cloí mar ba cheart le pé formáid atá roghnaithe (Hernández & Stolfo, 1998).  D’úsáid muid Open Refine (Ham, 2013), feidhmchlár deisce foinse oscailte chun sonraí a ghlanadh agus a thiontú go formáidí eile, chun na meiteashonraí a ghlanadh.  Is féidir leis freisin imréiteach a dhéanamh in aghaidh seirbhís ghréasáin ar bith a bhaineann úsáid as an gcomhéadan feidhmchláir[8] ar a dtugtar Seirbhís Imréitigh (Reconciliation Service) (Verborgh & De Wilde, 2013) – is é sin nasc séimeantach a chruthú le bunachar sonraí eile.

De bhrí nach raibh mórán meiteashonraí inúsáidte againn, ná fiú scéimre meiteashonraí, do Bhailiúchán Sheáin Mhic Giollarnáth, thóg muid orainn féin scéimre meiteashonraí bunaithe ar an Dublin Core Metadata Initiative (nó DCMI) a úsáid (féach Hakala, 2000).  Tá roinnt buntáistí, i gcás na riachtanas a bhí againn, ag samhail an DCMI thar samhlacha meiteashonraí eile.  Tá struchtúr ‘clárach’ an tacair shonraí in oiriúint do struchtúr an DCMI, agus tá samhail meiteashonraí an DRI bunaithe ar shamhail an DCMI.  Anuas air sin, bhí muid ábalta leas a bhaint as gné in-athdhéanta d’eilimintí an DCMI chun cuid de na dúshláin dhátheangacha a bhí againn a shárú (féach thíos).  Tá 55 téarma DCMI ann[9] agus d’úsáid muid 16 acu chun cur síos a dhéanamh ar an ábhar (féach Tábla 1). Tabhair faoi deara, áfach, cé go bhfuil scéimre an DCMI aistrithe go roinnt teangacha eile, níl an Ghaeilge mar cheann acu.  Mar sin, d’úsáid muid na téarmaí Béarla sa pháipéar seo.

Chruthaigh muid an chéad tacar meiteashonraí do Bhailiúchán Sheáin Mhic Giollarnáth ag úsáid téacs agus nótaí mínithe ó na lámhscríbhinní, in éineacht le haon eolas eile a bhí againn faoin mbailiúchán.  I gcás Bhailiúchán Raidió na Gaeltachta, rinne muid ailíniú ar an mbunleagan de na meiteashonraí ionas go mbeadh sé ag teacht le treoirlínte an DRI i leith meiteashonraí (Bustillo et al., 2015).  Tá faisnéis i meiteashonraí Raidió na Gaeltachta (.i. Léiritheoir, Láithreoir srl.) a thugann le fios gur ó réimse an chraolacháin agus na meán a tháinig an t-ábhar.  De bhrí nach bhfuil a chomhionann i liosta téarmaí an DCMI, chomhlánaigh muid na meiteashonraí DCMI le téarmaí ón gcóras MAchine-Readable Cataloguing Relator Terms (MARC, féach Harper & Tillett, 2007).  Is buntáiste eile é an inbhreisitheacht seo atá ag córas DCMI le hais caighdeáin eile meiteashonraí.

Tábla 1: Meiteashonraí DCMI do Lámhscríbhinn 9 ó Bhailiúchán Sheáin Mhic Giollarnáth. Tabhair faoi deara nach bhfuil na sonraí seo tiontaithe fós go formáid atá inghlactha d’ionghabháil go DRI.

Tacaíonn samhail an DCMI le hidir-inoibritheacht mar gur féidir caighdeáin ionchódaithe sheachtracha a úsáid d’eilimintí meiteashonraí ar leith.  Chuige seo, bhain muid úsáid as caighdeáin choitianta atá in úsáid go forleathan: ISO 8601 do théarmaí teamparálta (m.sh. BBBB-MM-LL) agus ISO 639 d’aitheantóirí teanga (m.sh. ga, en).  Rinne muid formáidiú ar ainmneacha pearsanta (bhí siad le feiceáil sna téarmaí Creator, Producer, Host agus Contributor) de réir  treoirlínte atá luaite in Irish Guidelines for Indexing Archives (2013).  Cé go raibh muid in ann formhór na n-ainmneacha pearsanta a fhormáidiú de réir na dtreoirlínte sin, bhí roinnt eisceachtaí ann, leasainmneacha agus aitheantóirí clainne neamhfhoirmiúla ina measc.  Freisin, nuair a chonaic muid an deis, d’úsáid muid stórtha focal rialaithe (Bair & Carlson, 2008) – go háirithe an stór focal Library of Congress Subject Headings, nó LCSH (Stone, 2000).  Cuidíonn stór focal rialaithe le comhsheasmhacht a chinntiú i dtéarmaí a bhaineann le hábhar, agus cuireann sé barr feabhais ar thorthaí an chuardaigh don úsáideoir deiridh.  Thug muid faoi deara le linn na hoibre seo an laghad acmhainní ar nós stórtha focal rialaithe, ointeolaíochtaí agus stórchistí atá ar fáil i nGaeilge.  Léiríonn Tábla 1 luachanna na dtéarmaí DCMI d’oibiacht dhigiteach shamplach ó Bhailiúchán Sheáin Mhic Giollarnáth.

4.3 Meiteashonraí Dátheangacha i mBailiúchán Mhic Giollarnáth

Is comhchuid chriticiúil de thaisclann dhátheangach iad meiteashonraí dátheangacha, agus cruthaíodh a leithéid ag úsáid meascán de mhodhanna traidisiúnta (aistriúchán) agus saibhriú sonraí, próiseas ina gcuirtear sonraí i gcomhthéacs agus ina gcuirtear faisnéis nua leo, .i. nascadh le hacmhainní seachtracha ar nós stórtha focal rialaithe nó bunachair shonraí (féach Berardi et al., 2012).

Bhí a dhúshlán uathúil féin ag gach téarma DCMI nuair a rinneadh iarracht gné dhátheangach a thabhairt dó.  I measc na réiteach ba shimplí, d’úsáid muid eilimintí DCMI ar leith go heisiach i dteanga amháin.  Mar shampla, d’úsáid muid Alternative Title (ainm malartach don oibiacht) mar théarma forchoiméadta chun aistriúchán Béarla a thabhairt don teideal Gaeilge (Title) dá mba ghá. Tá tréith in-athdhéanta ag téarmaí DCMI (is féidir iad a úsáid níos mó ná uair amháin d’aon oibiacht ar leith) – rud a thug an deis dúinn réiteach dátheangach eile a chur i bhfeidhm ar roinnt téarmaí.  Mar shampla, thóg muid orainn féin an téacs Gaeilge sa gcur síos (Description), a aistriú go Béarla agus d’úsáid muid an téacs Béarla seo don dara téarma Description.  Dár ndóigh, d’fhéadfaí an cur chuige seo a dhéanamh in athuair le teangacha eile. Tá cur síos níos mine faoin bpróiseas seo i Coll & Ó Tuairisg (2015).

D’úsáid muid dhá leagan den téarma Subject freisin. Bhí muid ábalta ceann acu a nascadh leis an tseirbhís sonraí nasctha saor-rochtana atá ag an LCSH (mar gur lean muid stór focal rialaithe an LCSH nuair a chruthaigh muid eochairfhocail d’ábhar na hoibiachta).  D’úsáid muid an leagan eile de Subject don aistriúchán Gaeilge, ach nasc muid é seo chuig LCSH freisin, ionas nach mbeadh an t-úsáideoir le Gaeilge faoi mhíbhuntáiste.

D’úsáid muid teicneolaíochtaí nasctha sonraí ar bhealaí eile, chomh maith. Rinne muid gach tagairt do logainmneacha a asbhaint as Description, agus chuireamar isteach san eilimint Spatial iad.  Rinne muid caighdeánú ar litriú na logainmneacha seo mar go raibh bealaí éagsúla á n-úsáid chun na logainmneacha céanna a litriú sna lámhscríbhinní.  Rinneadh imréiteach idir an tacar seo agus seirbhís sonraí nasctha de chuid Bhunachair Logainmneacha na hÉireann[10].  Cuireann an nascadh seo, idir na sonraí agus tacar seachtrach ar ár gcumas, ag úsáid comhéadan feidhmchláir an DRI, faisnéis bhreise ar nós comhordanáidí geospásúla[11] agus aistriúcháin Ghaeilge/Bhéarla de logainmneacha a asbhaint.

Agus é seo déanta againn, bhí orainn bealach a aimsiú le hidirdhealú a dhéanamh idir téarmaí DCMI comhchosúla, nach bhfuil sa difríocht eatarthu ach an teanga atá in úsáid. Maíonn Stiller et al. (2014)  ‘a first step for increasing multilingual access to cultural heritage content is to indicate the language of your metadata’. Mar sin, chlibeáil muid na heilimintí DCMI cuí ag úsáid na feidhmiúlachta XML[12]  xml:lang=”??” , áit gurb ionann ‘??’ agus an cód teanga cuí, m.sh. ga, en.

Déanann na próisis seo go léir claochlú iomlán ar na meiteashonraí.  Tá leagan samplach de na meiteashonraí saibhrithe seo, mar a bhreathnaíonn sé i bhformáid XML, le feiceáil i bhFigiúr 2. Léiríonn sé seo na meiteashonraí do chomhad fuaime ó chartlann RTÉ Raidió na Gaeltachta. Tá an comhad XML seo ag déanamh tagartha do mhír fuaime ina bhfuil sliocht ó fhoilseachán Mhic Giollarnáth Annála Beaga ó Iorrus Aithneach á léamh ag Liam Mac Con Iomaire.  Léiríonn Figiúr 2 conas a rinneadh ionchódú ar na heilimintí DCMI chun an fheidhmiúlacht dhátheangach sna meiteashonraí agus sa Taisclann a chumasú. Tabhair faoi deara na naisc chuig seirbhísí sonraí nasctha saor-rochtana éagsúla atá le feiceáil sna heilimintí Subject agus Spatial.  Is san fhormáid XML seo a dhéantar ionghabháil ar an oibiacht dhigiteach isteach sa taisclann.

Figiúr 2: Comhad XML réitithe i gcomhar ionghabhála go DRI. Is cur síos é seo ar mheiteashonraí mhír fuaime ó Chartlann Raidió na Gaeltachta.

5. An Bailiúchán ar DRI

5.1 An tÁbhar agus an Comhéadan Dátheangach

Figiúir 3: Fo-bhailiúcháin Sheáin Mhic Giollarnáth, mar atá siad le feiceáil ar DRI.

Tá ábhar Sheáin Mhic Giollarnáth leagtha amach sa taisclann mar shraith de chúig fho-bhailiúchán éagsúil – leathanaigh scanta agus tras-scríofa, lámhscríbhinní scanta agus tras-scríofa, agus míreanna fuaime. Déanann an t-úsáideoir ionramháil, cuardach agus anailís ar na hoibiachtaí seo trí chomhéadan an úsáideora. Dar le Stiller et al. (2015) is é comhéadan an úsáideora (user interface, nó UI) an ghné is tábhachtaí de thaisclann ar bith – ach cúram ceart a bheith déanta do theanga an úsáideora:

The user interface is the first encounter the users have with the cultural heritage information system. It is what greets them and invites to explore and engage with the cultural collection – ideally in a language the users understand. (2015:13)

Tá DRI deartha le comhéadan úsáideora dátheangach (Gaeilge agus Béarla). Chun é seo a chur ar fáil, bhí orainn gach téacs atá ar leathanaigh statacha agus ar an gcomhéadan a aistriú. Áirítear sna leathanaigh statacha téacs eagarthóireachta, ráitis agus comhaontaithe dlíthiúla. I measc na ngnéithe a bhí i dtéacs an chomhéadain bhí: tacar nod; foláirimh, téacs ainlithe, míreanna aníos, srl. do na grúpaí úsáideoirí éagsúla. Tá na cuir chuige agus na dúshláin a bhain leis an obair seo leagtha amach ag Coll & Ó Tuairisg (2015).

Agus an t-úsáideoir ag brabhsáil an ábhair, is féidir leis/léi teanga an chomhéadain a bhabhtáil idir Gaeilge agus Béarla. Ionas nach ndéantar leatrom ar cheachtar pobal teanga is í an teanga réamhshocraithe an teanga sin a bhí in úsáid sa seisiún deiridh (atá stóráilte i bhfianán). Ní aistrítear teanga na meiteashonraí san fheidhmiúlacht seo, ach taispeántar leagan Gaeilge de theideal na dtéarmaí DCMI (Cruthaitheoir, Dáta, srl.) sa chomhéadan Gaeilge. Ní aistriúcháin oifigiúla iad seo ar théarmaí an DCMI agus, de réir dea-chleachtais i dtaisclann iontaofa, ní thagann aon athrú ar bhun-mheiteashonraí na hoibiachta. Léiríonn Figiúr 3 thíos comhéadan Gaeilge (ar dheis) agus Béarla (ar chlé) an DRI, nuair atáthar ag taispeáint oibiacht dhigiteach.

Figiúr 4: Comhéadan Gaeilge (ar chlé) agus Béarla (ar dheis) an DRI nuair atá oibiacht dhigiteach á taispeáint.

5.2 Ag Amharc ar na Meiteashonraí

Figiúr 5: Comhéadan an DRI ag léiriú go bhfuil cur síos Béarla an bhailiúcháin folaithe.

Bhí orainn meiteashonraí na Taisclainne a léiriú go soiléir agus go comhsheasmhach, i gceachtar nó sa dá theanga, d’úsáideoirí an DRI, ach gan eispéireas an úsáideora a chur i mbaol. Mar nach raibh muid ag iarraidh breithiúnas a thabhairt ar shainrogha teanga an úsáideora roimh ré, bhí sé seo le déanamh beag beann ar cén teanga a roghnaigh an t-úsáideoir don chomhéadan. Bhí dúshlán leis seo nuair a bhí lear mór téacs i gceist, go háirithe leis an téarma Description. Ní raibh sé idéalach dhá bhloc mór téacs a thaispeáint sa dá theanga, fiú dá ndéanfadh clófhoirne éagsúla idirdhealú eatarthu. Freisin, dá léireodh muid bloc mór téacs Gaeilge os cionn an téacs Béarla d’fhéadfaí drochmhisneach a chur ar an té gan Ghaeilge (go háirithe mura mbeadh an Béarla le feiceáil ar an scáileán gan scrollú a dhéanamh) agus vice versa.

Mar réiteach, tugann DRI an deis don úsáideoir nasc a chliceáil, ar cheann den dá théarma meiteashonraí Description, a íoslaghdaíonn téacs an téarma sin (úsáideann an córas an aitreabúid xml:lang). Fanann sé íoslaghdaithe le linn an tseisiúin bhrabhsála nó go huasmhéadaítear arís é. Feiceann an t-úsáideoir go bhfuil an dá chur síos ann don oibiacht, ach is féidir leis/léi an ceann is lú tábhacht dó/di a íoslaghdú. Léirítear an coincheap seo i bhFigiúr 4, ina bhfuil an cur síos Béarla i bhfolach agus an cur síos Gaeilge le feiceáil.

Chuir muid an córas seo i bhfeidhm do mheiteashonraí ag leibhéal na hoibiachta ar DRI, chomh maith le leibhéal an bhailiúcháin, áit a mbíonn blocanna móra téacs sa chur síos. Tá an fheidhmiúlacht seo neamhspleách ar theanga chomhéadan an úsáideora, agus ní chuireann sé isteach ar an bpróiseas cuardaithe (tá an t-úsáideoir in ann cuardach a dhéanamh sna réimsí atá i bhfolach freisin).

6. Conclúid agus Obair sa Todhchaí

Figiúr 6: Sreabhchairt ag léiriú na bpróiseas atá luaite sa pháipéar seo agus a cuireadh i bhfeidhm ar an tacar sonraí roimh phróiseas ionghabhála DRI.

Taispeánann Figiúr 6 na próisis a cuireadh i bhfeidhm ar an tacar sonraí sula ndearnadh na comhaid a ionghabháil isteach i dTaisclann Dhigiteach na hÉireann.

Léirigh muid san alt seo an dul chun cinn atá déanta againn Bailiúchán Sheáin Mhic Giollarnáth a ullmhú agus a chur i láthair ar ardán cartlannaíochta an DRI. Cé gur mó ama i bhfad a thóg an próiseas digitithe agus coimeádaithe, is san obair ar na meiteashonraí is mó atá tairbhe fhadtréimhseach le feiceáil don úsáideoir. Bhain cuid den obair seo le teicníochtaí éagsúla a fhorbairt agus a chur i bhfeidhm d’fhonn ábhar aonteangach a chur ar fáil ar ardán dátheangach. Chuige seo, chonaic muid bealaí gur féidir leis an tsamhail mheiteashonraí DCMI lear suntasach de mheiteashonraí dátheangacha a stóráil.

Bhí orainn saintréithiúlacht na mbailiúchán a thógáil san áireamh san obair seo, ábhar a cruthaíodh sna 30aí agus lenar chuireamar breisluach ag úsáid teicneolaíochtaí comhaimseartha.  Le linn na hoibre seo freisin bhí orainn machnamh a dhéanamh ar an raon leathan úsáideoirí éagsúla, le cumais dhifriúla i nGaeilge – ó chainteoirí líofa go daoine gan ach fíorbheagán Gaeilge acu.  Úsáideadh cuid de na teicníochtaí seo cheana, ach níor cuireadh i bhfeidhm ar an nGaeilge mar seo iad. Tá cuid eile nuálach, ina measc ag tabhairt smacht neamhspleách don úsáideoir ar theanga an chomhéadain agus ar theanga na meiteashonraí.

Ag teacht leis an tacaíocht a thugann DRI do na prionsabail a bhaineann le rochtain oscailte ar shonraí, tá torthaí an aistriúcháin ar fáil go hoscailte agus go poiblí. Maidir le hobair sa todhchaí, léirigh muid an easpa acmhainní Gaeilge atá ar fáil i réimse an chartlannaithe dhigitigh, acmhainní ar nós stórtha focal rialaithe, ointeolaíochtaí agus stórchistí.  Thug muid faoi deara freisin nach bhfuil leagan Gaeilge fós ar fáil de scéimre an DCMI.

Ar deireadh, bunaíodh go leor d’fheidhmiúlacht dhátheangach DRI ar an ábhar cartlainne a luadh sa pháipéar seo – de réir mar a thiocfaidh méadú ar an líon ábhair trí Ghaeilge atá ar fáil ar DRI tiocfaidh riachtanais eile teanga aníos. Sa bhreis air sin, níor déanadh mórán plé ar na huirlisí agus na bogearraí tríú páirtí a bheas ag ionramháil agus ag déanamh anailíse ar na hoibiachtaí digiteacha seo, agus conas a rachaidh siadsan i ngleic le hábhar cartlainne trí Ghaeilge. Cé go bhfuil an Taisclann seolta agus an t-ábhar ar fáil, níl deireadh leis an obair atá le déanamh an Ghaeilge a chur ar chomhchéim leis an Béarla sa réimse seo. Mar fhocal scoir, tá Bailiúchán Sheáin Mhic Giollarnáth ar fáil anois ar http://repository.dri.ie.

 

 

[1]       Is leagan fíorúil, digiteach d’acmhainn fhisiciúil atá san ‘oibiacht dhigiteach’ – téarma atá in úsáid go forleathan sa pháipéar seo.

 

[2]       Resource Description Framework

 

[3]       Web Ontology Language

 

[4]       SPARQL Protocol and RDF Query Language (acrainm athchúrsach)

 

[5]       Tagged Image File Format, formáid atá aitheanta mar chaighdeán caomhnaithe.

 

[6]       Portable Document Format

 

[7]          Is féidir oibiachtaí a lua in DRI – mar shampla:
Mac Giollarnáth, Seán (1932). Seán Mac Giollarnáth: Lámhscríbhinn 59, Lth 91, Digital Repository of Ireland [Distributor], Ollscoil na hÉireann, Gaillimh [Depositing Institution], DOI: 10.7486/DRI.95943v70h.

 

[8]       API, nó Application Program Interface

 

[9]       Tá liosta iomlán de théarmaí an DCMI ar fáil ag http://dublincore.org/documents/dcmi-terms/.

 

[11]     Baintear úsáid astu seo in uirlisí éagsúla mapála ar DRI.

 

[12]     EXtensible Markup Language

 

 

Leabharliosta: 

Bair, S. & Carlson, S., (2008) ‘Where keywords fail: using metadata to facilitate digital humanities scholarship.’ Journal of Library Metadata, 8, 249-62.

Berardi, G., Esuli, A., Gordea, S., Marcheggiani, D. & Sebastiani, F., (2012) ‘Metadata enrichment services for the europeana digital library.’ Theory and Practice of Digital Libraries. Springer.

Brennan, R. & Feeney, K. C., (2013) Publishing social sciences datasets as linked data: a political violence case study.

Bustillo, M., Collins, S., Gallagher, D., Grant, R., Harrower, N., Kenny, S., Martínez García, A., Ní Cholla, R., O’Carroll, A., Redmond, S. & Webb, S., (2015) Qualified Dublin Core and the Digital Repository of Ireland. Maynooth: Maynooth University; Dublin: Trinity College Dublin; Dublin: Royal Irish Academy; Galway: National University of Ireland, Galway.

Carew, M., Green, J., Kral, I., Nordlinger, R. & Singer, R., (2015) Getting in Touch: Language and Digital Inclusion in Australian Indigenous Communities.

Coll, R. & Ó Tuairisg, S., (2015) ‘Preparing Bilingual Metadata for a Bilingual Repository.’ New Review of Information Networking. 20, 53-8.

Conway, P., (1990) ‘Archival preservation practice in a nationwide context.’ The American Archivist. 204-22.

Gorter, D., (2015) ‘Multilingual interaction and minority languages: Proficiency and language practices in education and society.’ Language Teaching. 48, 82-98.

Hakala, J., (2000) Dublin core metadata initiative. CRIS 2000-Current Research Information Systems.

Ham, K., (2013) OpenRefine (version 2.5). Journal of the Medical Library Association. 101, 233-5.

Harper, C. A. & Tillett, B. B., (2007) ‘Library of Congress controlled vocabularies and their application to the Semantic Web.’  Cataloging & classification quarterly. 43, 47-68.

Harrower, N., Webb, S., Tang, J., Gallagher, D., Kilfeather, E., O’Tuairisg, S. & Collins, S., (2013) ‘Developing the Irish National Trusted Digital Repository for the Humanities and Social Sciences: an interdisciplinary approach.’  OR2013.

Hedstrom, M., (1997) ‘Digital preservation: a time bomb for digital libraries.’ Computers and the Humanities. 31, 189-202.

Hernández, M. A. & Stolfo, S. J., (1998) ‘Real-world data is dirty: Data cleansing and the merge/purge problem.’  Data mining and knowledge discovery. 2, 9-37.

McCarthy, K., (2015) Metadata Quality Control. Dublin: Royal Irish Academy: Royal Irish Academy.

Nichols, D. M., Witten, I. H., Keegan, T. T., Bainbridge, D. & Dewsnip, M., (2005) ‘Digital libraries and minority languages.’  New Review of Hypermedia and Multimedia. 11, 139-55.

O’Carroll, A. & Webb, S., (2012) Digital Archiving in Ireland: National Survey of the Humanities and Social Sciences. National University of Ireland, Maynooth: National University of Ireland, Maynooth.

Petersen, P., (2015) ‘Beyond borders: Digital tablets as a resource for preschool children’s communication in a minority language.’  Designs for Learning.

Pinfield, S., Salter, J., Bath, P. A., Hubbard, B., Millington, P., Anders, J. H. & Hussain, A., (2014) ‘Open‐access repositories worldwide, 2005–2012: Past growth, current characteristics, and future possibilities.’  Journal of the Association for Information Science and Technology. 65, 2404-21.

Ross, S., (2012) ‘Digital preservation, archival science and methodological foundations for digital libraries.’  New Review of Information Networking. 17, 43-68.

Shiri, A., (2014) ‘Linked data meets big data: A knowledge organization systems perspective.’  Advances in Classification Research Online. 24, 16-20.

Stiller, J., Petras, V. & Gäde, M., (2015) MS12: White Paper on Best Practices for Multilingual Access to Digital Libraries. ‘s-Gravenhage: Europeana.

Stiller, J., Petras, V., Gäde, M. & Isaac, A., (2014) ‘Automatic Enrichments with Controlled Vocabularies in Europeana: Challenges and Consequences.’  Digital Heritage. Progress in Cultural Heritage: Documentation, Preservation, and Protection. Springer.

Stone, A. T., (2000) ‘The LCSH century: A brief history of the library of congress subject headings, and introduction to the centennial essays.’  Cataloging & classification quarterly. 29, 1-15.

Strodl, S., Becker, C., Neumayer, R. & Rauber, A., (2007) ‘How to choose a digital preservation strategy: Evaluating a preservation planning procedure.’  Proceedings of the 7th ACM/IEEE-CS joint conference on Digital libraries. ACM, 29-38.

Verborgh, R. & De Wilde, M., (2013) Using OpenRefine, Packt Publishing Ltd.

Webb, S. & McGoohan, C., (2015) Digital Repository of Ireland: Requirements. National University of Ireland Maynooth.

Wu, D., He, D. & Luo, B., (2012) ‘Multilingual needs and expectations in digital libraries: a survey of academic users with different languages.’  The Electronic Library. 30, 182-97.