Symud i'r prif gynnwys
Dwy bobl yn gweithio wrth liniadur yn Llyfrgell Genedlaethol Cymru.

13 Mawrth 2025

Mae miliynau o eitemau o dan ofal Llyfrgell Genedlaethol Cymru, o ddeunydd printiedig fel llyfrau, cyfnodolion a phapurau newydd i baentiadau, ffotograffau a mapiau, ynghyd â’n Harchif Ddarlledu Genedlaethol newydd. Mae gan yr holl gasgliadau yma ddata; data sy'n disgrifio'r eitemau, trawsgrifiadau o ddogfennau unigol a data am y bobl a'r lleoedd sy’n rhan o’r casgliadau hynny. Defnyddir y data cyfoethog yma ar gyfer ymchwil ac i helpu ein defnyddwyr i lywio ac archwilio casgliadau enfawr.

Y syniad o “Hacathon” yw gwahodd pobl greadigol a thechnegol i ddadansoddi, gwella ac adeiladu offer gan ddefnyddio'r data hwn. Mae’n gyfle i’r cyhoedd ymgysylltu â’n casgliadau mewn ffyrdd newydd, ond mae hefyd yn gyfle i archwilio a dogfennu posibiliadau newydd ar gyfer offer, gwasanaethau a phrosiectau ymchwil gan ddefnyddio’r data yn ein gofal.

Yr Hacathon Hanes yw ein dathliad o ddata, technoleg a bod yn agored, ac yn gydnabyddiaeth o’i bwysigrwydd strategol i ni fel gwasanaeth cyhoeddus sy’n wynebu technolegau sy’n datblygu’n gyflym fel AI a rhith-realiti. Mae hefyd yn gyfle i hyrwyddo a chefnogi’r defnydd o’n data ar gyfer offer a chymwysiadau sy’n canolbwyntio ar y Gymraeg.

Roedd ein cyfranogwyr yn cynnwys myfyrwyr cyfrifiadureg o Brifysgol Aberystwyth, arbenigwyr mapio, technolegwyr Cymraeg, artist, llyfrgellydd digidol a rhaglenwyr cyfrifiaduron.

Yn dilyn cyflwyniad byr i'r setiau data a oedd ar gael ar gyfer y diwrnod, aeth yr hacwyr ati ac o fewn ychydig oriau byr cynhyrchwyd ystod o allbynnau anhygoel.

Roedd mapiau’n boblogaidd eleni, gyda nifer o bobl yn gweithio ar ddata Mapiau Degwm o’n gwefan Lleoedd.Llyfrgell.Cymru. Bu Rupert, sy’n gweithio ar greu data cymunedol ar OpenStreetMap, yn gweithio i gyfuno data torfol modern fel enwau caeau, a gasglwyd yn y gymuned, â data a gymerwyd o’r arolwg Degwm yn y 1840au. A defnyddiodd Ben yr un data i greu map defnydd tir arddull modern gyda’r nod o allu cymharu data defnydd tir hanesyddol yn hawdd â data modern. Creodd cyfranogwr arall fap o dir mwyaf gwerthfawr Gogledd Cymru adeg arolwg y Degwm.

Datblygwyd syniad mapio gwych arall gan Carl drwy gymryd data ar gyfer Deiseb Heddwch Menywod Cymru a cheisio alinio’r cyfeiriadau a roddwyd gan y menywod gan ddefnyddio data mapio modern er mwyn mapio cartrefi’r llofnodwyr. Llwyddodd Carl i adeiladu prototeip sylfaenol ac mae'n bwriadu archwilio'r syniad ymhellach.

Bu Illtud hefyd yn gweithio ar ddata’r Ddeiseb Heddwch i ddadansoddi amlder y rhai na allent lofnodi eu henwau eu hunain mewn gwahanol rannau o Gymru. Roedd canlyniadau rhagarweiniol yn awgrymu lefel is o lythrennedd mewn siroedd gwledig yn bennaf, fel Ceredigion a Sir Gaerfyrddin.

Bu cyfrannwr arall yn arolygu sgiliau Cymraeg model AI Tsieineaidd newydd, DeepSeek, gyda chanlyniadau addawol, o ran ei allu i ddeall ac ateb cwestiynau yn Gymraeg, ond hefyd o ran ansawdd a chywirdeb yr atebion i gyfres o gwestiynau.

Papurau Newydd Cymru yw ein set ddata unigol fwyaf gyda miliynau o erthyglau yn ymdrin â phob math o bynciau, ac roedd nifer o gyfranogwyr yn awyddus i archwilio’r posibiliadau.

Rhannodd Mike declyn medrus iawn sy’n gallu cymryd erthyglau o’r papurau newydd a’u crynhoi gan ddefnyddio model AI bach, wedi’i gynnal yn lleol, ac yna ei brosesu gan ddefnyddio offer testun-i-leferydd fel y gellir ei ddarllen yn steil adroddiad newyddion.

Gan gydnabod y datblygiadau technolegol diweddar, cymharodd Glen ddata OCR o bapurau newydd Cymru, cafodd ei greu deng mlynedd yn ôl, â data ar gyfer yr un testun a broseswyd gan ddefnyddio’r offer diweddaraf. Yn syndod, nid oedd tystiolaeth glir o unrhyw welliant nodedig, fodd bynnag, awgrymwyd y gallai LLMs (Large Language Models) gynnig gwelliannau mwy nodedig i’r ansawdd.

Dechreuodd Simon weithio ar declyn i dynnu data yn ymwneud â llongau yng Nghofnodion Llongau Aberystwyth o erthyglau perthnasol yn y papurau newydd. Llwyddodd i gael y data perthnasol allan o'r papurau newydd ac mae'n bwriadu parhau i archwilio'r syniad.

Roedd yn wirioneddol drawiadol gweld faint y gellid ei gyflawni mewn cyfnod mor fyr, ac rydym yn hynod ddiolchgar i’n holl gyfranogwyr am y gwaith caled, creadigol a meddylgar. Rydym yn gobeithio sefydlu ein Hacathon fel digwyddiad blynyddol i annog mwy o ymgysylltu â’n data drwy gydol y flwyddyn.

Jason Evans,

Rheolwr Data Agored