Gwefannau a thudalennau gwe

Mae gan y Llyfrgell Brydeinig a Llyfrgelloedd Adnau Cyfreithiol eraill hawl i gopïo deunydd a gyhoeddwyd yn y Deyrnas Unedig o’r rhyngrwyd i’w archifo o dan adneuo cyfreithiol. Proses awtomatig yw cywain y we a ddefnyddir i gasglu cynnwys a metadata sydd ar gael heb gyfyngiad mynediad ar y we agored.

Mae’r Llyfrgelloedd Adnau Cyfreithiol yn defnyddio meddalwedd cywain y we lle bynnag y bo modd, yn enwedig wrth gasglu ar gyfer Archif Gwe’r Deyrnas Unedig, ond gallant hefyd lawrlwytho cynnwys a metadata â llaw neu drwy ddulliau eraill pan fo angen.

Caiff ‘rhestr hadu’ o gyfeiriadau parth ei rhaglennu i mewn i feddalwedd cywain y we ar ffurf Lleolwyr Adnoddau Unffurf (Uniform Resource Locators – URLs). Bydd y meddalwedd yn defnyddio’r rhain i gychwyn y broses, gan ofyn am gopi o’r gwreiddyn neu’r hafan; wedyn bydd yn dilyn dolenni’n awtomatig i’r lefelau nesaf i lawr o fewn yr un parth, gan wneud cais ar wahân ar gyfer pob URL a nodir. Bydd y gwefannau a dargedir yn ymateb yn awtomatig, gan gyflwyno copi o’r dudalen neu’r ffeil y mae’r URL yn perthyn iddi.

Mae meddalwedd cywain y we wedi’i raglennu hefyd â rheolau a pharamedrau cwrteisi gyda’r bwriad o sicrhau na cheir dim effaith niweidiol ar berfformiad y wefan darged. Er enghraifft, maent yn cynnwys terfyn ar nifer y lefelau a fydd yn cael eu cywain neu faint o gynnwys y gofynnir i wefan unigol ei roi. Hefyd, pan wneir sawl cais am wahanol dudalennau a ffeiliau i’r un wefan, mae’r meddalwedd wedi’i raglennu i adael bwlch rhwng pob cais, er mwyn peidio defnyddio ystod rhy eang a gorlwytho’r wefan.

Mae meddalwedd cywain y we yn defnyddio protocolau awtomatig safonol i ddangos ei hun ac i hysbysu gwefeistr y cyhoeddwr (drwy wybodaeth a elwir yn “llinyn defnyddiwr-asiant” a gyflwynir i lòg y gwe-weinydd o geisiadau gweinydd) bob tro y llusgir tudalen. Gall y gwefeistr ddewis defnyddio’r wybodaeth hon neu beidio, ond nid oes raid iddo gymryd unrhyw gamau fel newid ffeil ganiatâd “robots.txt” y wefan.

Lle bydd meddalwedd cywain y we yn dod ar draws cyfleuster mewngofnodi, ni all gael mynediad at unrhyw ddeunydd y tu ôl i’r cyfleuster mewngofnodi heb y cyfrinair neu’r hawl mynediad priodol.

Caiff gwefannau a deunydd a gynaeafwyd eu cadw yn archifau gwe’r Llyfrgelloedd Adnau Cyfreithi