Y Trawsgrifiwr

Mae’r Trawsgrifiwr yn rhaglen feddalwedd sydd yn trawsgrifio lleferydd Cymraeg yn destun.

Gallwch naill ai gysylltu gyda gwasanaeth allanol fel YouTube i isdeitlo fidoes, clicio neu ollwng i mewn i ffeiliau gan ddefnyddio’r rhyngwyneb ar-lein, neu recordio llais yn uniongyrchol o’r microffon. Mae’r Trawsgrifiwr yn cael ei adolygu a’i diweddaru yn barhaus, ac mae bellach ar gael ar dri llwyfan.

Cywiro a chopio

Er nad ydi’r Trawsgrifiwr yn adnabod geiriau’n iawn pob amser, mewn arbrofion syml, mae’r fersiwn cychwynnol hwn yn deall tua 85% o eiriau mewn brawddeg mewn Cymraeg safonol. Fe welwch y canlyniadau yn y blwch testun ble mae modd i chi gywiro unrhyw wallau a chopïo’r testun i’r clipfwrdd er mwyn eu gludo i unrhyw feddalwedd ar eich cyfrifiadur.

Technolegau iaith o fewn Y Trawsgrifiwr

Prif sail Y Trawsgrifiwr yw DeepSpeech gan Mozilla. Mae DeepSpeech yn beiriant adnabod lleferydd y gellir ei hyfforddi a’i gynnwys yn hwylus o fewn unrhyw becyn meddalwedd. Mae modd dysgu mwy aam DeepSpeech yma.

Gwnaed y Trawsgrifiwr Cymraeg yn bosibl diolch i brojectau a chydweithrediad rhwng Mozilla, gwirfoddolwyr, ac Uned Technolegau Iaith, Canolfan Bedwyr, Prifysgol Bangor. Ariannwyd rhan Prifysgol Bangor yn y fenter, gan gynnwys datblygu’r Trawsgrifiwr a’r Ap Macsen (y Cynorthwyydd Personol Cymraeg) gan Lywodraeth Cymru.

Mae hel casgliadau enfawr o recordiadau yn hanfodol i hyfforddi peiriant adnabod lleferydd. Rydym wedi gwneud hynny yn bennaf drwy gyfrwng Common Voice, sef llwyfan Mozilla i gasglu lleisiau pobl yn darllen yn uchel frawddegau penodol. Rydym yn ddiolchgar iawn i Rhoslyn Prys (meddal.com) a ymgymerodd â nifer o ymgyrchoedd torfoli ar sail wirfoddol, i’r Mentrau Iaith, Cyngor Gwynedd, Llyfrgell Genedlaethol Cymru a weithiodd gyda Rhoslyn ar rai o’r ymgyrchoedd hyn, hefyd i Lywodraeth Cymru am eu hymgyrch gyhoeddusrwydd hwy, ac i liaws o gyfranogwyr ar draws Cymru a thu hwnt sydd wedi cyfrannu eu lleisiau i’r Common Voice Cymraeg.

Hoffem ni ddiolch hefyd i Centre Inria de Paris am gorpws agored OSCAR sydd yn cynnwys casgliad mawr o destunau Cymraeg wedi’u crafu o’r we. Rydym wedi defnyddio’r corpws i hyfforddi modelau o eirfa a ieithwedd Cymraeg er mwyn cynorthwyo’r broses adnabod ac i ffurfio canlyniadau cywirach. Ewch i https://traces1.inria.fr/oscar/ am ragor o wybodaeth.

Adnoddau cod agored i ddatblygwyr

Angen: Cod i’r Trawsgrifiwr / Dolen dogfennaeth