Testun-i-leferydd

Mae technolegau testun-i-leferydd yn caniatáu i system gyfrifiadurol lefaru unrhyw destun gyda llais synthetig neu naturiol.
Gall y testun ddeillio o ddogfennau, gwefan, negeseuon testun neu system meddalwedd wedi’i mewnblannu (lle nad oes modd dangos testun ar sgrin). Mae adnoddau testun-i-leferydd Cymraeg y Porth Technolegau Iaith wedi’i seilio ar systemau cod agored. Gewch arbrofi gyda’n gwahanol adnoddau testun-i-leferydd trwy bori tts.techiaith.cymru.


Orpheus-TTS
Mae Orpheus-TTS gan Canopy AI yn un o’r systemau testun-i-leferydd cod agored mwyaf datblygedig, ac fe’i hadeiladwyd yn wreiddiol ar ben Llama-3b. Mae’n cynhyrchu lleisiau sy’n swnio’n naturiol gydag emosiwn realistig, tôn gynnil, a rhythm sy’n cystadlu â (ac yn aml yn rhagori ar) wasanaethau cod gaeedig. Gall gynhyrchu lleisiau newydd heb hyfforddiant hir ac mae’n cefnogi rheolaeth fynegiannol trwy dagiau emosiwn syml gan ei wneud yn ddelfrydol ar gyfer cymwysiadau amser real. Mae ein fersiwn wedi’i mireinio o Orpheus-TTS yn cynnig:
- Lleisiau Cymraeg dilys: Wedi’u hyfforddi ar ddata Cymraeg o ansawdd uchel, gan gynnwys lleferydd naturiol a phatrymau tôn brodorol.
- Cywirdeb a chysondeb: Wedi’u tiwnio’n ofalus i drin strwythur sain a rhythm unigryw lleferydd Cymraeg.
- Tagiau emosiwn penodol i’r Gymraeg: Ychwanegwch giwiau fel <chwerthin> neu <anadlu> ar gyfer lleferydd sy’n llawn mynegiant ac sy’n ffyddlon i’n diwylliant.

Enghreifftiau o Orpheus ar waith


Piper
Rydym wedi mireinio Piper i’w ddefnyddio gyda’r iaith Gymraeg. Am y tro cyntaf, gall datblygwyr, addysgwyr a chrewyr gael mynediad at leisiau naturiol, dilys Cymraeg sy’n rhedeg mewn amser real — hyd yn oed ar ddyfeisiau bach fel Raspberry Pi.
Beth yw Piper?
Mae Piper yn beiriant TTS cod agored, modern, wedi’i gynllunio ar gyfer cyflymder ac ansawdd. Mae’n troi testun yn lleferydd naturiol gyda’r cuddni lleiaf, a gellir ei redeg ar ystod eang o galedwedd, o liniaduron i systemau mewnosodedig. Mae’n syml i’w integreiddio, yn ysgafn, ac yn gallu cynhyrchu lleferydd mewn amser real — gan ei wneud yn berffaith ar gyfer technoleg gynorthwyol, dyfeisiau clyfar ac apiau rhyngweithiol.
Enghreifftiau o Piper ar waith
Lleisiau TTS drwy REST API (Seiliedig ar y Cwmwl)
Llif Gwaith:
- Mae Cymhwysiad Cleient (ap symudol, ap gwe, gweinydd) yn anfon cais at API TTS REST.
Cais HTTP POST gyda:- testun → y testun mewnbwn i’w drosi.
- llais → y model llais a ddewiswyd (e.e., “piper/benyw-de”, “orpheus/gwryw-gogledd”).
- Mae Peiriant TTS Cwmwl yn prosesu’r cais.
- Mae’r darparwr yn defnyddio model llais niwral wedi’i hyfforddi ar setiau data mawr.
- Yn cynhyrchu sain ar unwaith.
- Anfonir ymateb yn ôl gyda ffeil/ffrwd sain.
- Gall y cleient ei chwarae, ei lawrlwytho, neu ei storio.
Manteision:
- Mynediad at leisiau niwral o ansawdd uchel.
- Amrywiaeth o ieithoedd ac acenion.
- Dim angen cyfrifiadura lleol (cleient ysgafn).
Anfanteision:
- Angen cysylltedd rhyngrwyd.
- Mae’r cuddni’n dibynnu ar gyflymder y rhwydwaith.
Cliciwch yma am ragor o wybodaeth
Lleisiau TTS All-lein (Ar y Ddyfais)
Mae TTS all-lein yn golygu bod y model yn rhedeg yn lleol heb alw API o bell.
Dulliau:
- Peiriannau TTS Mewnosodedig (traddodiadol, ôl-troed llai):
- e.e., espeak, Festival, MaryTTS, Piper.
- Ysgafn, ond gall swnio fel robotiaid.
- Modelau TTS Niwral ar y Ddyfais:
- Defnyddio modelau TTS dysgu dwfn wedi’u hyfforddi ymlaen llaw yn lleol.
- Enghreifftiau: Coqui TTS, Orpheus.
- Gall redeg ar CPU/GPU, yn dibynnu ar bŵer y ddyfais.
Manteision:
- Yn gweithio heb gysylltedd.
- Dim cost API cylchol.
- Dim pryderon preifatrwydd (nid yw data byth yn gadael y ddyfais).
Anfanteision:
- Gall ansawdd y llais fod yn is oni bai eich bod yn bwndelu modelau niwral mawr.
- Gall ôl troed storio fod yn sylweddol (cannoedd o MB).
- Mae angen mwy o adnoddau CPU/GPU.
Mae gennym lawer o offer sy’n defnyddio’r dull hwn, cliciwch ar un o’r dolenni canlynol am ragor o wybodaeth:
techiaith/llais_festival
techiaith/Festival_MSAPI
techiaith/docker-marytts
techiaith/piper-cy
techiaith/piper-ios-app