Rhan 6 – Cydrannau technolegau iaith
Cydrannau ac adnoddau iaith ar gyfery Gymraeg
Lluniwyd y Porth Technolegau Iaith Cenedlaethol fel ‘siop un stop’ i gyhoeddi nifer o’r cydrannau a’r adnoddau a ddatblygwyd ar gyfer prosesu iaith yn Gymraeg ym Mhrifysgol Bangor36. Mae rhai adnoddau eraill ar gael gan ddatblygwyr eraill nad ydynt wedi’u cynnwys yma, ond mae’r isod ar gael yn rhad ac am ddim drwy’r Porth Technolegau Iaith Cenedlaethol ar http://techiaith.cymru.
Mae’r casgliad yn cynnwys setiau data, cod a chyfarwyddiadau defnyddiol i ddatblygwyr eraill, ac wedi’u rhyddhau dan drwyddedau agored caniataol fel bod cwmnïau masnachol mawr a bach yn medru’u cynnwys yn eu cynnyrch eu hunain heb orfod rhyddhau eu cod na’i eiddo deallusol masnachol eu hun yn gyfnewid. Mae hefyd yn cynnwys gwasanaethau API i rai o’r cydrannau fel bod datblygwyr a chodwyr mewn meysydd eraill yn medru’u defnyddio’n hwylus heb wybodaeth arbenigol o dechnoleg iaith. Mae’r adnoddau a’r cydrannau hefyd o ddiddordeb i ymchwilwyr ac academyddion eraill sy’n dymuno gwneud gwaith pellach yn y maes, ac yn wir i hacwyr, hobiwyr a’r cyhoedd yn gyffredinol – unrhyw un mewn gwirionedd sydd am ddefnyddio’r adnoddau a’r cydrannau yn eu gwaith eu hunain.
Adnoddau Porth Technolegau Iaith – METASHARE : http://metashare.techiaith.cymru/
Rhif | Disgrifiad | Trwydded |
1 | Amgylchedd Docker ar gyfer hyfforddi modelau iaith acwstig a iaith | Dim cyfyngiad defnydd |
2 | Dadgodwyr CP Ystadegol Moses ar sail Docker gyda modelau Saesneg<>Cymraeg wedi’u rhaghyfforddi | BSD – style |
3 | Enwau Cymru: Rhestr o Enwau Lleoedd yng Nghymru yn Gymraeg gyda geo-leoliad a chyfatebion Saesneg | CC-BY |
4 | Julius-cy: Cefnogaeth Gymraeg i’r system LVCSR Julius | BSD – style |
5 | Rhestr o Enwau Lleoedd yng Nghymru yn Gymraeg | Apache 2 |
6 | Corpws Lleferydd Paldaruo | CC – BY |
7 | Ffeil cyfatebion Cymreg-Saesneg | Apache – 2 |
8 | Gorfodwr Alinio Cymraeg | BSD – style |
9 | Rheolau Llythyren-i-sain Cymraeg | BSD – style |
10 | Lecsicon Ynganu Cymraeg | Apache 2 |
11 | Corpws WISPR | BSD |
12 |
Alinio Cod hwyluso alinio gyda hunalign a dogfennaeth ar sut i ddefnyddio LFAligner |
GNU LGPL |
13 |
TTS Festival Dogfennaeth ac enghreifftiau ar sut i ddefnyddio API testun i leferydd Cymraeg trwy Festival |
Similar to MIT |
14 | Dogfennaeth ac enghreifftiau ar sut i ddefnyddio API testun i leferydd Cymraeg trwy MaryTTS | Documentation and examples on how to use the Welsh text-to-speech API based on MaryTTS | GNU LGPL |
Adnoddau Porth Technolegau Iaith – GitHub: https://github.com/PorthTechnolegauIaith, https://github.com/techiaith
Rhif | Disgrifiad | Trwydded |
15 |
Cyfieithu Peirianyddol hwylus i’r Gymraeg a ieithoedd eraill |
MIT |
16 |
Dogfennaeth, tiwtorialau ac enghreifftiau defnyddio API Tagiwr Rhannau Ymadrodd Cymraeg |
MIT |
17 |
Cyflwyniad i raglennu seiliedig ar destun gan ddefnyddio Python ar y Raspberry Pi. Erbyn diwedd yr holl wersi, bydd myfyrwyr wedi creu robot sgwrsio rhyngweithiol ac wedi’u cyflwyno at technolegau iaith Cymraeg yn ogystal a’r cysyniad cyfrifiadurol o ddeallusrwydd artiffisial |
CC-BY-SA |
18 |
Ategyn gwefannau sy’n tynnu at y ffaith mai Saesneg (UDA) yw dewis iaith cynnwys ddiofyn porwyr a’u helpu i’w newid i Cymraeg (cy) |
MIT |
19 |
Amgylchedd hwyluso hyfforddi adnabod lleferydd Kaldi Cymraeg |
Apache 2 |
20 |
Dockerfile ar gyfer kaldi-gstreamer-server |
BSD 2 |
21 |
Creu lleisiau synthetig Cymraeg eich hunain gyda MaryTTS a Docker |
Apache 2 |
22 |
Dockerfile a ffeiliau cysylltiedig ar gyfer gosod hwb META-SHARE syml |
Apache 2 |
23 |
Defnyddio Prosodylab-Aligner Cymraeg yn hwylus gyda Docker. |
Apache 2 |
24 |
Integreiddio testun i leferydd Festival i Windows drwy MSAPI |
Hawlfraint Prifysgol Bangor 2005 |
25 |
Project Visual Studio ar gyfer adeiladu Festival ar gyfer Windows a’i defnyddio drwy COM |
BSD |
26 |
Ffeiliau ar gyfer adnabod lleferydd Cymraeg drwy Julius |
MIT |
27 |
Adnabod lleferydd Cymraeg gyda Kaldi ASR |
Apache |
28 |
Port of Google’s language-detection library to Python |
Apache 2 |
29 |
Data llais Cymraeg ddeuffonau er mwyn llwytho i lawr a’u rhedeg o fewn gosodiad lleol o Festival (ar Linux, Raspberry Pi neu Windows) |
Hawlfraint Prifysgol Bangor (trwydded rydd ganiataol) |
30 |
Cod ar gyfer ‘Macsen’ – prototeip o gynorthwyydd digidol Cymraeg |
Apache 2 |
31 |
Ap cynorthwyydd personol digidol |
BSD 3 |
32 |
MARY TTS – y system synthesis testun-i-leferydd amlieithog, cod agored wedi’i fforchio ar gyfer datblygu TTS Cymraeg yn benodol |
LGPL |
33 |
Llyfrgell statig Objective-C er mwyn trosi Markdown i HTML |
Hawlfraint Matt Diephouse (trwydded rydd ganiataol) |
34 |
Cod yr ap Paldaruo i iOS ar gyfer torfoli casglu corpws lleferydd |
MIT |
35 |
Rhyngwyneb Python i orfodi alinio awdio gan ddefnyddio HTK a SoX ar gyfer y Gymraeg |
Apache 2 |
36 |
Amlapiwr Python C ar gyfer hwyluso rhaglennu gyda Festival |
BSD |
37 |
Lapiwr python ar gyfer IVONA API Amazon |
MIT
|
38 |
Offer hwyluso creu Adnabod Lleferydd Cymraeg gyda HTK, IRSTLM, Julius a Docker |
Apache 2 |
39 |
Paldaruo: Ein gwefan ar gyfer torfoli corpora lleferydd (ar sail Mozilla Common Voice) |
Mozilla Public License 2 |
40 |
Rheolau ynganu Cymraeg |
Hawlfraint Prifysgol Bangor (trwydded agored ganiataol) |
41 |
deepspeech cynhwysydd Deepspeech |
MIT |
42 |
moses-smt Moses-SMT gyda’r Gymraeg |
MIT |
36Prys, D. & Jones, D.B. National Language Technologies Portals for LRLs: a Case StudyLecture Notes in Artificial Intelligence. Springer, 2018.