Un o brif amcanion project GALLU yw casglu corpws lleferydd Cymraeg newydd pwrpasol drwy ddulliau torfoli er mwyn datblygu system LVCSR (large vocabulary continuous speech recognition) ar gyfer y Gymraeg yn y dyfodol.
Bydd y corpws yn casglu set o frawddegau sy’n cynnwys holl ffonemau’r iaith i hyfforddi modelau acwstig gyda HTK. Wedyn datblygir gramadeg i drosi’r ffonemau a adnabuwyd yn eiriau llawn. Bydd y modelau a’r system adnabod lleferydd Cymraeg yn adnoddau cod agored o fewn meddalwedd Julius.
Erbyn diwedd y project (diwedd mis Awst 2014) bydd y modelau acwstig a Julius yn gallu rheoli symudiad braich robot drwy gyfrwng gorchmynion llafar Cymraeg ar gyfer y Raspberry Pi.
Bydd y system adnabod lleferydd Cymraeg, y corpws hyfforddi’r systemau acwstig a’r cod i beri i feddalwedd ymateb i orchmynion llafar Cymraeg ar gael yn agored erbyn diwedd y project.
Bydd modd ymgorffori’r allbynnau mewn projectau clybiau a gwersi codio i blant yng Nghymru.
Ar hyn o bryd, mae ‘na 20 recordiad o gyfranwyr yn llefaru’r promptiau sampl sydd wedi cael eu hysgrifennu i hyfforddi’r fraich robot. Cliciwch yma i’w llwytho nhw i lawr.