Público
Público

Publicat el primer model lingüístic en obert que interpreta de text a veu en les diferents variants del català

És una eina impulsada pel projecte Aina, la iniciativa del Govern que busca que les màquines parlin i entenguin el català. 'Matxa' facilita l'accés d'una àmplia gamma de parlants a la tecnologia

El conseller d'Empresa i Treball Roger Torrent, en una imatge d'arxiu
El conseller d'Empresa i Treball Roger Torrent, en una imatge d'arxiu. Govern

Publicat el primer model lingüístic en obert que ofereix interpretació de text a veu en les diferents variants dialectals del català. En concret, en català central, nord-occidental, balear i valencià. Es tracta d'una eina del projecte Aina, la iniciativa d'intel·ligència artificial i tecnologies del llenguatge que impulsa el Govern, i que busca que les màquines parlin i entenguin el català.

Aquest recurs lingüístic ha estat anomenat 'Matxa', i permet adaptar la síntesi de veu al dialecte específic d'un usuari o regió, millorant la comprensió i rellevància del seu missatge. Segons ha difós el Govern en un comunicat, així es facilita l'accés d'una "àmplia gamma" de parlants a la tecnologia i es promou la inclusió. L'executiu assegura que el nou model "obre la porta" a diverses aplicacions pràctiques.

El Departament d'Empresa i Treball també ha ressaltat que manté la naturalitat i les característiques de les veus escollides per a entrenar-lo, procedents de parlants de diversos dialectes, i que suposa un "pas endavant" en termes de rendiment. Aquest nou recurs del projecte ja està disponible a la plataforma de codi obert Hugging Face, la comunitat d'IA amb recursos de codi obert, des d'on es fer proves amb les veus a través d'una demo pública, i conèixer els detalls tècnics de la solució. 

La tecnologia ha estat desenvolupada per la Unitat de Tecnologies del Llenguatge del Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS). S'entrena amb diferents datasets o conjunts de dades, entre els quals es troba el Festcat, l'OpenSLR69 o el recentment creat Frescat que inclou enregistraments en quatre variants dialectals i 8 parlants diferents.

¿Te ha resultado interesante esta noticia?