L’Instituto d’Investigación en Enchenyería d’Aragón (I3A) d’a Universidat de Zaragoza aculle este viernes 13 de marzo, de 15:00 a 19:00 horas, una trobada cientifica pa replegar datos d’avaluación en luenga aragonesa pa amillorar la competencia en esta luenga d’os grans modelos d’o luengache (LLMs, como ChatGPT u Gemini).
L’obchectivo d’este 'Datathon' ye aumentar la presencia dichital de l’aragonés y facilitar la suya supervivencia en l’ecosistema tecnolochico actual. La iniciativa sigue lo modelo aplicau con exito a atros idiomas como l’euskera, lo catalán u lo gallego.
Bella vintena de personas s’han apuntau a este evento, d’as cuals 13 serán presents en esta primer cita que aculle l’Edificio I+D d’o Campus Río Ebro d’a capital d’o país.
Lo ‘Datathon’ ye organizau en o marco d’a tesi doctoral de Miguel López Otal, dirichida per lo profesor Jorge Gracia del Río, los dos miembros d’o grupo d’investigación Sistemas de Información Distribuidos (SID), y conta con l’asesoramiento de Juan Pablo Martínez, director de l’Instituto de l'Aragonés de l’Academia Aragonesa de la Lengua y tamién miembro de l’I3A.
Los datos obtenius en este evento se farán servir pa prebar las habilidaz d’estes modelos d’intelichencia artificial en esta luenga y mirar d’amillorar-los. Anque l’aragonés ye actualment en serio periglo d’extinción seguntes la UNESCO, conta con una comunidat de parladors bien compromesa y prou activa, y lo suyo paper será fundamental en esta chornada.
As personas que participan en o ‘Datathon’ habrán de correchir un conchunto de mas de 10.000 oracions, traducidas automaticament dende lo castellano enta l’aragonés con a ferramienta Apertium, comprebando si las traduccions son correctas. Esta ferramienta, anque a sobén fa traduccions correctas, puede fer fallos, per lo cual los revisors en l’evento habrán de correchir las errors que siempre se i trobarán. Treballarán con traducción automatica y corrección manual.
Los conchuntos de datos resultants serán publicaus en ubierto en internet pa facilitar la experimentación en esta luenga. Tot ixo fa parte d’un intento activo de dar soporte a l’aragonés en o mundo actual d’a IA, an que la falta de textos d’entrenamiento dificulta l’uso competent d’esta luenga per parte d’os modelos de luengache, y anima a mirar estratechias alternativas. La replega d’estes datos d’avaluación fará honra pa fer un paso decisivo en esta dirección.

