LA EMPRESA TECNOLÓGICA META USA LA BIBLIA PARA QUE LA INTELIGENCIA ARTIFICIAL PUED RECONOCER MÁS DE CUATRO MIL IDIOMAS
MADRID, España (7 Junio 2023).- La empresa tecnológica Meta -fundadora de Facebook- ha desarrollado modelos de inteligencia artificial capaces de identificar más de 4.000 idiomas y reconocer 1.100 de ellos hablados en voz alta, basándose en audios grabados de la Biblia.
El adelanto implica una mejora sensible en el
reconocimiento de idiomas hablados, sumando 40 veces más que cualquier
tecnología anterior conocida. “Es un paso importante para preservar las lenguas
que corren el riesgo de desaparecer”, dice la empresa dueña de Facebook e
Instagram.
Sus modelos Massively Multilingual Speech (MMS) tienen
como objetivo “facilitar a las personas el acceso a la información y el uso de
dispositivos en su idioma preferido”.
Meta los está poniendo a disposición en software de
acceso abierto, para que “otros en la comunidad de investigación puedan
aprovechar nuestro trabajo”.
El libro más traducido y locutado del mundo
Hay alrededor de 7.000 idiomas en el mundo, pero los
modelos de reconocimiento de voz existentes cubren solo alrededor de 100 de
ellos de manera integral.
Para superar esto y entrenar el modelo, crearon dos
conjuntos de datos con textos religiosos cuyas traducciones y grabaciones de
audio de personas que los leen están disponibles públicamente en diferentes
idiomas.
Uno de los conjuntos contiene grabaciones de audio del
Nuevo Testamento y su texto correspondiente extraído de Internet en 1.107
idiomas, lo que proporcionó un promedio de 32 horas de datos por idioma; el
otro contiene grabaciones sin etiqueta de varias otras lecturas religiosas cristianas.
Sin embargo, enfatizan que “si bien el contenido de
las grabaciones de audio es religioso, nuestro análisis muestra que esto no
sesga el modelo para producir un lenguaje más religioso”.
En el futuro, Meta espera “aumentar la cobertura de
MMS para admitir aún más idiomas y también abordar el desafío de manejar
dialectos, que a menudo es difícil para la tecnología de voz existente”.
No hay comentarios.: