Anuncio del Programa de Socios de Tecnologías de Lenguaje

Síntesis

El lenguaje es una parte fundamental de lo que somos y, sin embargo, muchas personas en todo el mundo están excluidas de la conversación digital porque su idioma no es compatible con la tecnología.
Hoy compartimos algunos de nuestros trabajos más recientes para salvar esta brecha y apoyar a las lenguas menos favorecidas en los modelos de IA.
En apoyo de la labor de la UNESCO, invitamos a los colaboradores a unirse a nosotros para mejorar y ampliar la traducción automática y las tecnologías de lenguaje con el fin de promover la diversidad de lenguaje y la inclusión en el mundo digital.

El equipo de Investigación Fundamental de la IA (FAIR) de Meta se centra en lograr una inteligencia artificial avanzada (AMI) -la IA que puede utilizar el razonamiento humano para realizar tareas cognitivamente exigentes, como la traducción- y utilizarla para impulsar productos e innovaciones que beneficien a todos.

Nuestro trabajo con la UNESCO para ampliar el apoyo a las lenguas desatendidas en los modelos de IA es una parte esencial de este esfuerzo. Desarrollar modelos capaces de trabajar en problemas multilingües y en lenguas desatendidas no solo fomenta la diversidad de lenguaje y la inclusión en el mundo digital, sino que también nos ayuda a crear sistemas inteligentes capaces de adaptarse a nuevas situaciones y aprender de la experiencia.

Hoy nos complace compartir algunos de nuestros programas, investigaciones y modelos más recientes que apoyan ese objetivo, y ofrecer oportunidades a los colaboradores para que contribuyan a las tecnologías de traducción de IA que incorporan una amplia gama de lenguas y dialectos globales.

Programa de socios de tecnología de lenguaje

Buscamos socios que colaboren con nosotros en el avance y la ampliación de las tecnologías de lenguaje de código abierto de Meta, incluidas las tecnologías de traducción automática. Nuestros esfuerzos se centran especialmente en las lenguas desatendidas, en apoyo de la labor de la UNESCO en el marco del Decenio Internacional de las Lenguas Indígenas.

Buscamos socios que puedan contribuir con más de 10 horas de grabaciones de voz con transcripciones, grandes cantidades de texto escrito (más de 200 frases) y conjuntos de frases traducidas en diversos idiomas. Los socios trabajarán con nuestros equipos para ayudar a integrar estos idiomas en modelos de reconocimiento del habla y traducción automática basados en IA, que cuando se publiquen serán de código abierto y se pondrán a disposición de la comunidad de forma gratuita.

Como socio, también tendrá acceso a talleres técnicos dirigidos por nuestros equipos de investigación, en los que aprenderá a aprovechar nuestros modelos de código abierto para crear tecnologías lingüísticas. Nos complace que el Gobierno de Nunavut (Canadá) haya aceptado colaborar con nosotros en esta interesante iniciativa.

Para unirse a nuestro Programa de Socios de Tecnología de Lenguaje, completa este formulario.

Evaluación comparativa de traducción de código abierto

Además de nuestro Programa de Colaboración de Lenguaje, estamos lanzando un punto de referencia de traducción automática de código abierto, una prueba estándar que ayudará a evaluar el rendimiento de los modelos de IA que realizan traducciones. Compuesto por frases cuidadosamente elaboradas por expertos del lenguaje, pretendemos que este punto de referencia muestre la diversidad del lenguaje humano.

Le invitamos a acceder a la base de referencia, que está disponible en siete idiomas, y a contribuir con traducciones que se convertirán en código abierto y estarán disponibles para otros usuarios. Nuestro objetivo es construir una referencia sin precedentes de traducción automática multilingüe.

Puede acceder a la evaluación comparativa aquí.

Nuestro compromiso con la diversidad de lenguaje

Los anuncios de hoy forman parte de nuestro compromiso a largo plazo de apoyo a las lenguas desatendidas. En 2022 lanzamos el proyecto No Language Left Behind (NLLB), un innovador motor de traducción automática de código abierto que fue el primer modelo neural de traducción automática para muchas lenguas y sentó las bases para futuras investigaciones y desarrollos.

Colaboramos con la UNESCO y Hugging Face para construir un traductor de lenguajes basado en NLLB, que anunciamos durante la semana de la Asamblea General de las Naciones Unidas el pasado septiembre.

Más recientemente, para apoyar el empoderamiento digital, que es un área temática clave del Plan de Acción Mundial del Decenio Internacional de las Lenguas Indígenas, presentamos el proyecto Meta Massively Multilingual Speech (MMS), que escala la transcripción de audio a más de 1.100 lenguajes. Desde entonces, hemos seguido mejorando y ampliando sus capacidades, incluida la adición del reconocimiento de voz de disparo cero en 2024, que le permite transcribir audio en lenguajes que nunca ha visto antes sin formación previa.

En última instancia, nuestro objetivo es crear sistemas inteligentes capaces de comprender y responder a las complejas necesidades humanas, independientemente del idioma o la cultura. A medida que avanzamos en esta dirección, nos entusiasma la idea de colaborar para mejorar y ampliar la traducción automática y otras tecnologías de lenguaje.

Síntesis

Noticias relacionadas