Meta

Anunciando o Programa de Parceria em Tecnologia de Linguagem

Destaques

  • Hoje, estamos compartilhando alguns de nossos trabalhos mais recentes para ajudar línguas menos atendidas em modelos de IA e ajudar a trazer seus falantes para a conversa digital.
  • Em apoio ao trabalho da UNESCO, estamos convidando colaboradores para se juntarem a nós no aprimoramento e expansão da tradução automática e das tecnologias de linguagem, a fim de promover a diversidade linguística e a inclusão no mundo digital.

A equipe do Fundamental AI Research (FAIR) da Meta está focada em alcançar a inteligência avançada de máquina (AMI, na sigla em inglês) — uma IA que pode usar o raciocínio humano para realizar tarefas cognitivamente exigentes, como a tradução — e usá-la para impulsionar produtos e inovações que beneficiem a todos.

Junto com a UNESCO, expandir o suporte a esses idiomas em modelos de IA é uma parte essencial desse esforço. Desenvolver modelos capazes de trabalhar com problemas multilíngues e em idiomas não muito representados promove a diversidade linguística e a inclusão no mundo digital, e também nos ajuda a criar sistemas inteligentes que podem se adaptar a novas situações e aprender com a experiência. 

Hoje, estamos animados em compartilhar alguns de nossos programas, pesquisas e modelos mais recentes que apoiam esse objetivo, além de oferecer oportunidades para colaboradores contribuírem com tecnologias de tradução de IA que incorporam uma vasta gama de idiomas e dialetos globais.

Programa de Parceria em Tecnologia de Linguagem

Estamos buscando parceiros para colaborar conosco no avanço e na ampliação das tecnologias de linguagem com enfoque de IA aberta da Meta, incluindo tecnologias de tradução de IA. Nossos esforços estão especialmente focados nos idiomas mal atendidos, em apoio ao trabalho da UNESCO como parte da Década Internacional das Línguas Indígenas.

Estamos procurando parceiros que possam contribuir com mais de 10 horas de gravações de fala com transcrições, grandes quantidades de texto escrito (mais de 200 frases) e conjuntos de frases traduzidas em diversos idiomas. Os parceiros trabalharão com nossas equipes para ajudar a integrar esses idiomas em modelos de reconhecimento de fala e tradução automática impulsionados por IA, que, quando lançados, terão enfoque aberto para IA e serão disponibilizados gratuitamente para a comunidade.

 Como parceiro, você também terá acesso a workshops técnicos liderados por nossas equipes de pesquisa, onde aprenderá a aproveitar nossos modelos de enfoque de IA aberta para construir tecnologias de linguagem. Temos o prazer de anunciar que o Governo de Nunavut, Canadá, concordou em trabalhar conosco nesta emocionante iniciativa.

Para se juntar ao nosso Programa de Parceria em Tecnologia de Linguagem, preencha este formulário de interesse.

Benchmark de Tradução de Enfoque Aberto para IA

Além do Programa de Parceria em Tecnologia de Linguagem, estamos lançando um benchmark de tradução automática de enfoque aberto para IA, um teste padrão que ajudará a avaliar o desempenho de modelos de IA que realizam traduções. Composto por frases cuidadosamente elaboradas por especialistas em linguística, pretendemos que este benchmark mostre a diversidade da linguagem humana.

Convidamos você a acessar o benchmark, que está disponível em sete idiomas, e contribuir com traduções que serão disponibilizadas como enfoque aberto de IA para outros. Nosso objetivo é construir um benchmark de tradução automática multilíngue sem precedentes.

Você pode acessar o benchmark aqui.

Nosso Compromisso com a Diversidade Linguística

Os anúncios de hoje fazem parte do nosso compromisso de longo prazo com o apoio a idiomas não muito representados. Em 2022, lançamos o projeto No Language Left Behind (NLLB – Nenhum Idioma Deixado Para Trás), um mecanismo inovador de tradução automática de enfoque aberto em IA que foi o primeiro modelo de tradução automática neural para muitos idiomas e estabeleceu as bases para pesquisas e desenvolvimentos futuros.

Colaboramos com a UNESCO e a Hugging Face para construir um tradutor de idiomas baseado no NLLB, que anunciamos durante a semana da Assembleia Geral das Nações Unidas em setembro do ano passado.

Mais recentemente, para apoiar o empoderamento digital, que é uma área temática chave do Plano de Ação Global da Década Internacional das Línguas Indígenas, apresentamos o projeto Massively Multilingual Speech (MMS), que amplia a transcrição de áudio para mais de 1.100 idiomas. Desde então, continuamos a melhorar e expandir suas capacidades, incluindo a adição de reconhecimento de fala zero-shot em 2024, que permite transcrever áudio em idiomas nunca antes vistos, sem treinamento prévio.

Por fim, nosso objetivo é criar sistemas inteligentes que possam entender e responder às complexas necessidades humanas, independentemente do idioma ou contexto cultural. À medida que continuamos nesse caminho, estamos animados em aprimorar e expandir colaborativamente a tradução automática e outras tecnologias de linguagem.