{"id":23650,"date":"2022-02-23T14:56:54","date_gmt":"2022-02-23T17:56:54","guid":{"rendered":"https:\/\/about.fb.com\/br\/?p=23650"},"modified":"2022-02-23T16:21:25","modified_gmt":"2022-02-23T19:21:25","slug":"ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos","status":"publish","type":"post","link":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/","title":{"rendered":"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos"},"content":{"rendered":"<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-23651\" src=\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png?resize=624%2C360\" alt=\"\" width=\"624\" height=\"360\" srcset=\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png?w=624 624w, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png?w=600 600w, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png?w=300 300w\" sizes=\"auto, (max-width: 624px) 100vw, 624px\" \/><\/p>\n<p>&nbsp;<\/p>\n<p><span style=\"font-weight: 400\">Para as pessoas que entendem idiomas como o ingl\u00eas, o mandarim ou o espanhol, pode parecer que os aplicativos e as ferramentas da web atuais j\u00e1 proporcionam a tecnologia de tradu\u00e7\u00e3o de que precisamos. Mas h\u00e1 bilh\u00f5es de pessoas que s\u00e3o deixadas de fora, sem a possibilidade de acessar facilmente a maioria das informa\u00e7\u00f5es na internet e de se conectar com a maior parte do mundo online em seu idioma nativo. Os atuais sistemas de tradu\u00e7\u00e3o autom\u00e1tica (MT, na sigla em ingl\u00eas) est\u00e3o se aprimorando rapidamente, mas ainda dependem muito do aprendizado com grandes quantidades de dados textuais, portanto, geralmente n\u00e3o funcionam bem para idiomas de recursos baixos, ou seja, idiomas que n\u00e3o t\u00eam dados para aprendizado de m\u00e1quina, e para idiomas que n\u00e3o t\u00eam um sistema de escrita padronizado.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Eliminar a barreira da l\u00edngua seria algo profundo, que proporcionaria a bilh\u00f5es de pessoas o acesso \u00e0s informa\u00e7\u00f5es online em seus idiomas nativos ou preferenciais. Os avan\u00e7os da MT n\u00e3o ajudar\u00e3o apenas as pessoas que n\u00e3o falam nenhum dos idiomas que dominam a internet atualmente; eles tamb\u00e9m v\u00e3o alterar, de maneira fundamental, a forma como as pessoas do mundo inteiro se conectam e compartilham ideias.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">E, ao usarmos cada vez mais o metaverso, precisaremos criar espa\u00e7os virtuais imersivos em que as pessoas possam participar e se comunicar independentemente dos idiomas que elas falam.\u00a0<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-23652\" src=\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem2.png?resize=624%2C352\" alt=\"\" width=\"624\" height=\"352\" srcset=\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem2.png?w=624 624w, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem2.png?w=600 600w, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem2.png?w=300 300w\" sizes=\"auto, (max-width: 624px) 100vw, 624px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Pense, por exemplo, em um mercado em que haja pessoas que falam idiomas diferentes se comunicando em tempo real usando um smartphone, um rel\u00f3gio ou um \u00f3culos. Imagine ainda um conte\u00fado multim\u00eddia na web que seja acess\u00edvel a qualquer pessoa do mundo em seu idioma de prefer\u00eancia. Em um futuro n\u00e3o muito distante, quando as tecnologias emergentes como a realidade virtual e aumentada unirem o mundo digital e o mundo f\u00edsico no metaverso, as ferramentas de tradu\u00e7\u00e3o permitir\u00e3o que as pessoas realizem as atividades do dia a dia, como organizar um clube de leitura ou colaborar em um projeto de trabalho, com qualquer um e em qualquer lugar, da mesma forma que o fariam com um vizinho.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">A Meta AI est\u00e1 anunciando uma iniciativa de longo prazo para criar ferramentas de idiomas e MT que incluir\u00e3o a maioria dos idiomas do mundo. Isso inclui dois novos projetos. O primeiro \u00e9 o <\/span><i><span style=\"font-weight: 400\">No Language Left Behin<\/span><\/i><i><span style=\"font-weight: 400\">d<\/span><\/i><span style=\"font-weight: 400\"> (Nenhum Idioma Deixado para Tr\u00e1s, em portugu\u00eas), <\/span><span style=\"font-weight: 400\">que consiste em construir um novo modelo de intelig\u00eancia artificial avan\u00e7ada capaz de aprender com idiomas que t\u00eam menos exemplos para treinamento. N\u00f3s o usaremos para possibilitar tradu\u00e7\u00f5es de qualidade profissional em centenas de idiomas, como o asturiano, o luganda e o urdu. O segundo \u00e9 o <\/span><i><span style=\"font-weight: 400\">Universal Speech Translator<\/span><\/i><span style=\"font-weight: 400\"> (Tradutor de Fala Universal,<\/span><span style=\"font-weight: 400\"> em portugu\u00eas<\/span><span style=\"font-weight: 400\">), no qual estamos projetando novas abordagens para traduzir a fala em um idioma para outro em tempo real. Assim, poderemos incluir idiomas que n\u00e3o t\u00eam um sistema de escrita padr\u00e3o da mesma forma que aqueles que s\u00e3o falados e escritos.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Ser\u00e1 necess\u00e1rio muito mais trabalho para fornecer a todos, no mundo inteiro, ferramentas de tradu\u00e7\u00e3o realmente universais. Mas n\u00f3s acreditamos que as iniciativas descritas aqui s\u00e3o um importante passo \u00e0 frente. Compartilhar os detalhes e liberar nosso c\u00f3digo e nossos modelos no futuro significa que outras pessoas poder\u00e3o aproveitar desse nosso trabalho e nos aproximar da realiza\u00e7\u00e3o desse importante objetivo.\u00a0<\/span><\/p>\n<p><strong>Os desafios de traduzir todos os idiomas<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Os sistemas de tradu\u00e7\u00e3o atuais baseados em IA n\u00e3o s\u00e3o concebidos para atender aos milhares de idiomas usados no mundo inteiro nem para fornecer tradu\u00e7\u00e3o de fala para fala em tempo real. Para realmente atender a todos, a comunidade de pesquisa em<\/span><span style=\"font-weight: 400\"> MT precisar\u00e1 enfrentar tr\u00eas desafios importantes. Precisaremos superar a escassez de dados, adquirindo mais dados de aprendizado em mais idiomas e encontrando novas formas de aproveitar os que j\u00e1 est\u00e3o dispon\u00edveis. Precisaremos tamb\u00e9m superar os desafios de modelagem que surgem \u00e0 medida que os modelos crescem para atender a muito mais idiomas. E precisaremos ainda encontrar novas formas de avaliar e aprimorar seus resultados.\u00a0<\/span><\/p>\n<p>&nbsp;<\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-23653\" src=\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem3.png?resize=504%2C390\" alt=\"\" width=\"504\" height=\"390\" srcset=\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem3.png?w=504 504w, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem3.png?w=300 300w\" sizes=\"auto, (max-width: 504px) 100vw, 504px\" \/><\/p>\n<p><span style=\"font-weight: 400\">A escassez de dados continua sendo um dos maiores obst\u00e1culos para a expans\u00e3o das ferramentas de tradu\u00e7\u00e3o para mais idiomas. Normalmente, os sistemas de MT para tradu\u00e7\u00e3o de textos se baseiam no aprendizado com milh\u00f5es de frases de dados anotados. Por causa disso, os sistemas de MT capazes de gerar tradu\u00e7\u00f5es de alta qualidade foram desenvolvidos apenas para os poucos idiomas que dominam a web. A expans\u00e3o para outros idiomas significa encontrar maneiras de adquirir e usar exemplos para aprendizado de idiomas cuja presen\u00e7a na web \u00e9 escassa.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Para tradu\u00e7\u00e3o direta de fala para fala, o desafio de adquirir dados \u00e9 ainda maior. A maioria dos sistemas de MT de fala usa o texto como etapa intermedi\u00e1ria, o que significa que a fala em um idioma \u00e9 primeiro convertida em texto, depois traduzida para texto no idioma de destino e, por fim, inserida em um sistema de convers\u00e3o de texto para fala para gerar \u00e1udio. Isso faz com que a tradu\u00e7\u00e3o de fala para fala fique dependente de texto em formas que limitam a sua efici\u00eancia e a tornam dif\u00edcil de ampliar para idiomas que s\u00e3o essencialmente orais.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Os modelos de tradu\u00e7\u00e3o direta de fala para fala podem permitir a tradu\u00e7\u00e3o de idiomas que n\u00e3o t\u00eam sistemas de escrita padronizados. Essa abordagem tamb\u00e9m pode levar a sistemas de tradu\u00e7\u00e3o muito mais eficientes e r\u00e1pidos, j\u00e1 que eles n\u00e3o precisar\u00e3o das etapas adicionais de convers\u00e3o de fala para texto, da tradu\u00e7\u00e3o deste e da gera\u00e7\u00e3o de fala no idioma de destino.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Al\u00e9m da necessidade de dados de aprendizado adequados em milhares de idiomas, os sistemas de MT atuais simplesmente n\u00e3o s\u00e3o concebidos para serem ampliados de forma a atender \u00e0s necessidades de todas as pessoas no mundo inteiro. Muitos sistemas de MT s\u00e3o bil\u00edngues, o que significa que existe um modelo separado para cada par de idiomas, como ingl\u00eas-russo ou japon\u00eas-espanhol. Essa abordagem \u00e9 extraordinariamente dif\u00edcil de ampliar para dezenas de pares de idiomas e mais ainda para todos os idiomas em uso no mundo inteiro. Imagine se voc\u00ea precisasse criar e manter muitos milhares de modelos diferentes para cada combina\u00e7\u00e3o, de tailand\u00eas-laosiano a nepal\u00eas-assam\u00eas. V\u00e1rios <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/qa-with-machine-translation-pioneer-the-future-of-mt-is-multilingual\"><span style=\"font-weight: 400\">especialistas j\u00e1 sugeriram<\/span><\/a><span style=\"font-weight: 400\"> que os sistemas multil\u00edngues podem ajudar a resolver o problema. Mas tem sido extremamente dif\u00edcil incorporar muitos idiomas em um \u00fanico modelo multil\u00edngue eficiente e de alto desempenho que tenha a capacidade de representar todos os idiomas.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Os modelos de MT de fala para fala em tempo real enfrentam muitos dos mesmos desafios dos modelos baseados em texto, mas tamb\u00e9m precisam superar a lat\u00eancia \u2014 o atraso que ocorre quando um idioma est\u00e1 sendo traduzido para outro \u2014 para poderem ser usados com efic\u00e1cia nas tradu\u00e7\u00f5es em tempo real. O principal desafio deriva do fato de que uma frase pode ser falada em uma ordem diferente de palavras em idiomas distintos. At\u00e9 mesmo os profissionais de tradu\u00e7\u00e3o simult\u00e2nea apresentam um atraso de aproximadamente tr\u00eas segundos em rela\u00e7\u00e3o \u00e0 fala original. Considere uma frase em alem\u00e3o, \u201cIch m\u00f6chte alle Sprachen \u00fcbersetzen\u201d, e a sua equivalente em espanhol, \u201cQuisiera traducir todos los idiomas\u201d. Ambas significam \u201cGostaria de traduzir todos os idiomas\u201d. Mas traduzir do alem\u00e3o para o ingl\u00eas em tempo real seria mais dif\u00edcil porque o verbo \u201ctraduzir\u201d aparece no final da frase, enquanto a ordem das palavras em espanhol e em ingl\u00eas \u00e9 semelhante.<\/span><span style=\"font-weight: 400\"><br \/>\n<\/span><\/p>\n<p><span style=\"font-weight: 400\">Por fim, ao ampliarmos para cada vez mais idiomas, precisamos tamb\u00e9m desenvolver novas formas de avaliar o trabalho produzido pelos modelos de MT. J\u00e1 existem recursos para avaliar a qualidade das tradu\u00e7\u00f5es entre determinados idiomas, por exemplo, do ingl\u00eas para o russo; mas e se as tradu\u00e7\u00f5es forem do am\u00e1rico para o cazaque? Ao expandirmos o n\u00famero de idiomas que os nossos modelos de MT s\u00e3o capazes de traduzir, precisaremos tamb\u00e9m desenvolver novas abordagens com rela\u00e7\u00e3o aos dados e \u00e0 mensura\u00e7\u00e3o de aprendizado para abranger mais idiomas. Al\u00e9m de avaliar o desempenho dos sistemas de MT com rela\u00e7\u00e3o \u00e0 precis\u00e3o, tamb\u00e9m \u00e9 importante assegurar que as tradu\u00e7\u00f5es sejam feitas de forma respons\u00e1vel. Precisaremos encontrar maneiras de assegurar que os sistemas de MT preservem as sensibilidades culturais e n\u00e3o criem nem intensifiquem vieses. Como descrito nas se\u00e7\u00f5es abaixo, a Meta AI est\u00e1 trabalhando com cada um desses tr\u00eas desafios.<\/span><\/p>\n<p><strong>Treinando sistemas de tradu\u00e7\u00e3o direta de fala para fala e de recursos baixos<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Para possibilitar as tradu\u00e7\u00f5es de idiomas de recursos baixos e para criar os elementos b\u00e1sicos para futuras tradu\u00e7\u00f5es de mais idiomas independentemente de quanto eles sejam falados ou escritos, estamos expandindo nossas t\u00e9cnicas de cria\u00e7\u00e3o autom\u00e1tica de conjuntos de dados. Uma dessas t\u00e9cnicas \u00e9 o <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/laser-multilingual-sentence-embeddings\/\"><span style=\"font-weight: 400\">LASER<\/span><\/a><span style=\"font-weight: 400\">, um kit de ferramentas de c\u00f3digo aberto que atualmente abrange mais de 125 idiomas escritos em 28 scripts diferentes.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">O LASER converte frases de v\u00e1rios idiomas em uma \u00fanica representa\u00e7\u00e3o multil\u00edngue. Em seguida, usamos uma pesquisa de semelhan\u00e7a multil\u00edngue em grande escala para identificar frases que t\u00eam uma representa\u00e7\u00e3o semelhante, ou seja, que provavelmente t\u00eam o mesmo significado em diferentes idiomas. Usamos o LASER para construir sistemas como o <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/ccmatrix-a-billion-scale-bitext-data-set-for-training-translation-models\/\"><span style=\"font-weight: 400\">ccMatrix<\/span><\/a><span style=\"font-weight: 400\"> e o <\/span><a href=\"https:\/\/ai.facebook.com\/research\/publications\/ccaligned-a-massive-collection-of-cross-lingual-web-document-pairs\/\"><span style=\"font-weight: 400\">ccAligned<\/span><\/a><span style=\"font-weight: 400\">, que s\u00e3o capazes de localizar textos paralelos na internet. Devido \u00e0 escassez de dados dispon\u00edveis para os idiomas de recursos baixos, criamos um novo m\u00e9todo de aprendizado professor-aluno que permite que o LASER se concentre em subgrupos de idiomas espec\u00edficos, como os idiomas bantos, e aprenda com conjuntos de dados muito menores. Isso permite que o LASER opere em escala com v\u00e1rios idiomas de forma eficaz. Cada um desses progressos nos permitir\u00e1 abranger mais idiomas \u00e0 medida que avan\u00e7amos no seu dimensionamento, aprimoramento e expans\u00e3o para incluir minera\u00e7\u00e3o de dados para centenas de idiomas e, por fim, para todos os idiomas que t\u00eam um sistema de escrita. Recentemente, <\/span><a href=\"https:\/\/papers.nips.cc\/paper\/2021\/hash\/8466f9ace6a9acbe71f75762ffc890f1-Abstract.html\"><span style=\"font-weight: 400\">estendemos o LASER para que funcione tamb\u00e9m com a fala<\/span><\/a><span style=\"font-weight: 400\">: gra\u00e7as \u00e0 constru\u00e7\u00e3o de representa\u00e7\u00f5es para fala e texto no mesmo espa\u00e7o multil\u00edngue, conseguimos extrair tradu\u00e7\u00f5es entre fala em um idioma e texto em outro e at\u00e9 mesmo tradu\u00e7\u00f5es diretas de fala para fala. Com esse m\u00e9todo, j\u00e1 identificamos cerca de 1.400 horas de fala alinhada em franc\u00eas, alem\u00e3o, espanhol e ingl\u00eas.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Os dados de texto s\u00e3o importantes, mas n\u00e3o s\u00e3o suficientes para construir ferramentas de tradu\u00e7\u00e3o que atendam \u00e0s necessidades de todos. Anteriormente, havia disponibilidade de dados de refer\u00eancia de tradu\u00e7\u00e3o de fala para uns poucos idiomas, por isso criamos o <\/span><a href=\"https:\/\/www.isca-speech.org\/archive\/interspeech_2021\/wang21s_interspeech.html\"><span style=\"font-weight: 400\">CoVoST 2<\/span><\/a><span style=\"font-weight: 400\">, que abrange 22 idiomas e 36 dire\u00e7\u00f5es lingu\u00edsticas com diferentes condi\u00e7\u00f5es de recursos. Al\u00e9m disso, \u00e9 dif\u00edcil encontrar grandes quantidades de \u00e1udio em diferentes idiomas. <\/span><span style=\"font-weight: 400\">O <\/span><a href=\"https:\/\/github.com\/facebookresearch\/voxpopuli\"><span style=\"font-weight: 400\">VoxPopuli<\/span><\/a><span style=\"font-weight: 400\">, que cont\u00e9m 400 mil horas de fala em 23 idiomas, permite o aprendizado em grande escala semissupervisionado e autossupervisionado para programas como reconhecimento de fala e tradu\u00e7\u00e3o de fala. Posteriormente, o VoxPopuli foi usado para construir o maior modelo pr\u00e9-treinado aberto e universal para <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/xls-r-self-supervised-speech-processing-for-128-languages\"><span style=\"font-weight: 400\">128 idiomas e tarefas de fala<\/span><\/a><span style=\"font-weight: 400\">, incluindo a tradu\u00e7\u00e3o de fala. <\/span><span style=\"font-weight: 400\">Esse modelo aprimorou o modelo de ponta anterior para a tradu\u00e7\u00e3o de fala para texto de 21 idiomas para o ingl\u00eas em 7.4 BLEU no conjunto de dados CoVoST 2.<\/span><\/p>\n<p><strong>Construindo modelos que funcionam em muitos idiomas e diferentes modalidades<\/strong><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-23654\" src=\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem4.png?resize=624%2C351\" alt=\"\" width=\"624\" height=\"351\" srcset=\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem4.png?w=624 624w, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem4.png?w=600 600w, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem4.png?w=300 300w\" sizes=\"auto, (max-width: 624px) 100vw, 624px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Al\u00e9m de produzir mais dados para treinar os sistemas de MT e torn\u00e1-los dispon\u00edveis para outros pesquisadores, estamos trabalhando para aprimorar a capacidade do modelo e poder assim lidar com tradu\u00e7\u00f5es entre um conjunto de idiomas muito mais amplo. Os sistemas de MT atuais frequentemente funcionam em uma \u00fanica modalidade e em um conjunto de idiomas limitado. Se o modelo for pequeno demais para representar muitos idiomas, o seu desempenho poder\u00e1 ser prejudicado, introduzindo erros tanto nas tradu\u00e7\u00f5es de texto como nas de fala. As inova\u00e7\u00f5es na modelagem nos ajudar\u00e3o a criar um futuro em que as tradu\u00e7\u00f5es ser\u00e3o transferidas de forma r\u00e1pida e fluida entre diferentes modalidades, indo de fala para texto, de texto para fala, de texto para texto e de fala para fala em in\u00fameros idiomas.\u00a0\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Para obter um desempenho aprimorado de nossos modelos de MT, investimos muito na cria\u00e7\u00e3o de modelos que apresentem um aprendizado eficiente apesar de sua grande capacidade, com foco em modelos de especialidades mistas restringidos de forma esparsa. Aumentando o tamanho do modelo e aprendendo uma fun\u00e7\u00e3o de roteamento autom\u00e1tico de forma que tokens diferentes usem recursos de especialidades diferentes, conseguimos equilibrar o desempenho das tradu\u00e7\u00f5es de recursos altos e de recursos baixos.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Para ampliar uma MT baseada em texto para 101 idiomas, criamos o <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/introducing-many-to-many-multilingual-machine-translation\/\"><span style=\"font-weight: 400\">primeiro sistema de tradu\u00e7\u00e3o de texto multil\u00edngue n\u00e3o centrado no ingl\u00eas<\/span><\/a><span style=\"font-weight: 400\">. Os sistemas bil\u00edngues geralmente funcionam traduzindo primeiro do idioma de origem para o ingl\u00eas e, em seguida, do ingl\u00eas para o idioma de destino. Para tornar esses sistemas mais eficientes e aumentar a sua qualidade, eliminamos o ingl\u00eas como meio, de maneira que os idiomas possam ser traduzidos diretamente para outros idiomas sem passar pelo ingl\u00eas. Embora a elimina\u00e7\u00e3o do ingl\u00eas tenha aumentado a capacidade do modelo, os modelos multil\u00edngues anteriormente n\u00e3o eram capazes de atingir o mesmo n\u00edvel de qualidade do que os sistemas bil\u00edngues feitos sob medida. Recentemente, no entanto, <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/the-first-ever-multilingual-model-to-win-wmt-beating-out-bilingual-models\/\"><span style=\"font-weight: 400\">nosso sistema de tradu\u00e7\u00e3o multil\u00edngue ganhou o concurso Workshop on Machine Translation<\/span><\/a><span style=\"font-weight: 400\">, superando at\u00e9 mesmo os melhores modelos bil\u00edngues.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Queremos que a nossa tecnologia seja inclusiva: ela deve abranger tanto os idiomas escritos como os idiomas que n\u00e3o t\u00eam sistema de escrita padronizado. Pensando nisso, estamos desenvolvendo um sistema de tradu\u00e7\u00e3o de fala para fala que n\u00e3o depende da gera\u00e7\u00e3o de uma representa\u00e7\u00e3o textual intermedi\u00e1ria durante a infer\u00eancia. Foi demonstrado que essa abordagem \u00e9 mais r\u00e1pida do que os sistemas tradicionais em cascata que combinam modelos separados de reconhecimento de fala, tradu\u00e7\u00e3o autom\u00e1tica e s\u00edntese de fala. Com maior efici\u00eancia e uma arquitetura mais simples, a tradu\u00e7\u00e3o direta de fala para fala pode proporcionar uma tradu\u00e7\u00e3o em tempo real de qualidade quase humana para futuros dispositivos, como \u00f3culos de realidade aumentada. Por fim, para criar tradu\u00e7\u00f5es faladas que preservem a expressividade e a singularidade na fala das pessoas, estamos trabalhando para incluir alguns aspectos do \u00e1udio de entrada, como a entona\u00e7\u00e3o, nas tradu\u00e7\u00f5es geradas de \u00e1udio.<\/span><\/p>\n<p><strong>Mensurando o sucesso em centenas de idiomas<\/strong><\/p>\n<p><span style=\"font-weight: 400\">O desenvolvimento de modelos em grande escala que possam traduzir entre muito mais idiomas faz surgir uma pergunta importante: como podemos determinar se desenvolvemos dados ou modelos melhores? Avaliar o desempenho de um modelo multil\u00edngue em grande escala \u00e9 complicado, especialmente porque requer um conhecimento aprofundado de todos os idiomas que o modelo abrange \u2014 um desafio que \u00e9 demorado, demanda muitos recursos e frequentemente \u00e9 invi\u00e1vel.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">N\u00f3s criamos o <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/the-flores-101-data-set-helping-build-better-translation-systems-around-the-world\/\"><span style=\"font-weight: 400\">FLORES-101<\/span><\/a><span style=\"font-weight: 400\">, o primeiro conjunto de dados de avalia\u00e7\u00e3o de tradu\u00e7\u00e3o multilingue que abrange 101 idiomas, permitindo que os pesquisadores testem e aprimorem rapidamente os modelos de tradu\u00e7\u00e3o multil\u00edngues. Diferentemente dos conjuntos de dados existentes, o FLORES-101 permite que os pesquisadores quantifiquem o desempenho dos sistemas em qualquer dire\u00e7\u00e3o lingu\u00edstica, e n\u00e3o apenas de tradu\u00e7\u00f5es de\/para o ingl\u00eas. Para os milh\u00f5es de pessoas do mundo inteiro que vivem em locais com dezenas de idiomas oficiais, isso permite a cria\u00e7\u00e3o de sistemas de tradu\u00e7\u00e3o que atendem a necessidades importantes do mundo real.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Usando o FLORES-101, temos colaborado com outros l\u00edderes da comunidade de pesquisa em IA para fazer avan\u00e7ar a tradu\u00e7\u00e3o multil\u00edngue com recursos baixos. No Workshop on Machine Translation de 2021, organizamos uma tarefa compartilhada para fazer progressos nesta \u00e1rea de forma coletiva. Houve a participa\u00e7\u00e3o de pesquisadores do mundo inteiro, muitos dos quais com foco em idiomas pessoalmente relevantes para eles. Esperamos continuar expandindo o FLORES para abranger centenas de idiomas.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Ao fazermos progressos tang\u00edveis em dire\u00e7\u00e3o a uma tradu\u00e7\u00e3o universal, tamb\u00e9m nos concentramos em fazer isso de forma respons\u00e1vel. Estamos trabalhando em colabora\u00e7\u00e3o com linguistas para entender os desafios de produzir cole\u00e7\u00f5es de conjuntos de dados corretos e com redes de avaliadores para assegurar que as tradu\u00e7\u00f5es sejam corretas. Tamb\u00e9m estamos realizando estudos de caso com falantes de mais de 20 idiomas, para saber quais caracter\u00edsticas da tradu\u00e7\u00e3o s\u00e3o importantes para as pessoas com diferentes hist\u00f3ricos e como elas usar\u00e3o as tradu\u00e7\u00f5es que nossos modelos de IA produzem. Existem muitos outros aspectos para o desenvolvimento respons\u00e1vel de uma tradu\u00e7\u00e3o universal, incluindo a diminui\u00e7\u00e3o do vi\u00e9s e da toxicidade e a preserva\u00e7\u00e3o das sensibilidades culturais ao passar as informa\u00e7\u00f5es de um idioma para outro. Para alcan\u00e7armos nossos objetivos de longo prazo em rela\u00e7\u00e3o \u00e0 tradu\u00e7\u00e3o, precisaremos n\u00e3o apenas de conhecimento em IA, mas tamb\u00e9m da contribui\u00e7\u00e3o cont\u00ednua de diversos especialistas, pesquisadores e indiv\u00edduos do mundo inteiro.\u00a0<\/span><\/p>\n<p><strong>Qual \u00e9 o pr\u00f3ximo passo?<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Se o <\/span><i><span style=\"font-weight: 400\">No Language Left Behind<\/span><\/i><span style=\"font-weight: 400\"> e o <\/span><i><span style=\"font-weight: 400\">Universal Speech Translator<\/span><\/i><span style=\"font-weight: 400\">, combinados com as iniciativas da comunidade de pesquisa em MT, conseguirem criar tecnologias de tradu\u00e7\u00e3o que incluam todos os habitantes do planeta, isso abrir\u00e1 o mundo digital e o mundo f\u00edsico de maneiras que antes n\u00e3o eram poss\u00edveis. J\u00e1 estamos fazendo progressos no sentido de possibilitar tradu\u00e7\u00f5es envolvendo idiomas com poucos recursos, uma barreira significativa \u00e0 tradu\u00e7\u00e3o universal para a maior parte da popula\u00e7\u00e3o do mundo. Ao avan\u00e7ar e abrir o c\u00f3digo do nosso trabalho na cria\u00e7\u00e3o de corpus, modelagem multil\u00edngue e avalia\u00e7\u00e3o, esperamos que outros pesquisadores possam se basear nesse trabalho e aproximar da realidade os verdadeiros usos de sistemas de tradu\u00e7\u00e3o.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">A nossa capacidade de comunica\u00e7\u00e3o \u00e9 um dos aspectos mais fundamentais do ser humano. As tecnologias<\/span><span style=\"font-weight: 400\">, da prensa m\u00f3vel ao <\/span><span style=\"font-weight: 400\">bate-papo em v\u00eddeo, t\u00eam frequentemente transformado nossa maneira de nos comunicar e compartilhar ideias. O poder dessas e de outras tecnologias se estender\u00e1 quando elas puderem funcionar da mesma forma para bilh\u00f5es de pessoas no mundo inteiro, proporcionando-lhes um acesso semelhante \u00e0s informa\u00e7\u00f5es e permitindo que se comuniquem com um p\u00fablico muito mais amplo, independentemente dos idiomas que elas falam ou escrevem. \u00c0 medida que nos esfor\u00e7amos para construir um mundo mais inclusivo e conectado, ser\u00e1 ainda mais importante derrubar as barreiras que impedem o acesso \u00e0s informa\u00e7\u00f5es e \u00e0s oportunidades, capacitando as pessoas nos idiomas que elas escolherem. <\/span><\/p>\n","protected":false},"excerpt":{"rendered":"&nbsp; Para as pessoas que entendem idiomas como o ingl\u00eas, o mandarim ou o espanhol, pode parecer que os aplicativos e as ferramentas da web atuais j\u00e1 proporcionam a tecnologia de tradu\u00e7\u00e3o de que precisamos. Mas h\u00e1 bilh\u00f5es de pessoas que s\u00e3o deixadas de fora, sem a possibilidade de acessar facilmente a maioria das informa\u00e7\u00f5es na internet e de se conectar com a maior parte do mundo online em seu idioma nativo. Os atuais sistemas de tradu\u00e7\u00e3o autom\u00e1tica (MT, na sigla em ingl\u00eas) est\u00e3o se aprimorando rapidamente, mas ainda dependem muito do aprendizado com grandes quantidades de dados textuais, portanto, geralmente n\u00e3o funcionam bem para idiomas de recursos baixos, ou seja, idiomas que n\u00e3o t\u00eam dados para aprendizado de m\u00e1quina, e para idiomas que n\u00e3o t\u00eam um sistema de escrita padronizado.\u00a0 Eliminar a barreira da l\u00edngua seria algo profundo, que proporcionaria a bilh\u00f5es de pessoas o acesso \u00e0s informa\u00e7\u00f5es online em seus idiomas nativos ou preferenciais. Os avan\u00e7os da MT n\u00e3o ajudar\u00e3o apenas as pessoas que n\u00e3o falam nenhum dos idiomas que dominam a internet atualmente; eles tamb\u00e9m v\u00e3o alterar, de maneira fundamental, a forma como as pessoas do mundo inteiro se conectam e compartilham ideias.\u00a0 E, ao usarmos cada vez mais o metaverso, precisaremos criar espa\u00e7os virtuais imersivos em que as pessoas possam participar e se comunicar independentemente dos idiomas que elas falam.\u00a0 Pense, por exemplo, em um mercado em que haja pessoas que falam idiomas diferentes se comunicando em tempo real usando um smartphone, um rel\u00f3gio ou um \u00f3culos. Imagine ainda um conte\u00fado multim\u00eddia na web que seja acess\u00edvel a qualquer pessoa do mundo em seu idioma de prefer\u00eancia. Em um futuro n\u00e3o muito distante, quando as tecnologias emergentes como a realidade virtual e aumentada unirem o mundo digital e o mundo f\u00edsico no metaverso, as ferramentas de tradu\u00e7\u00e3o permitir\u00e3o que as pessoas realizem as atividades do dia a dia, como organizar um clube de leitura ou colaborar em um projeto de trabalho, com qualquer um e em qualquer lugar, da mesma forma que o fariam com um vizinho.\u00a0 A Meta AI est\u00e1 anunciando uma iniciativa de longo prazo para criar ferramentas de idiomas e MT que incluir\u00e3o a maioria dos idiomas do mundo. Isso inclui dois novos projetos. O primeiro \u00e9 o No Language Left Behind (Nenhum Idioma Deixado para Tr\u00e1s, em portugu\u00eas), que consiste em construir um novo modelo de intelig\u00eancia artificial avan\u00e7ada capaz de aprender com idiomas que t\u00eam menos exemplos para treinamento. N\u00f3s o usaremos para possibilitar tradu\u00e7\u00f5es de qualidade profissional em centenas de idiomas, como o asturiano, o luganda e o urdu. O segundo \u00e9 o Universal Speech Translator (Tradutor de Fala Universal, em portugu\u00eas), no qual estamos projetando novas abordagens para traduzir a fala em um idioma para outro em tempo real. Assim, poderemos incluir idiomas que n\u00e3o t\u00eam um sistema de escrita padr\u00e3o da mesma forma que aqueles que s\u00e3o falados e escritos.\u00a0 Ser\u00e1 necess\u00e1rio muito mais trabalho para fornecer a todos, no mundo inteiro, ferramentas de tradu\u00e7\u00e3o realmente universais. Mas n\u00f3s acreditamos que as iniciativas descritas aqui s\u00e3o um importante passo \u00e0 frente. Compartilhar os detalhes e liberar nosso c\u00f3digo e nossos modelos no futuro significa que outras pessoas poder\u00e3o aproveitar desse nosso trabalho e nos aproximar da realiza\u00e7\u00e3o desse importante objetivo.\u00a0 Os desafios de traduzir todos os idiomas Os sistemas de tradu\u00e7\u00e3o atuais baseados em IA n\u00e3o s\u00e3o concebidos para atender aos milhares de idiomas usados no mundo inteiro nem para fornecer tradu\u00e7\u00e3o de fala para fala em tempo real. Para realmente atender a todos, a comunidade de pesquisa em MT precisar\u00e1 enfrentar tr\u00eas desafios importantes. Precisaremos superar a escassez de dados, adquirindo mais dados de aprendizado em mais idiomas e encontrando novas formas de aproveitar os que j\u00e1 est\u00e3o dispon\u00edveis. Precisaremos tamb\u00e9m superar os desafios de modelagem que surgem \u00e0 medida que os modelos crescem para atender a muito mais idiomas. E precisaremos ainda encontrar novas formas de avaliar e aprimorar seus resultados.\u00a0 &nbsp; A escassez de dados continua sendo um dos maiores obst\u00e1culos para a expans\u00e3o das ferramentas de tradu\u00e7\u00e3o para mais idiomas. Normalmente, os sistemas de MT para tradu\u00e7\u00e3o de textos se baseiam no aprendizado com milh\u00f5es de frases de dados anotados. Por causa disso, os sistemas de MT capazes de gerar tradu\u00e7\u00f5es de alta qualidade foram desenvolvidos apenas para os poucos idiomas que dominam a web. A expans\u00e3o para outros idiomas significa encontrar maneiras de adquirir e usar exemplos para aprendizado de idiomas cuja presen\u00e7a na web \u00e9 escassa.\u00a0 Para tradu\u00e7\u00e3o direta de fala para fala, o desafio de adquirir dados \u00e9 ainda maior. A maioria dos sistemas de MT de fala usa o texto como etapa intermedi\u00e1ria, o que significa que a fala em um idioma \u00e9 primeiro convertida em texto, depois traduzida para texto no idioma de destino e, por fim, inserida em um sistema de convers\u00e3o de texto para fala para gerar \u00e1udio. Isso faz com que a tradu\u00e7\u00e3o de fala para fala fique dependente de texto em formas que limitam a sua efici\u00eancia e a tornam dif\u00edcil de ampliar para idiomas que s\u00e3o essencialmente orais. Os modelos de tradu\u00e7\u00e3o direta de fala para fala podem permitir a tradu\u00e7\u00e3o de idiomas que n\u00e3o t\u00eam sistemas de escrita padronizados. Essa abordagem tamb\u00e9m pode levar a sistemas de tradu\u00e7\u00e3o muito mais eficientes e r\u00e1pidos, j\u00e1 que eles n\u00e3o precisar\u00e3o das etapas adicionais de convers\u00e3o de fala para texto, da tradu\u00e7\u00e3o deste e da gera\u00e7\u00e3o de fala no idioma de destino.\u00a0 Al\u00e9m da necessidade de dados de aprendizado adequados em milhares de idiomas, os sistemas de MT atuais simplesmente n\u00e3o s\u00e3o concebidos para serem ampliados de forma a atender \u00e0s necessidades de todas as pessoas no mundo inteiro. Muitos sistemas de MT s\u00e3o bil\u00edngues, o que significa que existe um modelo separado para cada par de idiomas, como ingl\u00eas-russo ou japon\u00eas-espanhol. Essa abordagem \u00e9 extraordinariamente dif\u00edcil de ampliar para dezenas de pares de idiomas e mais ainda para todos os idiomas em uso no mundo inteiro. Imagine se voc\u00ea precisasse criar e manter muitos milhares de modelos diferentes para cada combina\u00e7\u00e3o, de tailand\u00eas-laosiano a nepal\u00eas-assam\u00eas. V\u00e1rios especialistas j\u00e1 sugeriram que os sistemas multil\u00edngues podem ajudar a resolver o problema. Mas tem sido extremamente dif\u00edcil incorporar muitos idiomas em um \u00fanico modelo multil\u00edngue eficiente e de alto desempenho que tenha a capacidade de representar todos os idiomas.\u00a0 Os modelos de MT de fala para fala em tempo real enfrentam muitos dos mesmos desafios dos modelos baseados em texto, mas tamb\u00e9m precisam superar a lat\u00eancia \u2014 o atraso que ocorre quando um idioma est\u00e1 sendo traduzido para outro \u2014 para poderem ser usados com efic\u00e1cia nas tradu\u00e7\u00f5es em tempo real. O principal desafio deriva do fato de que uma frase pode ser falada em uma ordem diferente de palavras em idiomas distintos. At\u00e9 mesmo os profissionais de tradu\u00e7\u00e3o simult\u00e2nea apresentam um atraso de aproximadamente tr\u00eas segundos em rela\u00e7\u00e3o \u00e0 fala original. Considere uma frase em alem\u00e3o, \u201cIch m\u00f6chte alle Sprachen \u00fcbersetzen\u201d, e a sua equivalente em espanhol, \u201cQuisiera traducir todos los idiomas\u201d. Ambas significam \u201cGostaria de traduzir todos os idiomas\u201d. Mas traduzir do alem\u00e3o para o ingl\u00eas em tempo real seria mais dif\u00edcil porque o verbo \u201ctraduzir\u201d aparece no final da frase, enquanto a ordem das palavras em espanhol e em ingl\u00eas \u00e9 semelhante. Por fim, ao ampliarmos para cada vez mais idiomas, precisamos tamb\u00e9m desenvolver novas formas de avaliar o trabalho produzido pelos modelos de MT. J\u00e1 existem recursos para avaliar a qualidade das tradu\u00e7\u00f5es entre determinados idiomas, por exemplo, do ingl\u00eas para o russo; mas e se as tradu\u00e7\u00f5es forem do am\u00e1rico para o cazaque? Ao expandirmos o n\u00famero de idiomas que os nossos modelos de MT s\u00e3o capazes de traduzir, precisaremos tamb\u00e9m desenvolver novas abordagens com rela\u00e7\u00e3o aos dados e \u00e0 mensura\u00e7\u00e3o de aprendizado para abranger mais idiomas. Al\u00e9m de avaliar o desempenho dos sistemas de MT com rela\u00e7\u00e3o \u00e0 precis\u00e3o, tamb\u00e9m \u00e9 importante assegurar que as tradu\u00e7\u00f5es sejam feitas de forma respons\u00e1vel. Precisaremos encontrar maneiras de assegurar que os sistemas de MT preservem as sensibilidades culturais e n\u00e3o criem nem intensifiquem vieses. Como descrito nas se\u00e7\u00f5es abaixo, a Meta AI est\u00e1 trabalhando com cada um desses tr\u00eas desafios. Treinando sistemas de tradu\u00e7\u00e3o direta de fala para fala e de recursos baixos Para possibilitar as tradu\u00e7\u00f5es de idiomas de recursos baixos e para criar os elementos b\u00e1sicos para futuras tradu\u00e7\u00f5es de mais idiomas independentemente de quanto eles sejam falados ou escritos, estamos expandindo nossas t\u00e9cnicas de cria\u00e7\u00e3o autom\u00e1tica de conjuntos de dados. Uma dessas t\u00e9cnicas \u00e9 o LASER, um kit de ferramentas de c\u00f3digo aberto que atualmente abrange mais de 125 idiomas escritos em 28 scripts diferentes.\u00a0 O LASER converte frases de v\u00e1rios idiomas em uma \u00fanica representa\u00e7\u00e3o multil\u00edngue. Em seguida, usamos uma pesquisa de semelhan\u00e7a multil\u00edngue em grande escala para identificar frases que t\u00eam uma representa\u00e7\u00e3o semelhante, ou seja, que provavelmente t\u00eam o mesmo significado em diferentes idiomas. Usamos o LASER para construir sistemas como o ccMatrix e o ccAligned, que s\u00e3o capazes de localizar textos paralelos na internet. Devido \u00e0 escassez de dados dispon\u00edveis para os idiomas de recursos baixos, criamos um novo m\u00e9todo de aprendizado professor-aluno que permite que o LASER se concentre em subgrupos de idiomas espec\u00edficos, como os idiomas bantos, e aprenda com conjuntos de dados muito menores. Isso permite que o LASER opere em escala com v\u00e1rios idiomas de forma eficaz. Cada um desses progressos nos permitir\u00e1 abranger mais idiomas \u00e0 medida que avan\u00e7amos no seu dimensionamento, aprimoramento e expans\u00e3o para incluir minera\u00e7\u00e3o de dados para centenas de idiomas e, por fim, para todos os idiomas que t\u00eam um sistema de escrita. Recentemente, estendemos o LASER para que funcione tamb\u00e9m com a fala: gra\u00e7as \u00e0 constru\u00e7\u00e3o de representa\u00e7\u00f5es para fala e texto no mesmo espa\u00e7o multil\u00edngue, conseguimos extrair tradu\u00e7\u00f5es entre fala em um idioma e texto em outro e at\u00e9 mesmo tradu\u00e7\u00f5es diretas de fala para fala. Com esse m\u00e9todo, j\u00e1 identificamos cerca de 1.400 horas de fala alinhada em franc\u00eas, alem\u00e3o, espanhol e ingl\u00eas. Os dados de texto s\u00e3o importantes, mas n\u00e3o s\u00e3o suficientes para construir ferramentas de tradu\u00e7\u00e3o que atendam \u00e0s necessidades de todos. Anteriormente, havia disponibilidade de dados de refer\u00eancia de tradu\u00e7\u00e3o de fala para uns poucos idiomas, por isso criamos o CoVoST 2, que abrange 22 idiomas e 36 dire\u00e7\u00f5es lingu\u00edsticas com diferentes condi\u00e7\u00f5es de recursos. Al\u00e9m disso, \u00e9 dif\u00edcil encontrar grandes quantidades de \u00e1udio em diferentes idiomas. O VoxPopuli, que cont\u00e9m 400 mil horas de fala em 23 idiomas, permite o aprendizado em grande escala semissupervisionado e autossupervisionado para programas como reconhecimento de fala e tradu\u00e7\u00e3o de fala. Posteriormente, o VoxPopuli foi usado para construir o maior modelo pr\u00e9-treinado aberto e universal para 128 idiomas e tarefas de fala, incluindo a tradu\u00e7\u00e3o de fala. Esse modelo aprimorou o modelo de ponta anterior para a tradu\u00e7\u00e3o de fala para texto de 21 idiomas para o ingl\u00eas em 7.4 BLEU no conjunto de dados CoVoST 2. Construindo modelos que funcionam em muitos idiomas e diferentes modalidades Al\u00e9m de produzir mais dados para treinar os sistemas de MT e torn\u00e1-los dispon\u00edveis para outros pesquisadores, estamos trabalhando para aprimorar a capacidade do modelo e poder assim lidar com tradu\u00e7\u00f5es entre um conjunto de idiomas muito mais amplo. Os sistemas de MT atuais frequentemente funcionam em uma \u00fanica modalidade e em um conjunto de idiomas limitado. Se o modelo for pequeno demais para representar muitos idiomas, o seu desempenho poder\u00e1 ser prejudicado, introduzindo erros tanto nas tradu\u00e7\u00f5es de texto como nas de fala. As inova\u00e7\u00f5es na modelagem nos ajudar\u00e3o a criar um futuro em que as tradu\u00e7\u00f5es ser\u00e3o transferidas de forma r\u00e1pida e fluida entre diferentes modalidades, indo de fala para texto, de texto para fala, de texto para texto e de fala para fala em in\u00fameros idiomas.\u00a0\u00a0 Para obter um desempenho aprimorado de nossos modelos de MT, investimos muito na cria\u00e7\u00e3o de modelos que apresentem um aprendizado eficiente apesar de sua grande capacidade, com foco em modelos de especialidades mistas restringidos de forma esparsa. Aumentando o tamanho do modelo e aprendendo uma fun\u00e7\u00e3o de roteamento autom\u00e1tico de forma que tokens diferentes usem recursos de especialidades diferentes, conseguimos equilibrar o desempenho das tradu\u00e7\u00f5es de recursos altos e de recursos baixos.\u00a0 Para ampliar uma MT baseada em texto para 101 idiomas, criamos o primeiro sistema de tradu\u00e7\u00e3o de texto multil\u00edngue n\u00e3o centrado no ingl\u00eas. Os sistemas bil\u00edngues geralmente funcionam traduzindo primeiro do idioma de origem para o ingl\u00eas e, em seguida, do ingl\u00eas para o idioma de destino. Para tornar esses sistemas mais eficientes e aumentar a sua qualidade, eliminamos o ingl\u00eas como meio, de maneira que os idiomas possam ser traduzidos diretamente para outros idiomas sem passar pelo ingl\u00eas. Embora a elimina\u00e7\u00e3o do ingl\u00eas tenha aumentado a capacidade do modelo, os modelos multil\u00edngues anteriormente n\u00e3o eram capazes de atingir o mesmo n\u00edvel de qualidade do que os sistemas bil\u00edngues feitos sob medida. Recentemente, no entanto, nosso sistema de tradu\u00e7\u00e3o multil\u00edngue ganhou o concurso Workshop on Machine Translation, superando at\u00e9 mesmo os melhores modelos bil\u00edngues. Queremos que a nossa tecnologia seja inclusiva: ela deve abranger tanto os idiomas escritos como os idiomas que n\u00e3o t\u00eam sistema de escrita padronizado. Pensando nisso, estamos desenvolvendo um sistema de tradu\u00e7\u00e3o de fala para fala que n\u00e3o depende da gera\u00e7\u00e3o de uma representa\u00e7\u00e3o textual intermedi\u00e1ria durante a infer\u00eancia. Foi demonstrado que essa abordagem \u00e9 mais r\u00e1pida do que os sistemas tradicionais em cascata que combinam modelos separados de reconhecimento de fala, tradu\u00e7\u00e3o autom\u00e1tica e s\u00edntese de fala. Com maior efici\u00eancia e uma arquitetura mais simples, a tradu\u00e7\u00e3o direta de fala para fala pode proporcionar uma tradu\u00e7\u00e3o em tempo real de qualidade quase humana para futuros dispositivos, como \u00f3culos de realidade aumentada. Por fim, para criar tradu\u00e7\u00f5es faladas que preservem a expressividade e a singularidade na fala das pessoas, estamos trabalhando para incluir alguns aspectos do \u00e1udio de entrada, como a entona\u00e7\u00e3o, nas tradu\u00e7\u00f5es geradas de \u00e1udio. Mensurando o sucesso em centenas de idiomas O desenvolvimento de modelos em grande escala que possam traduzir entre muito mais idiomas faz surgir uma pergunta importante: como podemos determinar se desenvolvemos dados ou modelos melhores? Avaliar o desempenho de um modelo multil\u00edngue em grande escala \u00e9 complicado, especialmente porque requer um conhecimento aprofundado de todos os idiomas que o modelo abrange \u2014 um desafio que \u00e9 demorado, demanda muitos recursos e frequentemente \u00e9 invi\u00e1vel.\u00a0 N\u00f3s criamos o FLORES-101, o primeiro conjunto de dados de avalia\u00e7\u00e3o de tradu\u00e7\u00e3o multilingue que abrange 101 idiomas, permitindo que os pesquisadores testem e aprimorem rapidamente os modelos de tradu\u00e7\u00e3o multil\u00edngues. Diferentemente dos conjuntos de dados existentes, o FLORES-101 permite que os pesquisadores quantifiquem o desempenho dos sistemas em qualquer dire\u00e7\u00e3o lingu\u00edstica, e n\u00e3o apenas de tradu\u00e7\u00f5es de\/para o ingl\u00eas. Para os milh\u00f5es de pessoas do mundo inteiro que vivem em locais com dezenas de idiomas oficiais, isso permite a cria\u00e7\u00e3o de sistemas de tradu\u00e7\u00e3o que atendem a necessidades importantes do mundo real.\u00a0 Usando o FLORES-101, temos colaborado com outros l\u00edderes da comunidade de pesquisa em IA para fazer avan\u00e7ar a tradu\u00e7\u00e3o multil\u00edngue com recursos baixos. No Workshop on Machine Translation de 2021, organizamos uma tarefa compartilhada para fazer progressos nesta \u00e1rea de forma coletiva. Houve a participa\u00e7\u00e3o de pesquisadores do mundo inteiro, muitos dos quais com foco em idiomas pessoalmente relevantes para eles. Esperamos continuar expandindo o FLORES para abranger centenas de idiomas. Ao fazermos progressos tang\u00edveis em dire\u00e7\u00e3o a uma tradu\u00e7\u00e3o universal, tamb\u00e9m nos concentramos em fazer isso de forma respons\u00e1vel. Estamos trabalhando em colabora\u00e7\u00e3o com linguistas para entender os desafios de produzir cole\u00e7\u00f5es de conjuntos de dados corretos e com redes de avaliadores para assegurar que as tradu\u00e7\u00f5es sejam corretas. Tamb\u00e9m estamos realizando estudos de caso com falantes de mais de 20 idiomas, para saber quais caracter\u00edsticas da tradu\u00e7\u00e3o s\u00e3o importantes para as pessoas com diferentes hist\u00f3ricos e como elas usar\u00e3o as tradu\u00e7\u00f5es que nossos modelos de IA produzem. Existem muitos outros aspectos para o desenvolvimento respons\u00e1vel de uma tradu\u00e7\u00e3o universal, incluindo a diminui\u00e7\u00e3o do vi\u00e9s e da toxicidade e a preserva\u00e7\u00e3o das sensibilidades culturais ao passar as informa\u00e7\u00f5es de um idioma para outro. Para alcan\u00e7armos nossos objetivos de longo prazo em rela\u00e7\u00e3o \u00e0 tradu\u00e7\u00e3o, precisaremos n\u00e3o apenas de conhecimento em IA, mas tamb\u00e9m da contribui\u00e7\u00e3o cont\u00ednua de diversos especialistas, pesquisadores e indiv\u00edduos do mundo inteiro.\u00a0 Qual \u00e9 o pr\u00f3ximo passo? Se o No Language Left Behind e o Universal Speech Translator, combinados com as iniciativas da comunidade de pesquisa em MT, conseguirem criar tecnologias de tradu\u00e7\u00e3o que incluam todos os habitantes do planeta, isso abrir\u00e1 o mundo digital e o mundo f\u00edsico de maneiras que antes n\u00e3o eram poss\u00edveis. J\u00e1 estamos fazendo progressos no sentido de possibilitar tradu\u00e7\u00f5es envolvendo idiomas com poucos recursos, uma barreira significativa \u00e0 tradu\u00e7\u00e3o universal para a maior parte da popula\u00e7\u00e3o do mundo. Ao avan\u00e7ar e abrir o c\u00f3digo do nosso trabalho na cria\u00e7\u00e3o de corpus, modelagem multil\u00edngue e avalia\u00e7\u00e3o, esperamos que outros pesquisadores possam se basear nesse trabalho e aproximar da realidade os verdadeiros usos de sistemas de tradu\u00e7\u00e3o.\u00a0 A nossa capacidade de comunica\u00e7\u00e3o \u00e9 um dos aspectos mais fundamentais do ser humano. As tecnologias, da prensa m\u00f3vel ao bate-papo em v\u00eddeo, t\u00eam frequentemente transformado nossa maneira de nos comunicar e compartilhar ideias. O poder dessas e de outras tecnologias se estender\u00e1 quando elas puderem funcionar da mesma forma para bilh\u00f5es de pessoas no mundo inteiro, proporcionando-lhes um acesso semelhante \u00e0s informa\u00e7\u00f5es e permitindo que se comuniquem com um p\u00fablico muito mais amplo, independentemente dos idiomas que elas falam ou escrevem. \u00c0 medida que nos esfor\u00e7amos para construir um mundo mais inclusivo e conectado, ser\u00e1 ainda mais importante derrubar as barreiras que impedem o acesso \u00e0s informa\u00e7\u00f5es e \u00e0s oportunidades, capacitando as pessoas nos idiomas que elas escolherem.","protected":false},"author":81109636,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[210824851],"tags":[],"class_list":["post-23650","post","type-post","status-publish","format-standard","hentry","category-homepage-hidden"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.2 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos | Sobre a Meta<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/\" \/>\n<meta property=\"og:locale\" content=\"pt_BR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos | Sobre a Meta\" \/>\n<meta property=\"og:description\" content=\"&nbsp; Para as pessoas que entendem idiomas como o ingl\u00eas, o mandarim ou o espanhol, pode parecer que os aplicativos e as ferramentas da web atuais j\u00e1 proporcionam a tecnologia de tradu\u00e7\u00e3o de que precisamos. Mas h\u00e1 bilh\u00f5es de pessoas que s\u00e3o deixadas de fora, sem a possibilidade de acessar facilmente a maioria das informa\u00e7\u00f5es na internet e de se conectar com a maior parte do mundo online em seu idioma nativo. Os atuais sistemas de tradu\u00e7\u00e3o autom\u00e1tica (MT, na sigla em ingl\u00eas) est\u00e3o se aprimorando rapidamente, mas ainda dependem muito do aprendizado com grandes quantidades de dados textuais, portanto, geralmente n\u00e3o funcionam bem para idiomas de recursos baixos, ou seja, idiomas que n\u00e3o t\u00eam dados para aprendizado de m\u00e1quina, e para idiomas que n\u00e3o t\u00eam um sistema de escrita padronizado.\u00a0 Eliminar a barreira da l\u00edngua seria algo profundo, que proporcionaria a bilh\u00f5es de pessoas o acesso \u00e0s informa\u00e7\u00f5es online em seus idiomas nativos ou preferenciais. Os avan\u00e7os da MT n\u00e3o ajudar\u00e3o apenas as pessoas que n\u00e3o falam nenhum dos idiomas que dominam a internet atualmente; eles tamb\u00e9m v\u00e3o alterar, de maneira fundamental, a forma como as pessoas do mundo inteiro se conectam e compartilham ideias.\u00a0 E, ao usarmos cada vez mais o metaverso, precisaremos criar espa\u00e7os virtuais imersivos em que as pessoas possam participar e se comunicar independentemente dos idiomas que elas falam.\u00a0 Pense, por exemplo, em um mercado em que haja pessoas que falam idiomas diferentes se comunicando em tempo real usando um smartphone, um rel\u00f3gio ou um \u00f3culos. Imagine ainda um conte\u00fado multim\u00eddia na web que seja acess\u00edvel a qualquer pessoa do mundo em seu idioma de prefer\u00eancia. Em um futuro n\u00e3o muito distante, quando as tecnologias emergentes como a realidade virtual e aumentada unirem o mundo digital e o mundo f\u00edsico no metaverso, as ferramentas de tradu\u00e7\u00e3o permitir\u00e3o que as pessoas realizem as atividades do dia a dia, como organizar um clube de leitura ou colaborar em um projeto de trabalho, com qualquer um e em qualquer lugar, da mesma forma que o fariam com um vizinho.\u00a0 A Meta AI est\u00e1 anunciando uma iniciativa de longo prazo para criar ferramentas de idiomas e MT que incluir\u00e3o a maioria dos idiomas do mundo. Isso inclui dois novos projetos. O primeiro \u00e9 o No Language Left Behind (Nenhum Idioma Deixado para Tr\u00e1s, em portugu\u00eas), que consiste em construir um novo modelo de intelig\u00eancia artificial avan\u00e7ada capaz de aprender com idiomas que t\u00eam menos exemplos para treinamento. N\u00f3s o usaremos para possibilitar tradu\u00e7\u00f5es de qualidade profissional em centenas de idiomas, como o asturiano, o luganda e o urdu. O segundo \u00e9 o Universal Speech Translator (Tradutor de Fala Universal, em portugu\u00eas), no qual estamos projetando novas abordagens para traduzir a fala em um idioma para outro em tempo real. Assim, poderemos incluir idiomas que n\u00e3o t\u00eam um sistema de escrita padr\u00e3o da mesma forma que aqueles que s\u00e3o falados e escritos.\u00a0 Ser\u00e1 necess\u00e1rio muito mais trabalho para fornecer a todos, no mundo inteiro, ferramentas de tradu\u00e7\u00e3o realmente universais. Mas n\u00f3s acreditamos que as iniciativas descritas aqui s\u00e3o um importante passo \u00e0 frente. Compartilhar os detalhes e liberar nosso c\u00f3digo e nossos modelos no futuro significa que outras pessoas poder\u00e3o aproveitar desse nosso trabalho e nos aproximar da realiza\u00e7\u00e3o desse importante objetivo.\u00a0 Os desafios de traduzir todos os idiomas Os sistemas de tradu\u00e7\u00e3o atuais baseados em IA n\u00e3o s\u00e3o concebidos para atender aos milhares de idiomas usados no mundo inteiro nem para fornecer tradu\u00e7\u00e3o de fala para fala em tempo real. Para realmente atender a todos, a comunidade de pesquisa em MT precisar\u00e1 enfrentar tr\u00eas desafios importantes. Precisaremos superar a escassez de dados, adquirindo mais dados de aprendizado em mais idiomas e encontrando novas formas de aproveitar os que j\u00e1 est\u00e3o dispon\u00edveis. Precisaremos tamb\u00e9m superar os desafios de modelagem que surgem \u00e0 medida que os modelos crescem para atender a muito mais idiomas. E precisaremos ainda encontrar novas formas de avaliar e aprimorar seus resultados.\u00a0 &nbsp; A escassez de dados continua sendo um dos maiores obst\u00e1culos para a expans\u00e3o das ferramentas de tradu\u00e7\u00e3o para mais idiomas. Normalmente, os sistemas de MT para tradu\u00e7\u00e3o de textos se baseiam no aprendizado com milh\u00f5es de frases de dados anotados. Por causa disso, os sistemas de MT capazes de gerar tradu\u00e7\u00f5es de alta qualidade foram desenvolvidos apenas para os poucos idiomas que dominam a web. A expans\u00e3o para outros idiomas significa encontrar maneiras de adquirir e usar exemplos para aprendizado de idiomas cuja presen\u00e7a na web \u00e9 escassa.\u00a0 Para tradu\u00e7\u00e3o direta de fala para fala, o desafio de adquirir dados \u00e9 ainda maior. A maioria dos sistemas de MT de fala usa o texto como etapa intermedi\u00e1ria, o que significa que a fala em um idioma \u00e9 primeiro convertida em texto, depois traduzida para texto no idioma de destino e, por fim, inserida em um sistema de convers\u00e3o de texto para fala para gerar \u00e1udio. Isso faz com que a tradu\u00e7\u00e3o de fala para fala fique dependente de texto em formas que limitam a sua efici\u00eancia e a tornam dif\u00edcil de ampliar para idiomas que s\u00e3o essencialmente orais. Os modelos de tradu\u00e7\u00e3o direta de fala para fala podem permitir a tradu\u00e7\u00e3o de idiomas que n\u00e3o t\u00eam sistemas de escrita padronizados. Essa abordagem tamb\u00e9m pode levar a sistemas de tradu\u00e7\u00e3o muito mais eficientes e r\u00e1pidos, j\u00e1 que eles n\u00e3o precisar\u00e3o das etapas adicionais de convers\u00e3o de fala para texto, da tradu\u00e7\u00e3o deste e da gera\u00e7\u00e3o de fala no idioma de destino.\u00a0 Al\u00e9m da necessidade de dados de aprendizado adequados em milhares de idiomas, os sistemas de MT atuais simplesmente n\u00e3o s\u00e3o concebidos para serem ampliados de forma a atender \u00e0s necessidades de todas as pessoas no mundo inteiro. Muitos sistemas de MT s\u00e3o bil\u00edngues, o que significa que existe um modelo separado para cada par de idiomas, como ingl\u00eas-russo ou japon\u00eas-espanhol. Essa abordagem \u00e9 extraordinariamente dif\u00edcil de ampliar para dezenas de pares de idiomas e mais ainda para todos os idiomas em uso no mundo inteiro. Imagine se voc\u00ea precisasse criar e manter muitos milhares de modelos diferentes para cada combina\u00e7\u00e3o, de tailand\u00eas-laosiano a nepal\u00eas-assam\u00eas. V\u00e1rios especialistas j\u00e1 sugeriram que os sistemas multil\u00edngues podem ajudar a resolver o problema. Mas tem sido extremamente dif\u00edcil incorporar muitos idiomas em um \u00fanico modelo multil\u00edngue eficiente e de alto desempenho que tenha a capacidade de representar todos os idiomas.\u00a0 Os modelos de MT de fala para fala em tempo real enfrentam muitos dos mesmos desafios dos modelos baseados em texto, mas tamb\u00e9m precisam superar a lat\u00eancia \u2014 o atraso que ocorre quando um idioma est\u00e1 sendo traduzido para outro \u2014 para poderem ser usados com efic\u00e1cia nas tradu\u00e7\u00f5es em tempo real. O principal desafio deriva do fato de que uma frase pode ser falada em uma ordem diferente de palavras em idiomas distintos. At\u00e9 mesmo os profissionais de tradu\u00e7\u00e3o simult\u00e2nea apresentam um atraso de aproximadamente tr\u00eas segundos em rela\u00e7\u00e3o \u00e0 fala original. Considere uma frase em alem\u00e3o, \u201cIch m\u00f6chte alle Sprachen \u00fcbersetzen\u201d, e a sua equivalente em espanhol, \u201cQuisiera traducir todos los idiomas\u201d. Ambas significam \u201cGostaria de traduzir todos os idiomas\u201d. Mas traduzir do alem\u00e3o para o ingl\u00eas em tempo real seria mais dif\u00edcil porque o verbo \u201ctraduzir\u201d aparece no final da frase, enquanto a ordem das palavras em espanhol e em ingl\u00eas \u00e9 semelhante. Por fim, ao ampliarmos para cada vez mais idiomas, precisamos tamb\u00e9m desenvolver novas formas de avaliar o trabalho produzido pelos modelos de MT. J\u00e1 existem recursos para avaliar a qualidade das tradu\u00e7\u00f5es entre determinados idiomas, por exemplo, do ingl\u00eas para o russo; mas e se as tradu\u00e7\u00f5es forem do am\u00e1rico para o cazaque? Ao expandirmos o n\u00famero de idiomas que os nossos modelos de MT s\u00e3o capazes de traduzir, precisaremos tamb\u00e9m desenvolver novas abordagens com rela\u00e7\u00e3o aos dados e \u00e0 mensura\u00e7\u00e3o de aprendizado para abranger mais idiomas. Al\u00e9m de avaliar o desempenho dos sistemas de MT com rela\u00e7\u00e3o \u00e0 precis\u00e3o, tamb\u00e9m \u00e9 importante assegurar que as tradu\u00e7\u00f5es sejam feitas de forma respons\u00e1vel. Precisaremos encontrar maneiras de assegurar que os sistemas de MT preservem as sensibilidades culturais e n\u00e3o criem nem intensifiquem vieses. Como descrito nas se\u00e7\u00f5es abaixo, a Meta AI est\u00e1 trabalhando com cada um desses tr\u00eas desafios. Treinando sistemas de tradu\u00e7\u00e3o direta de fala para fala e de recursos baixos Para possibilitar as tradu\u00e7\u00f5es de idiomas de recursos baixos e para criar os elementos b\u00e1sicos para futuras tradu\u00e7\u00f5es de mais idiomas independentemente de quanto eles sejam falados ou escritos, estamos expandindo nossas t\u00e9cnicas de cria\u00e7\u00e3o autom\u00e1tica de conjuntos de dados. Uma dessas t\u00e9cnicas \u00e9 o LASER, um kit de ferramentas de c\u00f3digo aberto que atualmente abrange mais de 125 idiomas escritos em 28 scripts diferentes.\u00a0 O LASER converte frases de v\u00e1rios idiomas em uma \u00fanica representa\u00e7\u00e3o multil\u00edngue. Em seguida, usamos uma pesquisa de semelhan\u00e7a multil\u00edngue em grande escala para identificar frases que t\u00eam uma representa\u00e7\u00e3o semelhante, ou seja, que provavelmente t\u00eam o mesmo significado em diferentes idiomas. Usamos o LASER para construir sistemas como o ccMatrix e o ccAligned, que s\u00e3o capazes de localizar textos paralelos na internet. Devido \u00e0 escassez de dados dispon\u00edveis para os idiomas de recursos baixos, criamos um novo m\u00e9todo de aprendizado professor-aluno que permite que o LASER se concentre em subgrupos de idiomas espec\u00edficos, como os idiomas bantos, e aprenda com conjuntos de dados muito menores. Isso permite que o LASER opere em escala com v\u00e1rios idiomas de forma eficaz. Cada um desses progressos nos permitir\u00e1 abranger mais idiomas \u00e0 medida que avan\u00e7amos no seu dimensionamento, aprimoramento e expans\u00e3o para incluir minera\u00e7\u00e3o de dados para centenas de idiomas e, por fim, para todos os idiomas que t\u00eam um sistema de escrita. Recentemente, estendemos o LASER para que funcione tamb\u00e9m com a fala: gra\u00e7as \u00e0 constru\u00e7\u00e3o de representa\u00e7\u00f5es para fala e texto no mesmo espa\u00e7o multil\u00edngue, conseguimos extrair tradu\u00e7\u00f5es entre fala em um idioma e texto em outro e at\u00e9 mesmo tradu\u00e7\u00f5es diretas de fala para fala. Com esse m\u00e9todo, j\u00e1 identificamos cerca de 1.400 horas de fala alinhada em franc\u00eas, alem\u00e3o, espanhol e ingl\u00eas. Os dados de texto s\u00e3o importantes, mas n\u00e3o s\u00e3o suficientes para construir ferramentas de tradu\u00e7\u00e3o que atendam \u00e0s necessidades de todos. Anteriormente, havia disponibilidade de dados de refer\u00eancia de tradu\u00e7\u00e3o de fala para uns poucos idiomas, por isso criamos o CoVoST 2, que abrange 22 idiomas e 36 dire\u00e7\u00f5es lingu\u00edsticas com diferentes condi\u00e7\u00f5es de recursos. Al\u00e9m disso, \u00e9 dif\u00edcil encontrar grandes quantidades de \u00e1udio em diferentes idiomas. O VoxPopuli, que cont\u00e9m 400 mil horas de fala em 23 idiomas, permite o aprendizado em grande escala semissupervisionado e autossupervisionado para programas como reconhecimento de fala e tradu\u00e7\u00e3o de fala. Posteriormente, o VoxPopuli foi usado para construir o maior modelo pr\u00e9-treinado aberto e universal para 128 idiomas e tarefas de fala, incluindo a tradu\u00e7\u00e3o de fala. Esse modelo aprimorou o modelo de ponta anterior para a tradu\u00e7\u00e3o de fala para texto de 21 idiomas para o ingl\u00eas em 7.4 BLEU no conjunto de dados CoVoST 2. Construindo modelos que funcionam em muitos idiomas e diferentes modalidades Al\u00e9m de produzir mais dados para treinar os sistemas de MT e torn\u00e1-los dispon\u00edveis para outros pesquisadores, estamos trabalhando para aprimorar a capacidade do modelo e poder assim lidar com tradu\u00e7\u00f5es entre um conjunto de idiomas muito mais amplo. Os sistemas de MT atuais frequentemente funcionam em uma \u00fanica modalidade e em um conjunto de idiomas limitado. Se o modelo for pequeno demais para representar muitos idiomas, o seu desempenho poder\u00e1 ser prejudicado, introduzindo erros tanto nas tradu\u00e7\u00f5es de texto como nas de fala. As inova\u00e7\u00f5es na modelagem nos ajudar\u00e3o a criar um futuro em que as tradu\u00e7\u00f5es ser\u00e3o transferidas de forma r\u00e1pida e fluida entre diferentes modalidades, indo de fala para texto, de texto para fala, de texto para texto e de fala para fala em in\u00fameros idiomas.\u00a0\u00a0 Para obter um desempenho aprimorado de nossos modelos de MT, investimos muito na cria\u00e7\u00e3o de modelos que apresentem um aprendizado eficiente apesar de sua grande capacidade, com foco em modelos de especialidades mistas restringidos de forma esparsa. Aumentando o tamanho do modelo e aprendendo uma fun\u00e7\u00e3o de roteamento autom\u00e1tico de forma que tokens diferentes usem recursos de especialidades diferentes, conseguimos equilibrar o desempenho das tradu\u00e7\u00f5es de recursos altos e de recursos baixos.\u00a0 Para ampliar uma MT baseada em texto para 101 idiomas, criamos o primeiro sistema de tradu\u00e7\u00e3o de texto multil\u00edngue n\u00e3o centrado no ingl\u00eas. Os sistemas bil\u00edngues geralmente funcionam traduzindo primeiro do idioma de origem para o ingl\u00eas e, em seguida, do ingl\u00eas para o idioma de destino. Para tornar esses sistemas mais eficientes e aumentar a sua qualidade, eliminamos o ingl\u00eas como meio, de maneira que os idiomas possam ser traduzidos diretamente para outros idiomas sem passar pelo ingl\u00eas. Embora a elimina\u00e7\u00e3o do ingl\u00eas tenha aumentado a capacidade do modelo, os modelos multil\u00edngues anteriormente n\u00e3o eram capazes de atingir o mesmo n\u00edvel de qualidade do que os sistemas bil\u00edngues feitos sob medida. Recentemente, no entanto, nosso sistema de tradu\u00e7\u00e3o multil\u00edngue ganhou o concurso Workshop on Machine Translation, superando at\u00e9 mesmo os melhores modelos bil\u00edngues. Queremos que a nossa tecnologia seja inclusiva: ela deve abranger tanto os idiomas escritos como os idiomas que n\u00e3o t\u00eam sistema de escrita padronizado. Pensando nisso, estamos desenvolvendo um sistema de tradu\u00e7\u00e3o de fala para fala que n\u00e3o depende da gera\u00e7\u00e3o de uma representa\u00e7\u00e3o textual intermedi\u00e1ria durante a infer\u00eancia. Foi demonstrado que essa abordagem \u00e9 mais r\u00e1pida do que os sistemas tradicionais em cascata que combinam modelos separados de reconhecimento de fala, tradu\u00e7\u00e3o autom\u00e1tica e s\u00edntese de fala. Com maior efici\u00eancia e uma arquitetura mais simples, a tradu\u00e7\u00e3o direta de fala para fala pode proporcionar uma tradu\u00e7\u00e3o em tempo real de qualidade quase humana para futuros dispositivos, como \u00f3culos de realidade aumentada. Por fim, para criar tradu\u00e7\u00f5es faladas que preservem a expressividade e a singularidade na fala das pessoas, estamos trabalhando para incluir alguns aspectos do \u00e1udio de entrada, como a entona\u00e7\u00e3o, nas tradu\u00e7\u00f5es geradas de \u00e1udio. Mensurando o sucesso em centenas de idiomas O desenvolvimento de modelos em grande escala que possam traduzir entre muito mais idiomas faz surgir uma pergunta importante: como podemos determinar se desenvolvemos dados ou modelos melhores? Avaliar o desempenho de um modelo multil\u00edngue em grande escala \u00e9 complicado, especialmente porque requer um conhecimento aprofundado de todos os idiomas que o modelo abrange \u2014 um desafio que \u00e9 demorado, demanda muitos recursos e frequentemente \u00e9 invi\u00e1vel.\u00a0 N\u00f3s criamos o FLORES-101, o primeiro conjunto de dados de avalia\u00e7\u00e3o de tradu\u00e7\u00e3o multilingue que abrange 101 idiomas, permitindo que os pesquisadores testem e aprimorem rapidamente os modelos de tradu\u00e7\u00e3o multil\u00edngues. Diferentemente dos conjuntos de dados existentes, o FLORES-101 permite que os pesquisadores quantifiquem o desempenho dos sistemas em qualquer dire\u00e7\u00e3o lingu\u00edstica, e n\u00e3o apenas de tradu\u00e7\u00f5es de\/para o ingl\u00eas. Para os milh\u00f5es de pessoas do mundo inteiro que vivem em locais com dezenas de idiomas oficiais, isso permite a cria\u00e7\u00e3o de sistemas de tradu\u00e7\u00e3o que atendem a necessidades importantes do mundo real.\u00a0 Usando o FLORES-101, temos colaborado com outros l\u00edderes da comunidade de pesquisa em IA para fazer avan\u00e7ar a tradu\u00e7\u00e3o multil\u00edngue com recursos baixos. No Workshop on Machine Translation de 2021, organizamos uma tarefa compartilhada para fazer progressos nesta \u00e1rea de forma coletiva. Houve a participa\u00e7\u00e3o de pesquisadores do mundo inteiro, muitos dos quais com foco em idiomas pessoalmente relevantes para eles. Esperamos continuar expandindo o FLORES para abranger centenas de idiomas. Ao fazermos progressos tang\u00edveis em dire\u00e7\u00e3o a uma tradu\u00e7\u00e3o universal, tamb\u00e9m nos concentramos em fazer isso de forma respons\u00e1vel. Estamos trabalhando em colabora\u00e7\u00e3o com linguistas para entender os desafios de produzir cole\u00e7\u00f5es de conjuntos de dados corretos e com redes de avaliadores para assegurar que as tradu\u00e7\u00f5es sejam corretas. Tamb\u00e9m estamos realizando estudos de caso com falantes de mais de 20 idiomas, para saber quais caracter\u00edsticas da tradu\u00e7\u00e3o s\u00e3o importantes para as pessoas com diferentes hist\u00f3ricos e como elas usar\u00e3o as tradu\u00e7\u00f5es que nossos modelos de IA produzem. Existem muitos outros aspectos para o desenvolvimento respons\u00e1vel de uma tradu\u00e7\u00e3o universal, incluindo a diminui\u00e7\u00e3o do vi\u00e9s e da toxicidade e a preserva\u00e7\u00e3o das sensibilidades culturais ao passar as informa\u00e7\u00f5es de um idioma para outro. Para alcan\u00e7armos nossos objetivos de longo prazo em rela\u00e7\u00e3o \u00e0 tradu\u00e7\u00e3o, precisaremos n\u00e3o apenas de conhecimento em IA, mas tamb\u00e9m da contribui\u00e7\u00e3o cont\u00ednua de diversos especialistas, pesquisadores e indiv\u00edduos do mundo inteiro.\u00a0 Qual \u00e9 o pr\u00f3ximo passo? Se o No Language Left Behind e o Universal Speech Translator, combinados com as iniciativas da comunidade de pesquisa em MT, conseguirem criar tecnologias de tradu\u00e7\u00e3o que incluam todos os habitantes do planeta, isso abrir\u00e1 o mundo digital e o mundo f\u00edsico de maneiras que antes n\u00e3o eram poss\u00edveis. J\u00e1 estamos fazendo progressos no sentido de possibilitar tradu\u00e7\u00f5es envolvendo idiomas com poucos recursos, uma barreira significativa \u00e0 tradu\u00e7\u00e3o universal para a maior parte da popula\u00e7\u00e3o do mundo. Ao avan\u00e7ar e abrir o c\u00f3digo do nosso trabalho na cria\u00e7\u00e3o de corpus, modelagem multil\u00edngue e avalia\u00e7\u00e3o, esperamos que outros pesquisadores possam se basear nesse trabalho e aproximar da realidade os verdadeiros usos de sistemas de tradu\u00e7\u00e3o.\u00a0 A nossa capacidade de comunica\u00e7\u00e3o \u00e9 um dos aspectos mais fundamentais do ser humano. As tecnologias, da prensa m\u00f3vel ao bate-papo em v\u00eddeo, t\u00eam frequentemente transformado nossa maneira de nos comunicar e compartilhar ideias. O poder dessas e de outras tecnologias se estender\u00e1 quando elas puderem funcionar da mesma forma para bilh\u00f5es de pessoas no mundo inteiro, proporcionando-lhes um acesso semelhante \u00e0s informa\u00e7\u00f5es e permitindo que se comuniquem com um p\u00fablico muito mais amplo, independentemente dos idiomas que elas falam ou escrevem. \u00c0 medida que nos esfor\u00e7amos para construir um mundo mais inclusivo e conectado, ser\u00e1 ainda mais importante derrubar as barreiras que impedem o acesso \u00e0s informa\u00e7\u00f5es e \u00e0s oportunidades, capacitando as pessoas nos idiomas que elas escolherem.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/\" \/>\n<meta property=\"og:site_name\" content=\"Sobre a Meta\" \/>\n<meta property=\"article:published_time\" content=\"2022-02-23T17:56:54+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-02-23T19:21:25+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png\" \/>\n<meta name=\"author\" content=\"facebookbr\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Meta\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"14 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/\"},\"author\":\"Facebook company\",\"headline\":\"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos\",\"datePublished\":\"2022-02-23T17:56:54+00:00\",\"dateModified\":\"2022-02-23T19:21:25+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/\"},\"wordCount\":3222,\"publisher\":{\"@id\":\"https:\/\/about.fb.com\/br\/#organization\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png\",\"articleSection\":[\"Homepage - Hidden\"],\"inLanguage\":\"pt-BR\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/\",\"url\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/\",\"name\":\"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos | Sobre a Meta\",\"isPartOf\":{\"@id\":\"https:\/\/about.fb.com\/br\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png\",\"datePublished\":\"2022-02-23T17:56:54+00:00\",\"dateModified\":\"2022-02-23T19:21:25+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#breadcrumb\"},\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/\"]}],\"author\":\"Sobre a Meta\"},{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#primaryimage\",\"url\":\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png?fit=624%2C360\",\"contentUrl\":\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png?fit=624%2C360\",\"width\":624,\"height\":360},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/about.fb.com\/br\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/about.fb.com\/br\/#website\",\"url\":\"https:\/\/about.fb.com\/news\/\",\"name\":\"Sobre a Meta\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\/\/about.fb.com\/br\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/about.fb.com\/br\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pt-BR\",\"alternateName\":[\"Meta Newsroom\",\"Meta\"]},{\"@type\":\"Organization\",\"@id\":\"https:\/\/about.fb.com\/br\/#organization\",\"name\":\"Meta\",\"url\":\"https:\/\/about.fb.com\/br\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/about.fb.com\/br\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500\",\"contentUrl\":\"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500\",\"width\":8000,\"height\":4500,\"caption\":\"Meta\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/br\/#\/schema\/logo\/image\/\"}}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos | Sobre a Meta","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/","og_locale":"pt_BR","og_type":"article","og_title":"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos | Sobre a Meta","og_description":"&nbsp; Para as pessoas que entendem idiomas como o ingl\u00eas, o mandarim ou o espanhol, pode parecer que os aplicativos e as ferramentas da web atuais j\u00e1 proporcionam a tecnologia de tradu\u00e7\u00e3o de que precisamos. Mas h\u00e1 bilh\u00f5es de pessoas que s\u00e3o deixadas de fora, sem a possibilidade de acessar facilmente a maioria das informa\u00e7\u00f5es na internet e de se conectar com a maior parte do mundo online em seu idioma nativo. Os atuais sistemas de tradu\u00e7\u00e3o autom\u00e1tica (MT, na sigla em ingl\u00eas) est\u00e3o se aprimorando rapidamente, mas ainda dependem muito do aprendizado com grandes quantidades de dados textuais, portanto, geralmente n\u00e3o funcionam bem para idiomas de recursos baixos, ou seja, idiomas que n\u00e3o t\u00eam dados para aprendizado de m\u00e1quina, e para idiomas que n\u00e3o t\u00eam um sistema de escrita padronizado.\u00a0 Eliminar a barreira da l\u00edngua seria algo profundo, que proporcionaria a bilh\u00f5es de pessoas o acesso \u00e0s informa\u00e7\u00f5es online em seus idiomas nativos ou preferenciais. Os avan\u00e7os da MT n\u00e3o ajudar\u00e3o apenas as pessoas que n\u00e3o falam nenhum dos idiomas que dominam a internet atualmente; eles tamb\u00e9m v\u00e3o alterar, de maneira fundamental, a forma como as pessoas do mundo inteiro se conectam e compartilham ideias.\u00a0 E, ao usarmos cada vez mais o metaverso, precisaremos criar espa\u00e7os virtuais imersivos em que as pessoas possam participar e se comunicar independentemente dos idiomas que elas falam.\u00a0 Pense, por exemplo, em um mercado em que haja pessoas que falam idiomas diferentes se comunicando em tempo real usando um smartphone, um rel\u00f3gio ou um \u00f3culos. Imagine ainda um conte\u00fado multim\u00eddia na web que seja acess\u00edvel a qualquer pessoa do mundo em seu idioma de prefer\u00eancia. Em um futuro n\u00e3o muito distante, quando as tecnologias emergentes como a realidade virtual e aumentada unirem o mundo digital e o mundo f\u00edsico no metaverso, as ferramentas de tradu\u00e7\u00e3o permitir\u00e3o que as pessoas realizem as atividades do dia a dia, como organizar um clube de leitura ou colaborar em um projeto de trabalho, com qualquer um e em qualquer lugar, da mesma forma que o fariam com um vizinho.\u00a0 A Meta AI est\u00e1 anunciando uma iniciativa de longo prazo para criar ferramentas de idiomas e MT que incluir\u00e3o a maioria dos idiomas do mundo. Isso inclui dois novos projetos. O primeiro \u00e9 o No Language Left Behind (Nenhum Idioma Deixado para Tr\u00e1s, em portugu\u00eas), que consiste em construir um novo modelo de intelig\u00eancia artificial avan\u00e7ada capaz de aprender com idiomas que t\u00eam menos exemplos para treinamento. N\u00f3s o usaremos para possibilitar tradu\u00e7\u00f5es de qualidade profissional em centenas de idiomas, como o asturiano, o luganda e o urdu. O segundo \u00e9 o Universal Speech Translator (Tradutor de Fala Universal, em portugu\u00eas), no qual estamos projetando novas abordagens para traduzir a fala em um idioma para outro em tempo real. Assim, poderemos incluir idiomas que n\u00e3o t\u00eam um sistema de escrita padr\u00e3o da mesma forma que aqueles que s\u00e3o falados e escritos.\u00a0 Ser\u00e1 necess\u00e1rio muito mais trabalho para fornecer a todos, no mundo inteiro, ferramentas de tradu\u00e7\u00e3o realmente universais. Mas n\u00f3s acreditamos que as iniciativas descritas aqui s\u00e3o um importante passo \u00e0 frente. Compartilhar os detalhes e liberar nosso c\u00f3digo e nossos modelos no futuro significa que outras pessoas poder\u00e3o aproveitar desse nosso trabalho e nos aproximar da realiza\u00e7\u00e3o desse importante objetivo.\u00a0 Os desafios de traduzir todos os idiomas Os sistemas de tradu\u00e7\u00e3o atuais baseados em IA n\u00e3o s\u00e3o concebidos para atender aos milhares de idiomas usados no mundo inteiro nem para fornecer tradu\u00e7\u00e3o de fala para fala em tempo real. Para realmente atender a todos, a comunidade de pesquisa em MT precisar\u00e1 enfrentar tr\u00eas desafios importantes. Precisaremos superar a escassez de dados, adquirindo mais dados de aprendizado em mais idiomas e encontrando novas formas de aproveitar os que j\u00e1 est\u00e3o dispon\u00edveis. Precisaremos tamb\u00e9m superar os desafios de modelagem que surgem \u00e0 medida que os modelos crescem para atender a muito mais idiomas. E precisaremos ainda encontrar novas formas de avaliar e aprimorar seus resultados.\u00a0 &nbsp; A escassez de dados continua sendo um dos maiores obst\u00e1culos para a expans\u00e3o das ferramentas de tradu\u00e7\u00e3o para mais idiomas. Normalmente, os sistemas de MT para tradu\u00e7\u00e3o de textos se baseiam no aprendizado com milh\u00f5es de frases de dados anotados. Por causa disso, os sistemas de MT capazes de gerar tradu\u00e7\u00f5es de alta qualidade foram desenvolvidos apenas para os poucos idiomas que dominam a web. A expans\u00e3o para outros idiomas significa encontrar maneiras de adquirir e usar exemplos para aprendizado de idiomas cuja presen\u00e7a na web \u00e9 escassa.\u00a0 Para tradu\u00e7\u00e3o direta de fala para fala, o desafio de adquirir dados \u00e9 ainda maior. A maioria dos sistemas de MT de fala usa o texto como etapa intermedi\u00e1ria, o que significa que a fala em um idioma \u00e9 primeiro convertida em texto, depois traduzida para texto no idioma de destino e, por fim, inserida em um sistema de convers\u00e3o de texto para fala para gerar \u00e1udio. Isso faz com que a tradu\u00e7\u00e3o de fala para fala fique dependente de texto em formas que limitam a sua efici\u00eancia e a tornam dif\u00edcil de ampliar para idiomas que s\u00e3o essencialmente orais. Os modelos de tradu\u00e7\u00e3o direta de fala para fala podem permitir a tradu\u00e7\u00e3o de idiomas que n\u00e3o t\u00eam sistemas de escrita padronizados. Essa abordagem tamb\u00e9m pode levar a sistemas de tradu\u00e7\u00e3o muito mais eficientes e r\u00e1pidos, j\u00e1 que eles n\u00e3o precisar\u00e3o das etapas adicionais de convers\u00e3o de fala para texto, da tradu\u00e7\u00e3o deste e da gera\u00e7\u00e3o de fala no idioma de destino.\u00a0 Al\u00e9m da necessidade de dados de aprendizado adequados em milhares de idiomas, os sistemas de MT atuais simplesmente n\u00e3o s\u00e3o concebidos para serem ampliados de forma a atender \u00e0s necessidades de todas as pessoas no mundo inteiro. Muitos sistemas de MT s\u00e3o bil\u00edngues, o que significa que existe um modelo separado para cada par de idiomas, como ingl\u00eas-russo ou japon\u00eas-espanhol. Essa abordagem \u00e9 extraordinariamente dif\u00edcil de ampliar para dezenas de pares de idiomas e mais ainda para todos os idiomas em uso no mundo inteiro. Imagine se voc\u00ea precisasse criar e manter muitos milhares de modelos diferentes para cada combina\u00e7\u00e3o, de tailand\u00eas-laosiano a nepal\u00eas-assam\u00eas. V\u00e1rios especialistas j\u00e1 sugeriram que os sistemas multil\u00edngues podem ajudar a resolver o problema. Mas tem sido extremamente dif\u00edcil incorporar muitos idiomas em um \u00fanico modelo multil\u00edngue eficiente e de alto desempenho que tenha a capacidade de representar todos os idiomas.\u00a0 Os modelos de MT de fala para fala em tempo real enfrentam muitos dos mesmos desafios dos modelos baseados em texto, mas tamb\u00e9m precisam superar a lat\u00eancia \u2014 o atraso que ocorre quando um idioma est\u00e1 sendo traduzido para outro \u2014 para poderem ser usados com efic\u00e1cia nas tradu\u00e7\u00f5es em tempo real. O principal desafio deriva do fato de que uma frase pode ser falada em uma ordem diferente de palavras em idiomas distintos. At\u00e9 mesmo os profissionais de tradu\u00e7\u00e3o simult\u00e2nea apresentam um atraso de aproximadamente tr\u00eas segundos em rela\u00e7\u00e3o \u00e0 fala original. Considere uma frase em alem\u00e3o, \u201cIch m\u00f6chte alle Sprachen \u00fcbersetzen\u201d, e a sua equivalente em espanhol, \u201cQuisiera traducir todos los idiomas\u201d. Ambas significam \u201cGostaria de traduzir todos os idiomas\u201d. Mas traduzir do alem\u00e3o para o ingl\u00eas em tempo real seria mais dif\u00edcil porque o verbo \u201ctraduzir\u201d aparece no final da frase, enquanto a ordem das palavras em espanhol e em ingl\u00eas \u00e9 semelhante. Por fim, ao ampliarmos para cada vez mais idiomas, precisamos tamb\u00e9m desenvolver novas formas de avaliar o trabalho produzido pelos modelos de MT. J\u00e1 existem recursos para avaliar a qualidade das tradu\u00e7\u00f5es entre determinados idiomas, por exemplo, do ingl\u00eas para o russo; mas e se as tradu\u00e7\u00f5es forem do am\u00e1rico para o cazaque? Ao expandirmos o n\u00famero de idiomas que os nossos modelos de MT s\u00e3o capazes de traduzir, precisaremos tamb\u00e9m desenvolver novas abordagens com rela\u00e7\u00e3o aos dados e \u00e0 mensura\u00e7\u00e3o de aprendizado para abranger mais idiomas. Al\u00e9m de avaliar o desempenho dos sistemas de MT com rela\u00e7\u00e3o \u00e0 precis\u00e3o, tamb\u00e9m \u00e9 importante assegurar que as tradu\u00e7\u00f5es sejam feitas de forma respons\u00e1vel. Precisaremos encontrar maneiras de assegurar que os sistemas de MT preservem as sensibilidades culturais e n\u00e3o criem nem intensifiquem vieses. Como descrito nas se\u00e7\u00f5es abaixo, a Meta AI est\u00e1 trabalhando com cada um desses tr\u00eas desafios. Treinando sistemas de tradu\u00e7\u00e3o direta de fala para fala e de recursos baixos Para possibilitar as tradu\u00e7\u00f5es de idiomas de recursos baixos e para criar os elementos b\u00e1sicos para futuras tradu\u00e7\u00f5es de mais idiomas independentemente de quanto eles sejam falados ou escritos, estamos expandindo nossas t\u00e9cnicas de cria\u00e7\u00e3o autom\u00e1tica de conjuntos de dados. Uma dessas t\u00e9cnicas \u00e9 o LASER, um kit de ferramentas de c\u00f3digo aberto que atualmente abrange mais de 125 idiomas escritos em 28 scripts diferentes.\u00a0 O LASER converte frases de v\u00e1rios idiomas em uma \u00fanica representa\u00e7\u00e3o multil\u00edngue. Em seguida, usamos uma pesquisa de semelhan\u00e7a multil\u00edngue em grande escala para identificar frases que t\u00eam uma representa\u00e7\u00e3o semelhante, ou seja, que provavelmente t\u00eam o mesmo significado em diferentes idiomas. Usamos o LASER para construir sistemas como o ccMatrix e o ccAligned, que s\u00e3o capazes de localizar textos paralelos na internet. Devido \u00e0 escassez de dados dispon\u00edveis para os idiomas de recursos baixos, criamos um novo m\u00e9todo de aprendizado professor-aluno que permite que o LASER se concentre em subgrupos de idiomas espec\u00edficos, como os idiomas bantos, e aprenda com conjuntos de dados muito menores. Isso permite que o LASER opere em escala com v\u00e1rios idiomas de forma eficaz. Cada um desses progressos nos permitir\u00e1 abranger mais idiomas \u00e0 medida que avan\u00e7amos no seu dimensionamento, aprimoramento e expans\u00e3o para incluir minera\u00e7\u00e3o de dados para centenas de idiomas e, por fim, para todos os idiomas que t\u00eam um sistema de escrita. Recentemente, estendemos o LASER para que funcione tamb\u00e9m com a fala: gra\u00e7as \u00e0 constru\u00e7\u00e3o de representa\u00e7\u00f5es para fala e texto no mesmo espa\u00e7o multil\u00edngue, conseguimos extrair tradu\u00e7\u00f5es entre fala em um idioma e texto em outro e at\u00e9 mesmo tradu\u00e7\u00f5es diretas de fala para fala. Com esse m\u00e9todo, j\u00e1 identificamos cerca de 1.400 horas de fala alinhada em franc\u00eas, alem\u00e3o, espanhol e ingl\u00eas. Os dados de texto s\u00e3o importantes, mas n\u00e3o s\u00e3o suficientes para construir ferramentas de tradu\u00e7\u00e3o que atendam \u00e0s necessidades de todos. Anteriormente, havia disponibilidade de dados de refer\u00eancia de tradu\u00e7\u00e3o de fala para uns poucos idiomas, por isso criamos o CoVoST 2, que abrange 22 idiomas e 36 dire\u00e7\u00f5es lingu\u00edsticas com diferentes condi\u00e7\u00f5es de recursos. Al\u00e9m disso, \u00e9 dif\u00edcil encontrar grandes quantidades de \u00e1udio em diferentes idiomas. O VoxPopuli, que cont\u00e9m 400 mil horas de fala em 23 idiomas, permite o aprendizado em grande escala semissupervisionado e autossupervisionado para programas como reconhecimento de fala e tradu\u00e7\u00e3o de fala. Posteriormente, o VoxPopuli foi usado para construir o maior modelo pr\u00e9-treinado aberto e universal para 128 idiomas e tarefas de fala, incluindo a tradu\u00e7\u00e3o de fala. Esse modelo aprimorou o modelo de ponta anterior para a tradu\u00e7\u00e3o de fala para texto de 21 idiomas para o ingl\u00eas em 7.4 BLEU no conjunto de dados CoVoST 2. Construindo modelos que funcionam em muitos idiomas e diferentes modalidades Al\u00e9m de produzir mais dados para treinar os sistemas de MT e torn\u00e1-los dispon\u00edveis para outros pesquisadores, estamos trabalhando para aprimorar a capacidade do modelo e poder assim lidar com tradu\u00e7\u00f5es entre um conjunto de idiomas muito mais amplo. Os sistemas de MT atuais frequentemente funcionam em uma \u00fanica modalidade e em um conjunto de idiomas limitado. Se o modelo for pequeno demais para representar muitos idiomas, o seu desempenho poder\u00e1 ser prejudicado, introduzindo erros tanto nas tradu\u00e7\u00f5es de texto como nas de fala. As inova\u00e7\u00f5es na modelagem nos ajudar\u00e3o a criar um futuro em que as tradu\u00e7\u00f5es ser\u00e3o transferidas de forma r\u00e1pida e fluida entre diferentes modalidades, indo de fala para texto, de texto para fala, de texto para texto e de fala para fala em in\u00fameros idiomas.\u00a0\u00a0 Para obter um desempenho aprimorado de nossos modelos de MT, investimos muito na cria\u00e7\u00e3o de modelos que apresentem um aprendizado eficiente apesar de sua grande capacidade, com foco em modelos de especialidades mistas restringidos de forma esparsa. Aumentando o tamanho do modelo e aprendendo uma fun\u00e7\u00e3o de roteamento autom\u00e1tico de forma que tokens diferentes usem recursos de especialidades diferentes, conseguimos equilibrar o desempenho das tradu\u00e7\u00f5es de recursos altos e de recursos baixos.\u00a0 Para ampliar uma MT baseada em texto para 101 idiomas, criamos o primeiro sistema de tradu\u00e7\u00e3o de texto multil\u00edngue n\u00e3o centrado no ingl\u00eas. Os sistemas bil\u00edngues geralmente funcionam traduzindo primeiro do idioma de origem para o ingl\u00eas e, em seguida, do ingl\u00eas para o idioma de destino. Para tornar esses sistemas mais eficientes e aumentar a sua qualidade, eliminamos o ingl\u00eas como meio, de maneira que os idiomas possam ser traduzidos diretamente para outros idiomas sem passar pelo ingl\u00eas. Embora a elimina\u00e7\u00e3o do ingl\u00eas tenha aumentado a capacidade do modelo, os modelos multil\u00edngues anteriormente n\u00e3o eram capazes de atingir o mesmo n\u00edvel de qualidade do que os sistemas bil\u00edngues feitos sob medida. Recentemente, no entanto, nosso sistema de tradu\u00e7\u00e3o multil\u00edngue ganhou o concurso Workshop on Machine Translation, superando at\u00e9 mesmo os melhores modelos bil\u00edngues. Queremos que a nossa tecnologia seja inclusiva: ela deve abranger tanto os idiomas escritos como os idiomas que n\u00e3o t\u00eam sistema de escrita padronizado. Pensando nisso, estamos desenvolvendo um sistema de tradu\u00e7\u00e3o de fala para fala que n\u00e3o depende da gera\u00e7\u00e3o de uma representa\u00e7\u00e3o textual intermedi\u00e1ria durante a infer\u00eancia. Foi demonstrado que essa abordagem \u00e9 mais r\u00e1pida do que os sistemas tradicionais em cascata que combinam modelos separados de reconhecimento de fala, tradu\u00e7\u00e3o autom\u00e1tica e s\u00edntese de fala. Com maior efici\u00eancia e uma arquitetura mais simples, a tradu\u00e7\u00e3o direta de fala para fala pode proporcionar uma tradu\u00e7\u00e3o em tempo real de qualidade quase humana para futuros dispositivos, como \u00f3culos de realidade aumentada. Por fim, para criar tradu\u00e7\u00f5es faladas que preservem a expressividade e a singularidade na fala das pessoas, estamos trabalhando para incluir alguns aspectos do \u00e1udio de entrada, como a entona\u00e7\u00e3o, nas tradu\u00e7\u00f5es geradas de \u00e1udio. Mensurando o sucesso em centenas de idiomas O desenvolvimento de modelos em grande escala que possam traduzir entre muito mais idiomas faz surgir uma pergunta importante: como podemos determinar se desenvolvemos dados ou modelos melhores? Avaliar o desempenho de um modelo multil\u00edngue em grande escala \u00e9 complicado, especialmente porque requer um conhecimento aprofundado de todos os idiomas que o modelo abrange \u2014 um desafio que \u00e9 demorado, demanda muitos recursos e frequentemente \u00e9 invi\u00e1vel.\u00a0 N\u00f3s criamos o FLORES-101, o primeiro conjunto de dados de avalia\u00e7\u00e3o de tradu\u00e7\u00e3o multilingue que abrange 101 idiomas, permitindo que os pesquisadores testem e aprimorem rapidamente os modelos de tradu\u00e7\u00e3o multil\u00edngues. Diferentemente dos conjuntos de dados existentes, o FLORES-101 permite que os pesquisadores quantifiquem o desempenho dos sistemas em qualquer dire\u00e7\u00e3o lingu\u00edstica, e n\u00e3o apenas de tradu\u00e7\u00f5es de\/para o ingl\u00eas. Para os milh\u00f5es de pessoas do mundo inteiro que vivem em locais com dezenas de idiomas oficiais, isso permite a cria\u00e7\u00e3o de sistemas de tradu\u00e7\u00e3o que atendem a necessidades importantes do mundo real.\u00a0 Usando o FLORES-101, temos colaborado com outros l\u00edderes da comunidade de pesquisa em IA para fazer avan\u00e7ar a tradu\u00e7\u00e3o multil\u00edngue com recursos baixos. No Workshop on Machine Translation de 2021, organizamos uma tarefa compartilhada para fazer progressos nesta \u00e1rea de forma coletiva. Houve a participa\u00e7\u00e3o de pesquisadores do mundo inteiro, muitos dos quais com foco em idiomas pessoalmente relevantes para eles. Esperamos continuar expandindo o FLORES para abranger centenas de idiomas. Ao fazermos progressos tang\u00edveis em dire\u00e7\u00e3o a uma tradu\u00e7\u00e3o universal, tamb\u00e9m nos concentramos em fazer isso de forma respons\u00e1vel. Estamos trabalhando em colabora\u00e7\u00e3o com linguistas para entender os desafios de produzir cole\u00e7\u00f5es de conjuntos de dados corretos e com redes de avaliadores para assegurar que as tradu\u00e7\u00f5es sejam corretas. Tamb\u00e9m estamos realizando estudos de caso com falantes de mais de 20 idiomas, para saber quais caracter\u00edsticas da tradu\u00e7\u00e3o s\u00e3o importantes para as pessoas com diferentes hist\u00f3ricos e como elas usar\u00e3o as tradu\u00e7\u00f5es que nossos modelos de IA produzem. Existem muitos outros aspectos para o desenvolvimento respons\u00e1vel de uma tradu\u00e7\u00e3o universal, incluindo a diminui\u00e7\u00e3o do vi\u00e9s e da toxicidade e a preserva\u00e7\u00e3o das sensibilidades culturais ao passar as informa\u00e7\u00f5es de um idioma para outro. Para alcan\u00e7armos nossos objetivos de longo prazo em rela\u00e7\u00e3o \u00e0 tradu\u00e7\u00e3o, precisaremos n\u00e3o apenas de conhecimento em IA, mas tamb\u00e9m da contribui\u00e7\u00e3o cont\u00ednua de diversos especialistas, pesquisadores e indiv\u00edduos do mundo inteiro.\u00a0 Qual \u00e9 o pr\u00f3ximo passo? Se o No Language Left Behind e o Universal Speech Translator, combinados com as iniciativas da comunidade de pesquisa em MT, conseguirem criar tecnologias de tradu\u00e7\u00e3o que incluam todos os habitantes do planeta, isso abrir\u00e1 o mundo digital e o mundo f\u00edsico de maneiras que antes n\u00e3o eram poss\u00edveis. J\u00e1 estamos fazendo progressos no sentido de possibilitar tradu\u00e7\u00f5es envolvendo idiomas com poucos recursos, uma barreira significativa \u00e0 tradu\u00e7\u00e3o universal para a maior parte da popula\u00e7\u00e3o do mundo. Ao avan\u00e7ar e abrir o c\u00f3digo do nosso trabalho na cria\u00e7\u00e3o de corpus, modelagem multil\u00edngue e avalia\u00e7\u00e3o, esperamos que outros pesquisadores possam se basear nesse trabalho e aproximar da realidade os verdadeiros usos de sistemas de tradu\u00e7\u00e3o.\u00a0 A nossa capacidade de comunica\u00e7\u00e3o \u00e9 um dos aspectos mais fundamentais do ser humano. As tecnologias, da prensa m\u00f3vel ao bate-papo em v\u00eddeo, t\u00eam frequentemente transformado nossa maneira de nos comunicar e compartilhar ideias. O poder dessas e de outras tecnologias se estender\u00e1 quando elas puderem funcionar da mesma forma para bilh\u00f5es de pessoas no mundo inteiro, proporcionando-lhes um acesso semelhante \u00e0s informa\u00e7\u00f5es e permitindo que se comuniquem com um p\u00fablico muito mais amplo, independentemente dos idiomas que elas falam ou escrevem. \u00c0 medida que nos esfor\u00e7amos para construir um mundo mais inclusivo e conectado, ser\u00e1 ainda mais importante derrubar as barreiras que impedem o acesso \u00e0s informa\u00e7\u00f5es e \u00e0s oportunidades, capacitando as pessoas nos idiomas que elas escolherem.","og_url":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/","og_site_name":"Sobre a Meta","article_published_time":"2022-02-23T17:56:54+00:00","article_modified_time":"2022-02-23T19:21:25+00:00","og_image":[{"url":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png","type":"","width":"","height":""}],"author":"facebookbr","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Meta","Est. reading time":"14 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#article","isPartOf":{"@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/"},"author":"Facebook company","headline":"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos","datePublished":"2022-02-23T17:56:54+00:00","dateModified":"2022-02-23T19:21:25+00:00","mainEntityOfPage":{"@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/"},"wordCount":3222,"publisher":{"@id":"https:\/\/about.fb.com\/br\/#organization"},"image":{"@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#primaryimage"},"thumbnailUrl":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png","articleSection":["Homepage - Hidden"],"inLanguage":"pt-BR"},{"@type":"WebPage","@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/","url":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/","name":"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos | Sobre a Meta","isPartOf":{"@id":"https:\/\/about.fb.com\/br\/#website"},"primaryImageOfPage":{"@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#primaryimage"},"image":{"@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#primaryimage"},"thumbnailUrl":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png","datePublished":"2022-02-23T17:56:54+00:00","dateModified":"2022-02-23T19:21:25+00:00","breadcrumb":{"@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#breadcrumb"},"inLanguage":"pt-BR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/"]}],"author":"Sobre a Meta"},{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#primaryimage","url":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png?fit=624%2C360","contentUrl":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2022\/02\/Imagem1.png?fit=624%2C360","width":624,"height":360},{"@type":"BreadcrumbList","@id":"https:\/\/about.fb.com\/br\/news\/2022\/02\/ensinando-a-inteligencia-artificial-a-traduzir-em-tempo-real-centenas-de-idiomas-falados-e-escritos\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/about.fb.com\/br\/"},{"@type":"ListItem","position":2,"name":"Ensinando a intelig\u00eancia artificial a traduzir em tempo real centenas de idiomas falados e escritos"}]},{"@type":"WebSite","@id":"https:\/\/about.fb.com\/br\/#website","url":"https:\/\/about.fb.com\/news\/","name":"Sobre a Meta","description":"","publisher":{"@id":"https:\/\/about.fb.com\/br\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/about.fb.com\/br\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pt-BR","alternateName":["Meta Newsroom","Meta"]},{"@type":"Organization","@id":"https:\/\/about.fb.com\/br\/#organization","name":"Meta","url":"https:\/\/about.fb.com\/br\/","logo":{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/about.fb.com\/br\/#\/schema\/logo\/image\/","url":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500","contentUrl":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500","width":8000,"height":4500,"caption":"Meta"},"image":{"@id":"https:\/\/about.fb.com\/br\/#\/schema\/logo\/image\/"}}]}},"jetpack_featured_media_url":"","jetpack-related-posts":[{"id":26166,"url":"https:\/\/about.fb.com\/br\/news\/2025\/02\/anunciando-o-programa-de-parceria-em-tecnologia-de-linguagem\/","url_meta":{"origin":23650,"position":0},"title":"Anunciando o Programa de Parceria em Tecnologia de Linguagem","author":"Meta","date":"07\/02\/2025","format":false,"excerpt":"A equipe do Fundamental AI Research (FAIR) da Meta est\u00e1 focada em alcan\u00e7ar a intelig\u00eancia avan\u00e7ada de m\u00e1quina (AMI, na sigla em ingl\u00eas) \u2014 uma IA que pode usar o racioc\u00ednio humano para realizar tarefas cognitivamente exigentes, como a tradu\u00e7\u00e3o \u2014 e us\u00e1-la para impulsionar produtos e inova\u00e7\u00f5es que beneficiem\u2026","rel":"","context":"In &quot;Meta&quot;","block_context":{"text":"Meta","link":"https:\/\/about.fb.com\/br\/news\/category\/temas-home\/meta\/"},"img":{"alt_text":"","src":"","width":0,"height":0},"classes":[]},{"id":26720,"url":"https:\/\/about.fb.com\/br\/news\/2025\/10\/descubra-mais-reels-do-mundo-todo-com-traducao-da-meta-ai\/","url_meta":{"origin":23650,"position":1},"title":"Descubra Mais Reels do Mundo Todo com Tradu\u00e7\u00e3o da Meta AI","author":"Meta","date":"09\/10\/2025","format":false,"excerpt":"Imagine descobrir um reel que te faz rir, te inspira ou te ensina algo novo, n\u00e3o importa onde ele foi criado ou em que idioma foi gravado. Esse \u00e9 o futuro que estamos construindo na Meta. No m\u00eas passado, ampliamos o acesso \u00e0s tradu\u00e7\u00f5es entre ingl\u00eas e espanhol (e vice-versa)\u2026","rel":"","context":"In &quot;Facebook&quot;","block_context":{"text":"Facebook","link":"https:\/\/about.fb.com\/br\/news\/category\/technologies\/facebook\/"},"img":{"alt_text":"","src":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/10\/Hero-Image_pt_BR.png?fit=1400%2C1000&resize=350%2C200","width":350,"height":200,"srcset":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/10\/Hero-Image_pt_BR.png?fit=1400%2C1000&resize=350%2C200 1x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/10\/Hero-Image_pt_BR.png?fit=1400%2C1000&resize=525%2C300 1.5x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/10\/Hero-Image_pt_BR.png?fit=1400%2C1000&resize=700%2C400 2x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/10\/Hero-Image_pt_BR.png?fit=1400%2C1000&resize=1050%2C600 3x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/10\/Hero-Image_pt_BR.png?fit=1400%2C1000&resize=1400%2C800 4x"},"classes":[]},{"id":26157,"url":"https:\/\/about.fb.com\/br\/news\/2025\/02\/avancando-na-inteligencia-de-maquina-por-meio-de-pesquisas-centradas-no-ser-humano\/","url_meta":{"origin":23650,"position":2},"title":"Avan\u00e7ando na intelig\u00eancia de m\u00e1quina por meio de pesquisas centradas no ser humano","author":"Meta","date":"07\/02\/2025","format":false,"excerpt":"A equipe do Fundamental AI Research (FAIR) da Meta est\u00e1 focada em alcan\u00e7ar intelig\u00eancia avan\u00e7ada de m\u00e1quina (AMI na sigla em ingl\u00eas) e us\u00e1-la para impulsionar produtos e inova\u00e7\u00e3o para o benef\u00edcio de todos. Hoje, estamos animados em compartilhar algumas de nossas pesquisas e modelos mais recentes que apoiam nossa\u2026","rel":"","context":"In &quot;Meta&quot;","block_context":{"text":"Meta","link":"https:\/\/about.fb.com\/br\/news\/category\/temas-home\/meta\/"},"img":{"alt_text":"","src":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/02\/476277621_1657111108571585_1619174158963619715_n.jpg?fit=1920%2C1080&resize=350%2C200","width":350,"height":200,"srcset":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/02\/476277621_1657111108571585_1619174158963619715_n.jpg?fit=1920%2C1080&resize=350%2C200 1x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/02\/476277621_1657111108571585_1619174158963619715_n.jpg?fit=1920%2C1080&resize=525%2C300 1.5x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/02\/476277621_1657111108571585_1619174158963619715_n.jpg?fit=1920%2C1080&resize=700%2C400 2x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/02\/476277621_1657111108571585_1619174158963619715_n.jpg?fit=1920%2C1080&resize=1050%2C600 3x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/02\/476277621_1657111108571585_1619174158963619715_n.jpg?fit=1920%2C1080&resize=1400%2C800 4x"},"classes":[]},{"id":26670,"url":"https:\/\/about.fb.com\/br\/news\/2025\/09\/oculos-ray-ban-meta-gen-2-chegam-ao-brasil\/","url_meta":{"origin":23650,"position":3},"title":"\u00d3culos Ray-Ban Meta (Gen 2) chegam ao Brasil","author":"Meta","date":"23\/09\/2025","format":false,"excerpt":"Os \u00f3culos Ray-Ban Meta (Gen 2) j\u00e1 est\u00e3o dispon\u00edveis no Brasil, para que as pessoas possam realizar tarefas, encontrar inspira\u00e7\u00e3o, viver o momento e capturar o que \u00e9 mais importante para elas. Anunciados no Connect, os Ray-Ban Meta (Gen 2) oferecem at\u00e9 8 horas de bateria e captura de v\u00eddeo\u2026","rel":"","context":"In &quot;Meta&quot;","block_context":{"text":"Meta","link":"https:\/\/about.fb.com\/br\/news\/category\/temas-home\/meta\/"},"img":{"alt_text":"","src":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/09\/Lifestyle-Still-10.jpg?fit=7680%2C4320&resize=350%2C200","width":350,"height":200,"srcset":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/09\/Lifestyle-Still-10.jpg?fit=7680%2C4320&resize=350%2C200 1x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/09\/Lifestyle-Still-10.jpg?fit=7680%2C4320&resize=525%2C300 1.5x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/09\/Lifestyle-Still-10.jpg?fit=7680%2C4320&resize=700%2C400 2x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/09\/Lifestyle-Still-10.jpg?fit=7680%2C4320&resize=1050%2C600 3x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/09\/Lifestyle-Still-10.jpg?fit=7680%2C4320&resize=1400%2C800 4x"},"classes":[]},{"id":26214,"url":"https:\/\/about.fb.com\/br\/news\/2025\/03\/26214\/","url_meta":{"origin":23650,"position":4},"title":"Iniciando os testes para Notas da Comunidade no Facebook, Instagram e Threads","author":"Meta","date":"13\/03\/2025","format":false,"excerpt":"Em janeiro, a Meta anunciou que encerrar\u00e1 o programa com organiza\u00e7\u00f5es independentes de verifica\u00e7\u00e3o de fatos e passar\u00e1 a adotar um sistema de Notas da Comunidade baseado em colabora\u00e7\u00e3o coletiva, come\u00e7ando nos Estados Unidos. A partir de 18 de mar\u00e7o, vamos come\u00e7ar a testar essa nova abordagem, permitindo que os\u2026","rel":"","context":"In &quot;Recent News&quot;","block_context":{"text":"Recent News","link":"https:\/\/about.fb.com\/br\/news\/category\/recent-news\/"},"img":{"alt_text":"","src":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/03\/03_Rating_Carousel-030.jpg?resize=350%2C200","width":350,"height":200,"srcset":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/03\/03_Rating_Carousel-030.jpg?resize=350%2C200 1x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/03\/03_Rating_Carousel-030.jpg?resize=525%2C300 1.5x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/03\/03_Rating_Carousel-030.jpg?resize=700%2C400 2x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/03\/03_Rating_Carousel-030.jpg?resize=1050%2C600 3x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2025\/03\/03_Rating_Carousel-030.jpg?resize=1400%2C800 4x"},"classes":[]},{"id":27026,"url":"https:\/\/about.fb.com\/br\/news\/2026\/03\/reforcando-seu-suporte-e-sua-seguranca-nos-aplicativos-da-meta-com-ia\/","url_meta":{"origin":23650,"position":5},"title":"Refor\u00e7ando seu suporte e sua seguran\u00e7a nos aplicativos da Meta com IA","author":"Meta","date":"19\/03\/2026","format":false,"excerpt":"Hoje, estamos lan\u00e7ando novas ferramentas de IA para suporte e fiscaliza\u00e7\u00e3o de conte\u00fado em nossos aplicativos para que eles funcionem melhor para voc\u00ea. \u00c0 medida que a tecnologia avan\u00e7a, estamos aplicando IA de mais maneiras para que voc\u00ea tenha ajuda confi\u00e1vel e pr\u00e1tica quando precisar, e para que possamos identificar\u2026","rel":"","context":"In &quot;Recent News&quot;","block_context":{"text":"Recent News","link":"https:\/\/about.fb.com\/br\/news\/category\/recent-news\/"},"img":{"alt_text":"","src":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2026\/03\/Boosting-Your-Support-and-Safety-on-Metas-Apps-With-AI_Header.jpg?fit=1920%2C1080&resize=350%2C200","width":350,"height":200,"srcset":"https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2026\/03\/Boosting-Your-Support-and-Safety-on-Metas-Apps-With-AI_Header.jpg?fit=1920%2C1080&resize=350%2C200 1x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2026\/03\/Boosting-Your-Support-and-Safety-on-Metas-Apps-With-AI_Header.jpg?fit=1920%2C1080&resize=525%2C300 1.5x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2026\/03\/Boosting-Your-Support-and-Safety-on-Metas-Apps-With-AI_Header.jpg?fit=1920%2C1080&resize=700%2C400 2x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2026\/03\/Boosting-Your-Support-and-Safety-on-Metas-Apps-With-AI_Header.jpg?fit=1920%2C1080&resize=1050%2C600 3x, https:\/\/about.fb.com\/br\/wp-content\/uploads\/sites\/11\/2026\/03\/Boosting-Your-Support-and-Safety-on-Metas-Apps-With-AI_Header.jpg?fit=1920%2C1080&resize=1400%2C800 4x"},"classes":[]}],"jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/posts\/23650","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/users\/81109636"}],"replies":[{"embeddable":true,"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/comments?post=23650"}],"version-history":[{"count":1,"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/posts\/23650\/revisions"}],"predecessor-version":[{"id":23655,"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/posts\/23650\/revisions\/23655"}],"wp:attachment":[{"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/media?parent=23650"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/categories?post=23650"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/about.fb.com\/br\/wp-json\/wp\/v2\/tags?post=23650"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}