{"id":22858,"date":"2022-02-23T20:30:01","date_gmt":"2022-02-23T19:30:01","guid":{"rendered":"https:\/\/about.fb.com\/fr\/?p=22858"},"modified":"2022-02-23T17:22:47","modified_gmt":"2022-02-23T16:22:47","slug":"traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle","status":"publish","type":"post","link":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/","title":{"rendered":"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle"},"content":{"rendered":"<p><span style=\"font-weight: 400\">Si vous parlez des langues comme l\u2019anglais, le mandarin ou l\u2019espagnol, vous pensez peut-\u00eatre que les applications et les outils web d\u2019aujourd\u2019hui fournissent d\u00e9j\u00e0 les technologies de traduction dont nous avons besoin. Mais des milliards de personnes ne peuvent pas encore acc\u00e9der facilement \u00e0 des informations et communiquer en ligne dans leur langue maternelle. Les syst\u00e8mes de traduction automatique d\u2019aujourd\u2019hui s\u2019am\u00e9liorent rapidement, mais leur entra\u00eenement repose encore sur de grandes quantit\u00e9s de donn\u00e9es textuelles. C\u2019est pour cette raison qu\u2019ils ne fonctionnent g\u00e9n\u00e9ralement pas bien pour les langues \u00e0 faibles ressources, c\u2019est-\u00e0-dire celles pour lesquelles peu de donn\u00e9es d\u2019entra\u00eenement sont disponibles, ni pour les langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Faire tomber compl\u00e8tement les barri\u00e8res linguistiques pourrait changer le monde. Cela permettrait \u00e0 des milliards de personnes d\u2019acc\u00e9der \u00e0 des informations en ligne dans leur langue maternelle ou pr\u00e9f\u00e9r\u00e9e. En plus d\u2019inclure les personnes qui ne parlent pas l\u2019une des langues qui dominent actuellement Internet, les progr\u00e8s de la traduction automatique pourraient changer fondamentalement la fa\u00e7on dont les populations communiquent et \u00e9changent des id\u00e9es \u00e0 travers le monde.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Alors que nous travaillons \u00e0 cr\u00e9er le m\u00e9tavers, nous devrons inventer des espaces virtuels immersifs auxquels tout le monde pourra participer, quelles que soient les langues parl\u00e9es.\u00a0<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-22865\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL3.png?w=605&#038;resize=555%2C304\" alt=\"\" width=\"555\" height=\"304\" \/><\/p>\n<p><span style=\"font-weight: 400\">Par exemple, imaginez que des personnes se trouvant dans un pays o\u00f9 diff\u00e9rentes langues sont parl\u00e9es puissent communiquer entre elles en temps r\u00e9el \u00e0 l\u2019aide d\u2019un t\u00e9l\u00e9phone, d\u2019une montre ou de lunettes. Ou encore qu\u2019un contenu multim\u00e9dia sur le web soit accessible pour n\u2019importe qui dans le monde dans sa langue pr\u00e9f\u00e9r\u00e9e. Dans un avenir pas si lointain, alors que des technologies \u00e9mergentes comme la r\u00e9alit\u00e9 virtuelle et la r\u00e9alit\u00e9 augment\u00e9e pourraient estomper les fronti\u00e8res entre le monde virtuel et le monde r\u00e9el dans le m\u00e9tavers, les outils de traduction permettront \u00e0 tout le monde de participer \u00e0 des activit\u00e9s du quotidien (comme cr\u00e9er un club de lecture ou collaborer sur un projet de travail) avec n\u2019importe qui et de n\u2019importe o\u00f9.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Meta\u00a0AI annonce une initiative \u00e0 long terme visant \u00e0 cr\u00e9er des outils linguistiques et de traduction automatique qui incluront la plupart des langues du monde. Cette initiative comprend deux nouveaux projets. Le premier, No Language Left Behind, consiste \u00e0 d\u00e9velopper un nouveau mod\u00e8le d\u2019IA avanc\u00e9 qui pourra apprendre des langues sans avoir besoin d\u2019autant d\u2019exemples d\u2019entra\u00eenement que les mod\u00e8les actuels. Nous l\u2019utiliserons pour permettre des traductions professionnelles dans des centaines de langues, de l\u2019asturien au luganda en passant par l\u2019ourdou. Le deuxi\u00e8me, Universal Speech Translator, vise \u00e0 concevoir de nouvelles approches pour traduire le langage parl\u00e9 d\u2019une langue \u00e0 une autre en temps r\u00e9el, afin de prendre en charge les langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9 ainsi que celles qui sont \u00e0 la fois \u00e9crites et parl\u00e9es.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">De nombreux efforts seront n\u00e9cessaires pour proposer des outils de traduction v\u00e9ritablement universels. Mais nous pensons que cela constitue un grand pas en avant. En partageant des informations sur notre code et nos mod\u00e8les et en les rendant open source, nous permettrons aux autres de s\u2019appuyer sur notre travail et de nous aider \u00e0 atteindre cet objectif important.\u00a0<\/span><\/p>\n<p><strong>Les d\u00e9fis de la traduction dans toutes les langues<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Les syst\u00e8mes de traduction bas\u00e9s sur l\u2019IA d\u2019aujourd\u2019hui ne prennent pas en charge les milliers de langues en usage \u00e0 travers le monde, et ne sont pas con\u00e7us pour fournir une traduction vocale en temps r\u00e9el. Pour que tout le monde puisse en profiter, la communaut\u00e9 de la recherche en traduction automatique devra surmonter trois d\u00e9fis importants. Nous devrons surmonter le manque de donn\u00e9es. Pour cela, il faudra acqu\u00e9rir plus de donn\u00e9es d\u2019entra\u00eenement dans plus de langues et trouver de nouvelles fa\u00e7ons de tirer parti de celles d\u00e9j\u00e0 disponibles aujourd\u2019hui. Nous devrons surmonter les d\u00e9fis en mati\u00e8re de mod\u00e9lisation qui se poseront \u00e0 mesure que les mod\u00e8les se d\u00e9velopperont pour servir de plus en plus de langues. Et nous devrons \u00e9galement trouver de nouvelles fa\u00e7ons d\u2019\u00e9valuer et d\u2019am\u00e9liorer leurs r\u00e9sultats.\u00a0<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-22866\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL4.png?w=504&#038;resize=504%2C390\" alt=\"\" width=\"504\" height=\"390\" srcset=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL4.png?w=504 504w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL4.png?w=300 300w\" sizes=\"auto, (max-width: 504px) 100vw, 504px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Le manque de donn\u00e9es reste l\u2019un des principaux obstacles au d\u00e9veloppement des outils de traduction dans plus de langues. Les syst\u00e8mes de traduction automatique de texte reposent g\u00e9n\u00e9ralement sur un entra\u00eenement \u00e0 partir de millions de phrases issues de donn\u00e9es annot\u00e9es. C\u2019est pour cette raison que des syst\u00e8mes de traduction automatique pouvant produire des traductions de haute qualit\u00e9 n\u2019ont \u00e9t\u00e9 d\u00e9velopp\u00e9s que pour les quelques langues qui dominent le web. Pour en d\u00e9velopper dans d\u2019autres langues, il faut trouver des moyens d\u2019acqu\u00e9rir et d\u2019utiliser des exemples d\u2019entra\u00eenement \u00e0 partir de langues peu pr\u00e9sentes sur le web.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Pour la traduction orale directe, acqu\u00e9rir des donn\u00e9es est encore plus difficile. La plupart des syst\u00e8mes de traduction automatique vocale utilisent le texte en tant qu\u2019\u00e9tape interm\u00e9diaire\u00a0: le discours oral dans une langue est d\u2019abord converti en texte, puis ce texte est traduit dans la langue cible et la traduction est entr\u00e9e dans un syst\u00e8me de synth\u00e8se vocale pour g\u00e9n\u00e9rer de l\u2019audio. Les traductions vocales sont donc d\u00e9pendantes du texte, ce qui limite leur efficacit\u00e9 et les rend difficiles \u00e0 adapter aux langues qui sont principalement parl\u00e9es.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Les mod\u00e8les de traduction vocale directe peuvent permettre la traduction de langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9. Cette approche pourra \u00e9galement rendre les syst\u00e8mes de traduction beaucoup plus rapides et efficaces, car elle \u00e9limine les \u00e9tapes suppl\u00e9mentaires de conversion du discours en texte, de traduction et de g\u00e9n\u00e9ration du discours dans la langue cible.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">En plus de requ\u00e9rir des donn\u00e9es d\u2019entra\u00eenement appropri\u00e9es dans des milliers de langues, les syst\u00e8mes de traduction automatique d\u2019aujourd\u2019hui ne sont pas con\u00e7us pour s\u2019adapter aux besoins individuels. De nombreux syst\u00e8mes de traduction automatique sont bilingues, ce qui signifie qu\u2019il existe un mod\u00e8le distinct pour chaque combinaison, comme anglais-russe ou japonais-espagnol. Cette approche est extr\u00eamement difficile \u00e0 adapter \u00e0 des dizaines de combinaisons et \u00e0 toutes les langues utilis\u00e9es dans le monde. Imaginez devoir cr\u00e9er et maintenir plusieurs milliers de mod\u00e8les diff\u00e9rents pour chaque combinaison, de tha\u00ef-lao \u00e0 n\u00e9palais-assamais. Un grand nombre de <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/qa-with-machine-translation-pioneer-the-future-of-mt-is-multilingual\"><span style=\"font-weight: 400\">sp\u00e9cialistes ont sugg\u00e9r\u00e9<\/span><\/a><span style=\"font-weight: 400\"> que des syst\u00e8mes multilingues pourraient \u00eatre la solution. Mais il est extr\u00eamement difficile d\u2019int\u00e9grer de nombreuses langues \u00e0 un seul mod\u00e8le multilingue efficace et performant capable de repr\u00e9senter toutes les langues.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">En plus d\u2019\u00eatre confront\u00e9s aux m\u00eames d\u00e9fis que les mod\u00e8les textuels, les mod\u00e8les de traduction vocale doivent rem\u00e9dier \u00e0 la latence (le d\u00e9calage qui se produit lorsqu\u2019une langue est traduite dans une autre) avant de pouvoir \u00eatre utilis\u00e9s efficacement pour une traduction en temps r\u00e9el. Un d\u00e9fi qui est principalement d\u00fb au fait que l\u2019ordre des mots d\u2019une phrase peut ne pas \u00eatre le m\u00eame dans une langue que dans une autre. M\u00eame les sp\u00e9cialistes de la traduction simultan\u00e9e ont un retard d\u2019environ trois secondes sur le discours original. Prenons l\u2019exemple d\u2019une phrase en allemand, \u00ab Ich m\u00f6chte alle Sprachen \u00fcbersetzen \u00bb, et de son \u00e9quivalent en espagnol, \u00ab Quisiera traducir todos los idiomas \u00bb. Les deux phrases signifient \u00ab Je voudrais traduire toutes les langues \u00bb. Mais traduire de l\u2019allemand vers le fran\u00e7ais en temps r\u00e9el serait plus difficile, car le verbe \u00ab traduire \u00bb appara\u00eet \u00e0 la fin de la phrase en allemand, alors qu\u2019en espagnol et en fran\u00e7ais, l\u2019ordre des mots est similaire.<\/span><span style=\"font-weight: 400\"><br \/>\n<\/span><\/p>\n<p><span style=\"font-weight: 400\">Enfin, alors que nous prenons en charge de plus en plus de langues, nous devons d\u00e9velopper de nouvelles fa\u00e7ons d\u2019\u00e9valuer le travail produit par les mod\u00e8les de traduction automatique. Il existe d\u00e9j\u00e0 des ressources qui permettent d\u2019\u00e9valuer la qualit\u00e9 des traductions, par exemple, de l\u2019anglais vers le russe. Mais qu\u2019en est-il de la combinaison amharique-kazakh, par exemple\u00a0? \u00c0 mesure que le nombre de langues que nos mod\u00e8les de traduction automatique peuvent traduire augmente, nous devrons d\u00e9velopper de nouvelles approches pour l\u2019entra\u00eenement des donn\u00e9es et la mesure. Et en plus d\u2019\u00e9valuer les performances des syst\u00e8mes de traduction automatique en termes de pr\u00e9cision, il est important de s\u2019assurer que les traductions sont effectu\u00e9es de mani\u00e8re responsable. Nous devrons trouver des moyens de nous assurer que les syst\u00e8mes de traduction automatique tiennent compte des \u00e9l\u00e9ments culturels et ne favorisent pas les pr\u00e9jug\u00e9s. Meta\u00a0AI s\u2019efforce de relever chacun de ces trois d\u00e9fis, tels que nous les d\u00e9crivons dans les sections ci-dessous.<\/span><\/p>\n<p><strong>Entra\u00eener les syst\u00e8mes de traduction vocale directe et \u00e0 faibles ressources<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Pour permettre la traduction de langues \u00e0 faibles ressources et poser les bases d\u2019un avenir o\u00f9 un plus grand nombre de langues pourront \u00eatre traduites, qu\u2019elles soient tr\u00e8s r\u00e9pandues ou non, nous d\u00e9veloppons nos techniques de cr\u00e9ation automatique d\u2019ensembles de donn\u00e9es. L\u2019une de ces techniques est <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/laser-multilingual-sentence-embeddings\/\"><span style=\"font-weight: 400\">LASER<\/span><\/a><span style=\"font-weight: 400\">, une bo\u00eete \u00e0 outils open source qui couvre d\u00e9sormais plus de 125\u00a0langues \u00e9crites et 28\u00a0scripts diff\u00e9rents.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">LASER convertit des phrases dans diff\u00e9rentes langues en une seule repr\u00e9sentation multilingue. Nous effectuons ensuite une recherche de similitude multilingue \u00e0 grande \u00e9chelle afin d\u2019identifier les phrases ayant une repr\u00e9sentation similaire, c\u2019est-\u00e0-dire susceptibles d\u2019avoir la m\u00eame d\u00e9finition dans diff\u00e9rentes langues. Nous avons utilis\u00e9 LASER pour d\u00e9velopper des syst\u00e8mes tels que <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/ccmatrix-a-billion-scale-bitext-data-set-for-training-translation-models\/\"><span style=\"font-weight: 400\">ccMatrix<\/span><\/a><span style=\"font-weight: 400\"> et <\/span><a href=\"https:\/\/ai.facebook.com\/research\/publications\/ccaligned-a-massive-collection-of-cross-lingual-web-document-pairs\/\"><span style=\"font-weight: 400\">ccAligned<\/span><\/a><span style=\"font-weight: 400\">, qui sont capables de trouver des textes parall\u00e8les sur Internet. Pour les langues \u00e0 faibles ressources, nous avons cr\u00e9\u00e9 une nouvelle m\u00e9thode d\u2019entra\u00eenement qui permet \u00e0 LASER de se concentrer sur des sous-groupes de langues sp\u00e9cifiques (tels que les langues bantoues) et d\u2019apprendre \u00e0 partir d\u2019ensembles de donn\u00e9es beaucoup plus r\u00e9duits. LASER peut ainsi fonctionner efficacement \u00e0 grande \u00e9chelle dans toutes les langues. Ces progr\u00e8s nous permettront de couvrir plus de langues alors que nous travaillons \u00e0 les d\u00e9velopper et \u00e0 les am\u00e9liorer, le but \u00e9tant de prendre en charge l\u2019exploration de donn\u00e9es pour des centaines de langues, voire toutes les langues ayant un syst\u00e8me d\u2019\u00e9criture. Nous avons r\u00e9cemment <\/span><a href=\"https:\/\/papers.nips.cc\/paper\/2021\/hash\/8466f9ace6a9acbe71f75762ffc890f1-Abstract.html\"><span style=\"font-weight: 400\">d\u00e9velopp\u00e9 le syst\u00e8me LASER afin qu\u2019il fonctionne \u00e9galement avec le discours oral<\/span><\/a><span style=\"font-weight: 400\">\u00a0: en d\u00e9veloppant des repr\u00e9sentations pour le discours oral et le texte dans le m\u00eame espace multilingue, nous sommes en mesure d\u2019extraire des traductions d\u2019un discours oral dans une langue \u00e0 du texte dans une autre langue, voire m\u00eame des traductions vocales directes. Gr\u00e2ce \u00e0 cette m\u00e9thode, nous avons d\u00e9j\u00e0 mis en correspondance pr\u00e8s de 1\u00a0400\u00a0heures de discours en fran\u00e7ais, en allemand, en espagnol et en anglais.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Les donn\u00e9es textuelles sont importantes, mais elles ne sont pas suffisantes pour cr\u00e9er des outils de traduction r\u00e9pondant \u00e0 tous les besoins. Pour la traduction vocale, des donn\u00e9es de r\u00e9f\u00e9rence n\u2019\u00e9taient auparavant disponibles que dans quelques langues. C\u2019est pour cela que nous avons cr\u00e9\u00e9 <\/span><a href=\"https:\/\/www.isca-speech.org\/archive\/interspeech_2021\/wang21s_interspeech.html\"><span style=\"font-weight: 400\">CoVoST\u00a02<\/span><\/a><span style=\"font-weight: 400\">, qui couvre 22\u00a0langues et 36\u00a0combinaisons, ainsi que diff\u00e9rents niveaux de ressources. De plus, il est difficile de trouver de grandes quantit\u00e9s d\u2019audio dans diff\u00e9rentes langues. <\/span><a href=\"https:\/\/github.com\/facebookresearch\/voxpopuli\"><span style=\"font-weight: 400\">VoxPopuli<\/span><\/a><span style=\"font-weight: 400\">, qui contient 400\u00a0000\u00a0heures de langage parl\u00e9 dans 23\u00a0langues, permet un apprentissage semi-supervis\u00e9 et auto-contr\u00f4l\u00e9 \u00e0 grande \u00e9chelle pour des cas d\u2019utilisation tels que la reconnaissance vocale et la traduction vocale. VoxPopuli a ensuite \u00e9t\u00e9 utilis\u00e9 pour cr\u00e9er le plus grand mod\u00e8le pr\u00e9-entra\u00een\u00e9 ouvert et universel pour <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/xls-r-self-supervised-speech-processing-for-128-languages\"><span style=\"font-weight: 400\">128\u00a0langues et plusieurs t\u00e2ches ax\u00e9es sur le discours<\/span><\/a><span style=\"font-weight: 400\">, y compris la traduction vocale. Un mod\u00e8le qui a am\u00e9lior\u00e9 la traduction de discours oral en 21\u00a0langues vers du texte en anglais de 7,4\u00a0BLEU sur l\u2019ensemble de donn\u00e9es CoVoST\u00a02.<\/span><\/p>\n<p><strong>D\u00e9velopper des mod\u00e8les qui fonctionnent pour de nombreuses langues et diff\u00e9rentes modalit\u00e9s<\/strong><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-22867\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL5.png?w=605&#038;resize=605%2C340\" alt=\"\" width=\"605\" height=\"340\" srcset=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL5.png?w=605 605w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL5.png?w=600 600w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL5.png?w=300 300w\" sizes=\"auto, (max-width: 605px) 100vw, 605px\" \/><\/p>\n<p><span style=\"font-weight: 400\">En plus de produire plus de donn\u00e9es pour l\u2019entra\u00eenement des syst\u00e8mes de traduction automatique et de les mettre \u00e0 la disposition d\u2019autres \u00e9quipes de recherche, nous cherchons \u00e0 am\u00e9liorer les capacit\u00e9s des mod\u00e8les afin de prendre en charge la traduction de beaucoup plus de langues. Aujourd\u2019hui, les syst\u00e8mes de traduction automatique ne fonctionnent souvent que pour une seule modalit\u00e9 et un ensemble limit\u00e9 de langues. Si le mod\u00e8le est trop petit pour repr\u00e9senter de nombreuses langues, ses performances peuvent en p\u00e2tir et des inexactitudes peuvent appara\u00eetre dans les traductions textuelles et vocales. Les innovations en mati\u00e8re de mod\u00e9lisation nous aideront \u00e0 cr\u00e9er un avenir o\u00f9 les traductions passeront d\u2019une modalit\u00e9 \u00e0 l\u2019autre rapidement et de mani\u00e8re transparente, \u00e0 savoir de la voix au texte, du texte \u00e0 la voix, du texte au texte ou de la voix \u00e0 la voix, et ce, dans une multitude de langues.\u00a0\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Pour am\u00e9liorer les performances de nos mod\u00e8les de traduction automatique, nous avons \u00e9norm\u00e9ment investi dans la cr\u00e9ation de mod\u00e8les qui s\u2019entra\u00eenent efficacement malgr\u00e9 une grande capacit\u00e9, en nous concentrant sur des mod\u00e8les multicouches appel\u00e9s \u00ab\u00a0MoE\u00a0\u00bb (pour \u00ab\u00a0Mixture of Experts\u00a0\u00bb). En augmentant la taille des mod\u00e8les et en utilisant une fonction de routage automatique afin que diff\u00e9rents tokens utilisent diff\u00e9rentes routes, nous avons pu \u00e9quilibrer les performances des traductions \u00e0 ressources \u00e9lev\u00e9es et \u00e0 faibles ressources.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Pour \u00e9tendre la traduction automatique de texte \u00e0 101\u00a0langues, nous avons cr\u00e9\u00e9 le <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/introducing-many-to-many-multilingual-machine-translation\/\"><span style=\"font-weight: 400\">premier syst\u00e8me de traduction de texte multilingue qui n\u2019est pas ax\u00e9 sur l\u2019anglais<\/span><\/a><span style=\"font-weight: 400\">. En g\u00e9n\u00e9ral, les syst\u00e8mes bilingues traduisent d\u2019abord la langue source vers l\u2019anglais, puis l\u2019anglais vers la langue cible. Pour rendre ces syst\u00e8mes plus efficaces et am\u00e9liorer leur qualit\u00e9, nous avons arr\u00eat\u00e9 d\u2019utiliser l\u2019anglais en tant que r\u00e9f\u00e9rence, afin que les langues puissent \u00eatre traduites directement dans d\u2019autres langues, sans passer par l\u2019anglais. Bien que cela ait augment\u00e9 la capacit\u00e9 du mod\u00e8le, les mod\u00e8les multilingues \u00e9taient auparavant incapables d\u2019atteindre le m\u00eame niveau de qualit\u00e9 que les syst\u00e8mes bilingues personnalis\u00e9s. Mais r\u00e9cemment, <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/the-first-ever-multilingual-model-to-win-wmt-beating-out-bilingual-models\/\"><span style=\"font-weight: 400\">notre syst\u00e8me de traduction multilingue a remport\u00e9 le concours de la conf\u00e9rence annuelle sur la traduction automatique (WMT)<\/span><\/a><span style=\"font-weight: 400\">, prenant ainsi le pas sur les meilleurs mod\u00e8les bilingues.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Notre objectif est que notre technologie soit inclusive et qu\u2019elle prenne en charge \u00e0 la fois les langues \u00e9crites et celles qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9. Pour cela, nous d\u00e9veloppons actuellement un syst\u00e8me de traduction vocale qui ne repose pas sur la g\u00e9n\u00e9ration d\u2019une repr\u00e9sentation textuelle interm\u00e9diaire. Cette approche s\u2019est av\u00e9r\u00e9e plus rapide que le syst\u00e8me en cascade traditionnel qui combine des mod\u00e8les de reconnaissance vocale, de traduction automatique et de synth\u00e8se vocale s\u00e9par\u00e9s. Gr\u00e2ce \u00e0 une efficacit\u00e9 am\u00e9lior\u00e9e et \u00e0 une architecture plus simple, la reconnaissance vocale directe pourrait permettre une traduction en temps r\u00e9el de qualit\u00e9 presque humaine pour les appareils du futur, comme les lunettes de r\u00e9alit\u00e9 augment\u00e9e. Enfin, afin de cr\u00e9er des traductions parl\u00e9es qui pr\u00e9servent le ton et le caract\u00e8re du discours de chaque personne, nous nous effor\u00e7ons de conserver certains aspects de l\u2019audio d\u2019entr\u00e9e, tels que l\u2019intonation, dans les traductions audio g\u00e9n\u00e9r\u00e9es.<\/span><\/p>\n<p><strong>Mesurer nos performances dans des centaines de langues<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Le d\u00e9veloppement de mod\u00e8les capables de traduire de nombreuses langues \u00e0 grande \u00e9chelle soul\u00e8ve une question importante\u00a0: comment pouvons-nous d\u00e9terminer si nous avons d\u00e9velopp\u00e9 de meilleures donn\u00e9es ou de meilleurs mod\u00e8les\u00a0? L\u2019\u00e9valuation des performances d\u2019un mod\u00e8le multilingue \u00e0 grande \u00e9chelle est compliqu\u00e9e, en particulier parce que cela nous oblige \u00e0 avoir une expertise de terrain dans toutes les langues prises en charge par le mod\u00e8le. Un d\u00e9fi qui prend du temps, qui demande beaucoup de ressources et qui est souvent tr\u00e8s peu pratique.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Nous avons cr\u00e9\u00e9 <\/span><a href=\"https:\/\/ai.facebook.com\/blog\/the-flores-101-data-set-helping-build-better-translation-systems-around-the-world\/\"><span style=\"font-weight: 400\">FLORES-101<\/span><\/a><span style=\"font-weight: 400\">, les premiers ensembles de donn\u00e9es d\u2019\u00e9valuation de la traduction multilingue couvrant 101\u00a0langues, ce qui a permis aux \u00e9quipes de recherche de tester et d\u2019am\u00e9liorer rapidement les mod\u00e8les de traduction multilingue. Contrairement aux ensembles de donn\u00e9es existants, FLORES-101 permet aux \u00e9quipes de recherche de quantifier les performances des syst\u00e8mes pour toutes les combinaisons, pas seulement depuis et vers l\u2019anglais. Pour les millions de personnes dans le monde qui vivent dans des r\u00e9gions o\u00f9 il existe des dizaines de langues officielles, cela permet de cr\u00e9er des syst\u00e8mes de traduction qui r\u00e9pondent \u00e0 des besoins importants.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">En utilisant FLORES-101, nous avons collabor\u00e9 avec d\u2019autres leaders de la communaut\u00e9 de recherche en IA pour faire progresser la traduction multilingue \u00e0 faibles ressources. Lors de la conf\u00e9rence WMT 2021, nous avons mis en place un groupe de travail pour progresser collectivement dans ce domaine. Des \u00e9quipes de recherche du monde entier y ont particip\u00e9, une grande partie en se concentrant sur les langues qui les concernaient personnellement. Nous avons h\u00e2te de continuer \u00e0 d\u00e9velopper FLORES afin de prendre en charge des centaines de langues.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Et si nous faisons des progr\u00e8s importants vers la traduction universelle, nous nous effor\u00e7ons \u00e9galement de le faire de mani\u00e8re responsable. Nous travaillons avec des linguistes pour mieux comprendre les d\u00e9fis li\u00e9s \u00e0 la collection d\u2019ensembles de donn\u00e9es pr\u00e9cises, ainsi qu\u2019avec des r\u00e9seaux d\u2019\u00e9valuation afin de nous assurer que les traductions sont exactes. Nous menons \u00e9galement des \u00e9tudes de cas avec des locuteurs et locutrices de plus de 20\u00a0langues pour comprendre quelles fonctionnalit\u00e9s de traduction sont importantes pour les personnes d\u2019horizons diff\u00e9rents, et comment elles utiliseront les traductions produites par nos mod\u00e8les d\u2019IA. Le d\u00e9veloppement responsable de la traduction universelle comporte de nombreux autres aspects, de l\u2019att\u00e9nuation des pr\u00e9jug\u00e9s et des dommages potentiels \u00e0 la pr\u00e9servation des \u00e9l\u00e9ments culturels lorsque les informations sont transmises d\u2019une langue \u00e0 l\u2019autre. Pour atteindre nos objectifs de traduction \u00e0 long terme, nous aurons non seulement besoin d\u2019une expertise en IA, mais aussi de la contribution durable d\u2019un grand nombre de sp\u00e9cialistes, d\u2019\u00e9quipes de recherche et d\u2019individus du monde entier.\u00a0<\/span><\/p>\n<p><strong>Et maintenant\u00a0?<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Si avec les projets No Language Left Behind et Universal Speech Translator et gr\u00e2ce aux efforts de la communaut\u00e9 de recherche en traduction automatique, nous parvenons \u00e0 cr\u00e9er des technologies de traduction inclusives, les mondes virtuel et r\u00e9el s\u2019ouvriront d\u2019une fa\u00e7on qui \u00e9tait jusqu\u2019\u00e0 pr\u00e9sent impossible. Nous sommes d\u00e9j\u00e0 en train de faire des progr\u00e8s dans la traduction de langues \u00e0 faibles ressources, un obstacle important \u00e0 la traduction universelle pour la majeure partie de la population mondiale. En faisant progresser et en rendant accessibles nos travaux sur la cr\u00e9ation de corpus, la mod\u00e9lisation multilingue et l\u2019\u00e9valuation, nous esp\u00e9rons que d\u2019autres \u00e9quipes de recherche nous aideront \u00e0 faire de ces syst\u00e8mes de traduction une r\u00e9alit\u00e9 du quotidien.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">La communication est l\u2019une des caract\u00e9ristiques les plus importantes de l\u2019\u00eatre humain. Les technologies, de la presse \u00e9crite \u00e0 la discussion vid\u00e9o, ont souvent transform\u00e9 notre fa\u00e7on de communiquer et de partager des id\u00e9es. L\u2019efficacit\u00e9 de ces technologies et d\u2019autres augmentera lorsqu\u2019elles pourront fonctionner de la m\u00eame mani\u00e8re, et ce pour des milliards de personnes dans le monde, en leur donnant un acc\u00e8s \u00e9gal \u00e0 l\u2019information et en leur permettant de communiquer avec une audience beaucoup plus large, quelles que soient les langues qu\u2019elles parlent ou \u00e9crivent. Si nous voulons cr\u00e9er un monde plus inclusif et connect\u00e9, nous devons tout mettre en \u0153uvre pour supprimer les obstacles \u00e0 l\u2019information et aux opportunit\u00e9s existants en donnant aux personnes les moyens de s\u2019exprimer dans la langue de leur choix.\u00a0<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"Si vous parlez des langues comme l\u2019anglais, le mandarin ou l\u2019espagnol, vous pensez peut-\u00eatre que les applications et les outils web d\u2019aujourd\u2019hui fournissent d\u00e9j\u00e0 les technologies de traduction dont nous avons besoin. Mais des milliards de personnes ne peuvent pas encore acc\u00e9der facilement \u00e0 des informations et communiquer en ligne dans leur langue maternelle. Les syst\u00e8mes de traduction automatique d\u2019aujourd\u2019hui s\u2019am\u00e9liorent rapidement, mais leur entra\u00eenement repose encore sur de grandes quantit\u00e9s de donn\u00e9es textuelles. C\u2019est pour cette raison qu\u2019ils ne fonctionnent g\u00e9n\u00e9ralement pas bien pour les langues \u00e0 faibles ressources, c\u2019est-\u00e0-dire celles pour lesquelles peu de donn\u00e9es d\u2019entra\u00eenement sont disponibles, ni pour les langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9.\u00a0 Faire tomber compl\u00e8tement les barri\u00e8res linguistiques pourrait changer le monde. Cela permettrait \u00e0 des milliards de personnes d\u2019acc\u00e9der \u00e0 des informations en ligne dans leur langue maternelle ou pr\u00e9f\u00e9r\u00e9e. En plus d\u2019inclure les personnes qui ne parlent pas l\u2019une des langues qui dominent actuellement Internet, les progr\u00e8s de la traduction automatique pourraient changer fondamentalement la fa\u00e7on dont les populations communiquent et \u00e9changent des id\u00e9es \u00e0 travers le monde.\u00a0 Alors que nous travaillons \u00e0 cr\u00e9er le m\u00e9tavers, nous devrons inventer des espaces virtuels immersifs auxquels tout le monde pourra participer, quelles que soient les langues parl\u00e9es.\u00a0 Par exemple, imaginez que des personnes se trouvant dans un pays o\u00f9 diff\u00e9rentes langues sont parl\u00e9es puissent communiquer entre elles en temps r\u00e9el \u00e0 l\u2019aide d\u2019un t\u00e9l\u00e9phone, d\u2019une montre ou de lunettes. Ou encore qu\u2019un contenu multim\u00e9dia sur le web soit accessible pour n\u2019importe qui dans le monde dans sa langue pr\u00e9f\u00e9r\u00e9e. Dans un avenir pas si lointain, alors que des technologies \u00e9mergentes comme la r\u00e9alit\u00e9 virtuelle et la r\u00e9alit\u00e9 augment\u00e9e pourraient estomper les fronti\u00e8res entre le monde virtuel et le monde r\u00e9el dans le m\u00e9tavers, les outils de traduction permettront \u00e0 tout le monde de participer \u00e0 des activit\u00e9s du quotidien (comme cr\u00e9er un club de lecture ou collaborer sur un projet de travail) avec n\u2019importe qui et de n\u2019importe o\u00f9.\u00a0 Meta\u00a0AI annonce une initiative \u00e0 long terme visant \u00e0 cr\u00e9er des outils linguistiques et de traduction automatique qui incluront la plupart des langues du monde. Cette initiative comprend deux nouveaux projets. Le premier, No Language Left Behind, consiste \u00e0 d\u00e9velopper un nouveau mod\u00e8le d\u2019IA avanc\u00e9 qui pourra apprendre des langues sans avoir besoin d\u2019autant d\u2019exemples d\u2019entra\u00eenement que les mod\u00e8les actuels. Nous l\u2019utiliserons pour permettre des traductions professionnelles dans des centaines de langues, de l\u2019asturien au luganda en passant par l\u2019ourdou. Le deuxi\u00e8me, Universal Speech Translator, vise \u00e0 concevoir de nouvelles approches pour traduire le langage parl\u00e9 d\u2019une langue \u00e0 une autre en temps r\u00e9el, afin de prendre en charge les langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9 ainsi que celles qui sont \u00e0 la fois \u00e9crites et parl\u00e9es.\u00a0 De nombreux efforts seront n\u00e9cessaires pour proposer des outils de traduction v\u00e9ritablement universels. Mais nous pensons que cela constitue un grand pas en avant. En partageant des informations sur notre code et nos mod\u00e8les et en les rendant open source, nous permettrons aux autres de s\u2019appuyer sur notre travail et de nous aider \u00e0 atteindre cet objectif important.\u00a0 Les d\u00e9fis de la traduction dans toutes les langues Les syst\u00e8mes de traduction bas\u00e9s sur l\u2019IA d\u2019aujourd\u2019hui ne prennent pas en charge les milliers de langues en usage \u00e0 travers le monde, et ne sont pas con\u00e7us pour fournir une traduction vocale en temps r\u00e9el. Pour que tout le monde puisse en profiter, la communaut\u00e9 de la recherche en traduction automatique devra surmonter trois d\u00e9fis importants. Nous devrons surmonter le manque de donn\u00e9es. Pour cela, il faudra acqu\u00e9rir plus de donn\u00e9es d\u2019entra\u00eenement dans plus de langues et trouver de nouvelles fa\u00e7ons de tirer parti de celles d\u00e9j\u00e0 disponibles aujourd\u2019hui. Nous devrons surmonter les d\u00e9fis en mati\u00e8re de mod\u00e9lisation qui se poseront \u00e0 mesure que les mod\u00e8les se d\u00e9velopperont pour servir de plus en plus de langues. Et nous devrons \u00e9galement trouver de nouvelles fa\u00e7ons d\u2019\u00e9valuer et d\u2019am\u00e9liorer leurs r\u00e9sultats.\u00a0 Le manque de donn\u00e9es reste l\u2019un des principaux obstacles au d\u00e9veloppement des outils de traduction dans plus de langues. Les syst\u00e8mes de traduction automatique de texte reposent g\u00e9n\u00e9ralement sur un entra\u00eenement \u00e0 partir de millions de phrases issues de donn\u00e9es annot\u00e9es. C\u2019est pour cette raison que des syst\u00e8mes de traduction automatique pouvant produire des traductions de haute qualit\u00e9 n\u2019ont \u00e9t\u00e9 d\u00e9velopp\u00e9s que pour les quelques langues qui dominent le web. Pour en d\u00e9velopper dans d\u2019autres langues, il faut trouver des moyens d\u2019acqu\u00e9rir et d\u2019utiliser des exemples d\u2019entra\u00eenement \u00e0 partir de langues peu pr\u00e9sentes sur le web.\u00a0 Pour la traduction orale directe, acqu\u00e9rir des donn\u00e9es est encore plus difficile. La plupart des syst\u00e8mes de traduction automatique vocale utilisent le texte en tant qu\u2019\u00e9tape interm\u00e9diaire\u00a0: le discours oral dans une langue est d\u2019abord converti en texte, puis ce texte est traduit dans la langue cible et la traduction est entr\u00e9e dans un syst\u00e8me de synth\u00e8se vocale pour g\u00e9n\u00e9rer de l\u2019audio. Les traductions vocales sont donc d\u00e9pendantes du texte, ce qui limite leur efficacit\u00e9 et les rend difficiles \u00e0 adapter aux langues qui sont principalement parl\u00e9es. Les mod\u00e8les de traduction vocale directe peuvent permettre la traduction de langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9. Cette approche pourra \u00e9galement rendre les syst\u00e8mes de traduction beaucoup plus rapides et efficaces, car elle \u00e9limine les \u00e9tapes suppl\u00e9mentaires de conversion du discours en texte, de traduction et de g\u00e9n\u00e9ration du discours dans la langue cible.\u00a0 En plus de requ\u00e9rir des donn\u00e9es d\u2019entra\u00eenement appropri\u00e9es dans des milliers de langues, les syst\u00e8mes de traduction automatique d\u2019aujourd\u2019hui ne sont pas con\u00e7us pour s\u2019adapter aux besoins individuels. De nombreux syst\u00e8mes de traduction automatique sont bilingues, ce qui signifie qu\u2019il existe un mod\u00e8le distinct pour chaque combinaison, comme anglais-russe ou japonais-espagnol. Cette approche est extr\u00eamement difficile \u00e0 adapter \u00e0 des dizaines de combinaisons et \u00e0 toutes les langues utilis\u00e9es dans le monde. Imaginez devoir cr\u00e9er et maintenir plusieurs milliers de mod\u00e8les diff\u00e9rents pour chaque combinaison, de tha\u00ef-lao \u00e0 n\u00e9palais-assamais. Un grand nombre de sp\u00e9cialistes ont sugg\u00e9r\u00e9 que des syst\u00e8mes multilingues pourraient \u00eatre la solution. Mais il est extr\u00eamement difficile d\u2019int\u00e9grer de nombreuses langues \u00e0 un seul mod\u00e8le multilingue efficace et performant capable de repr\u00e9senter toutes les langues.\u00a0 En plus d\u2019\u00eatre confront\u00e9s aux m\u00eames d\u00e9fis que les mod\u00e8les textuels, les mod\u00e8les de traduction vocale doivent rem\u00e9dier \u00e0 la latence (le d\u00e9calage qui se produit lorsqu\u2019une langue est traduite dans une autre) avant de pouvoir \u00eatre utilis\u00e9s efficacement pour une traduction en temps r\u00e9el. Un d\u00e9fi qui est principalement d\u00fb au fait que l\u2019ordre des mots d\u2019une phrase peut ne pas \u00eatre le m\u00eame dans une langue que dans une autre. M\u00eame les sp\u00e9cialistes de la traduction simultan\u00e9e ont un retard d\u2019environ trois secondes sur le discours original. Prenons l\u2019exemple d\u2019une phrase en allemand, \u00ab Ich m\u00f6chte alle Sprachen \u00fcbersetzen \u00bb, et de son \u00e9quivalent en espagnol, \u00ab Quisiera traducir todos los idiomas \u00bb. Les deux phrases signifient \u00ab Je voudrais traduire toutes les langues \u00bb. Mais traduire de l\u2019allemand vers le fran\u00e7ais en temps r\u00e9el serait plus difficile, car le verbe \u00ab traduire \u00bb appara\u00eet \u00e0 la fin de la phrase en allemand, alors qu\u2019en espagnol et en fran\u00e7ais, l\u2019ordre des mots est similaire. Enfin, alors que nous prenons en charge de plus en plus de langues, nous devons d\u00e9velopper de nouvelles fa\u00e7ons d\u2019\u00e9valuer le travail produit par les mod\u00e8les de traduction automatique. Il existe d\u00e9j\u00e0 des ressources qui permettent d\u2019\u00e9valuer la qualit\u00e9 des traductions, par exemple, de l\u2019anglais vers le russe. Mais qu\u2019en est-il de la combinaison amharique-kazakh, par exemple\u00a0? \u00c0 mesure que le nombre de langues que nos mod\u00e8les de traduction automatique peuvent traduire augmente, nous devrons d\u00e9velopper de nouvelles approches pour l\u2019entra\u00eenement des donn\u00e9es et la mesure. Et en plus d\u2019\u00e9valuer les performances des syst\u00e8mes de traduction automatique en termes de pr\u00e9cision, il est important de s\u2019assurer que les traductions sont effectu\u00e9es de mani\u00e8re responsable. Nous devrons trouver des moyens de nous assurer que les syst\u00e8mes de traduction automatique tiennent compte des \u00e9l\u00e9ments culturels et ne favorisent pas les pr\u00e9jug\u00e9s. Meta\u00a0AI s\u2019efforce de relever chacun de ces trois d\u00e9fis, tels que nous les d\u00e9crivons dans les sections ci-dessous. Entra\u00eener les syst\u00e8mes de traduction vocale directe et \u00e0 faibles ressources Pour permettre la traduction de langues \u00e0 faibles ressources et poser les bases d\u2019un avenir o\u00f9 un plus grand nombre de langues pourront \u00eatre traduites, qu\u2019elles soient tr\u00e8s r\u00e9pandues ou non, nous d\u00e9veloppons nos techniques de cr\u00e9ation automatique d\u2019ensembles de donn\u00e9es. L\u2019une de ces techniques est LASER, une bo\u00eete \u00e0 outils open source qui couvre d\u00e9sormais plus de 125\u00a0langues \u00e9crites et 28\u00a0scripts diff\u00e9rents.\u00a0 LASER convertit des phrases dans diff\u00e9rentes langues en une seule repr\u00e9sentation multilingue. Nous effectuons ensuite une recherche de similitude multilingue \u00e0 grande \u00e9chelle afin d\u2019identifier les phrases ayant une repr\u00e9sentation similaire, c\u2019est-\u00e0-dire susceptibles d\u2019avoir la m\u00eame d\u00e9finition dans diff\u00e9rentes langues. Nous avons utilis\u00e9 LASER pour d\u00e9velopper des syst\u00e8mes tels que ccMatrix et ccAligned, qui sont capables de trouver des textes parall\u00e8les sur Internet. Pour les langues \u00e0 faibles ressources, nous avons cr\u00e9\u00e9 une nouvelle m\u00e9thode d\u2019entra\u00eenement qui permet \u00e0 LASER de se concentrer sur des sous-groupes de langues sp\u00e9cifiques (tels que les langues bantoues) et d\u2019apprendre \u00e0 partir d\u2019ensembles de donn\u00e9es beaucoup plus r\u00e9duits. LASER peut ainsi fonctionner efficacement \u00e0 grande \u00e9chelle dans toutes les langues. Ces progr\u00e8s nous permettront de couvrir plus de langues alors que nous travaillons \u00e0 les d\u00e9velopper et \u00e0 les am\u00e9liorer, le but \u00e9tant de prendre en charge l\u2019exploration de donn\u00e9es pour des centaines de langues, voire toutes les langues ayant un syst\u00e8me d\u2019\u00e9criture. Nous avons r\u00e9cemment d\u00e9velopp\u00e9 le syst\u00e8me LASER afin qu\u2019il fonctionne \u00e9galement avec le discours oral\u00a0: en d\u00e9veloppant des repr\u00e9sentations pour le discours oral et le texte dans le m\u00eame espace multilingue, nous sommes en mesure d\u2019extraire des traductions d\u2019un discours oral dans une langue \u00e0 du texte dans une autre langue, voire m\u00eame des traductions vocales directes. Gr\u00e2ce \u00e0 cette m\u00e9thode, nous avons d\u00e9j\u00e0 mis en correspondance pr\u00e8s de 1\u00a0400\u00a0heures de discours en fran\u00e7ais, en allemand, en espagnol et en anglais. Les donn\u00e9es textuelles sont importantes, mais elles ne sont pas suffisantes pour cr\u00e9er des outils de traduction r\u00e9pondant \u00e0 tous les besoins. Pour la traduction vocale, des donn\u00e9es de r\u00e9f\u00e9rence n\u2019\u00e9taient auparavant disponibles que dans quelques langues. C\u2019est pour cela que nous avons cr\u00e9\u00e9 CoVoST\u00a02, qui couvre 22\u00a0langues et 36\u00a0combinaisons, ainsi que diff\u00e9rents niveaux de ressources. De plus, il est difficile de trouver de grandes quantit\u00e9s d\u2019audio dans diff\u00e9rentes langues. VoxPopuli, qui contient 400\u00a0000\u00a0heures de langage parl\u00e9 dans 23\u00a0langues, permet un apprentissage semi-supervis\u00e9 et auto-contr\u00f4l\u00e9 \u00e0 grande \u00e9chelle pour des cas d\u2019utilisation tels que la reconnaissance vocale et la traduction vocale. VoxPopuli a ensuite \u00e9t\u00e9 utilis\u00e9 pour cr\u00e9er le plus grand mod\u00e8le pr\u00e9-entra\u00een\u00e9 ouvert et universel pour 128\u00a0langues et plusieurs t\u00e2ches ax\u00e9es sur le discours, y compris la traduction vocale. Un mod\u00e8le qui a am\u00e9lior\u00e9 la traduction de discours oral en 21\u00a0langues vers du texte en anglais de 7,4\u00a0BLEU sur l\u2019ensemble de donn\u00e9es CoVoST\u00a02. D\u00e9velopper des mod\u00e8les qui fonctionnent pour de nombreuses langues et diff\u00e9rentes modalit\u00e9s En plus de produire plus de donn\u00e9es pour l\u2019entra\u00eenement des syst\u00e8mes de traduction automatique et de les mettre \u00e0 la disposition d\u2019autres \u00e9quipes de recherche, nous cherchons \u00e0 am\u00e9liorer les capacit\u00e9s des mod\u00e8les afin de prendre en charge la traduction de beaucoup plus de langues. Aujourd\u2019hui, les syst\u00e8mes de traduction automatique ne fonctionnent souvent que pour une seule modalit\u00e9 et un ensemble limit\u00e9 de langues. Si le mod\u00e8le est trop petit pour repr\u00e9senter de nombreuses langues, ses performances peuvent en p\u00e2tir et des inexactitudes peuvent appara\u00eetre dans les traductions textuelles et vocales. Les innovations en mati\u00e8re de mod\u00e9lisation nous aideront \u00e0 cr\u00e9er un avenir o\u00f9 les traductions passeront d\u2019une modalit\u00e9 \u00e0 l\u2019autre rapidement et de mani\u00e8re transparente, \u00e0 savoir de la voix au texte, du texte \u00e0 la voix, du texte au texte ou de la voix \u00e0 la voix, et ce, dans une multitude de langues.\u00a0\u00a0 Pour am\u00e9liorer les performances de nos mod\u00e8les de traduction automatique, nous avons \u00e9norm\u00e9ment investi dans la cr\u00e9ation de mod\u00e8les qui s\u2019entra\u00eenent efficacement malgr\u00e9 une grande capacit\u00e9, en nous concentrant sur des mod\u00e8les multicouches appel\u00e9s \u00ab\u00a0MoE\u00a0\u00bb (pour \u00ab\u00a0Mixture of Experts\u00a0\u00bb). En augmentant la taille des mod\u00e8les et en utilisant une fonction de routage automatique afin que diff\u00e9rents tokens utilisent diff\u00e9rentes routes, nous avons pu \u00e9quilibrer les performances des traductions \u00e0 ressources \u00e9lev\u00e9es et \u00e0 faibles ressources.\u00a0 Pour \u00e9tendre la traduction automatique de texte \u00e0 101\u00a0langues, nous avons cr\u00e9\u00e9 le premier syst\u00e8me de traduction de texte multilingue qui n\u2019est pas ax\u00e9 sur l\u2019anglais. En g\u00e9n\u00e9ral, les syst\u00e8mes bilingues traduisent d\u2019abord la langue source vers l\u2019anglais, puis l\u2019anglais vers la langue cible. Pour rendre ces syst\u00e8mes plus efficaces et am\u00e9liorer leur qualit\u00e9, nous avons arr\u00eat\u00e9 d\u2019utiliser l\u2019anglais en tant que r\u00e9f\u00e9rence, afin que les langues puissent \u00eatre traduites directement dans d\u2019autres langues, sans passer par l\u2019anglais. Bien que cela ait augment\u00e9 la capacit\u00e9 du mod\u00e8le, les mod\u00e8les multilingues \u00e9taient auparavant incapables d\u2019atteindre le m\u00eame niveau de qualit\u00e9 que les syst\u00e8mes bilingues personnalis\u00e9s. Mais r\u00e9cemment, notre syst\u00e8me de traduction multilingue a remport\u00e9 le concours de la conf\u00e9rence annuelle sur la traduction automatique (WMT), prenant ainsi le pas sur les meilleurs mod\u00e8les bilingues. Notre objectif est que notre technologie soit inclusive et qu\u2019elle prenne en charge \u00e0 la fois les langues \u00e9crites et celles qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9. Pour cela, nous d\u00e9veloppons actuellement un syst\u00e8me de traduction vocale qui ne repose pas sur la g\u00e9n\u00e9ration d\u2019une repr\u00e9sentation textuelle interm\u00e9diaire. Cette approche s\u2019est av\u00e9r\u00e9e plus rapide que le syst\u00e8me en cascade traditionnel qui combine des mod\u00e8les de reconnaissance vocale, de traduction automatique et de synth\u00e8se vocale s\u00e9par\u00e9s. Gr\u00e2ce \u00e0 une efficacit\u00e9 am\u00e9lior\u00e9e et \u00e0 une architecture plus simple, la reconnaissance vocale directe pourrait permettre une traduction en temps r\u00e9el de qualit\u00e9 presque humaine pour les appareils du futur, comme les lunettes de r\u00e9alit\u00e9 augment\u00e9e. Enfin, afin de cr\u00e9er des traductions parl\u00e9es qui pr\u00e9servent le ton et le caract\u00e8re du discours de chaque personne, nous nous effor\u00e7ons de conserver certains aspects de l\u2019audio d\u2019entr\u00e9e, tels que l\u2019intonation, dans les traductions audio g\u00e9n\u00e9r\u00e9es. Mesurer nos performances dans des centaines de langues Le d\u00e9veloppement de mod\u00e8les capables de traduire de nombreuses langues \u00e0 grande \u00e9chelle soul\u00e8ve une question importante\u00a0: comment pouvons-nous d\u00e9terminer si nous avons d\u00e9velopp\u00e9 de meilleures donn\u00e9es ou de meilleurs mod\u00e8les\u00a0? L\u2019\u00e9valuation des performances d\u2019un mod\u00e8le multilingue \u00e0 grande \u00e9chelle est compliqu\u00e9e, en particulier parce que cela nous oblige \u00e0 avoir une expertise de terrain dans toutes les langues prises en charge par le mod\u00e8le. Un d\u00e9fi qui prend du temps, qui demande beaucoup de ressources et qui est souvent tr\u00e8s peu pratique.\u00a0 Nous avons cr\u00e9\u00e9 FLORES-101, les premiers ensembles de donn\u00e9es d\u2019\u00e9valuation de la traduction multilingue couvrant 101\u00a0langues, ce qui a permis aux \u00e9quipes de recherche de tester et d\u2019am\u00e9liorer rapidement les mod\u00e8les de traduction multilingue. Contrairement aux ensembles de donn\u00e9es existants, FLORES-101 permet aux \u00e9quipes de recherche de quantifier les performances des syst\u00e8mes pour toutes les combinaisons, pas seulement depuis et vers l\u2019anglais. Pour les millions de personnes dans le monde qui vivent dans des r\u00e9gions o\u00f9 il existe des dizaines de langues officielles, cela permet de cr\u00e9er des syst\u00e8mes de traduction qui r\u00e9pondent \u00e0 des besoins importants.\u00a0 En utilisant FLORES-101, nous avons collabor\u00e9 avec d\u2019autres leaders de la communaut\u00e9 de recherche en IA pour faire progresser la traduction multilingue \u00e0 faibles ressources. Lors de la conf\u00e9rence WMT 2021, nous avons mis en place un groupe de travail pour progresser collectivement dans ce domaine. Des \u00e9quipes de recherche du monde entier y ont particip\u00e9, une grande partie en se concentrant sur les langues qui les concernaient personnellement. Nous avons h\u00e2te de continuer \u00e0 d\u00e9velopper FLORES afin de prendre en charge des centaines de langues. Et si nous faisons des progr\u00e8s importants vers la traduction universelle, nous nous effor\u00e7ons \u00e9galement de le faire de mani\u00e8re responsable. Nous travaillons avec des linguistes pour mieux comprendre les d\u00e9fis li\u00e9s \u00e0 la collection d\u2019ensembles de donn\u00e9es pr\u00e9cises, ainsi qu\u2019avec des r\u00e9seaux d\u2019\u00e9valuation afin de nous assurer que les traductions sont exactes. Nous menons \u00e9galement des \u00e9tudes de cas avec des locuteurs et locutrices de plus de 20\u00a0langues pour comprendre quelles fonctionnalit\u00e9s de traduction sont importantes pour les personnes d\u2019horizons diff\u00e9rents, et comment elles utiliseront les traductions produites par nos mod\u00e8les d\u2019IA. Le d\u00e9veloppement responsable de la traduction universelle comporte de nombreux autres aspects, de l\u2019att\u00e9nuation des pr\u00e9jug\u00e9s et des dommages potentiels \u00e0 la pr\u00e9servation des \u00e9l\u00e9ments culturels lorsque les informations sont transmises d\u2019une langue \u00e0 l\u2019autre. Pour atteindre nos objectifs de traduction \u00e0 long terme, nous aurons non seulement besoin d\u2019une expertise en IA, mais aussi de la contribution durable d\u2019un grand nombre de sp\u00e9cialistes, d\u2019\u00e9quipes de recherche et d\u2019individus du monde entier.\u00a0 Et maintenant\u00a0? Si avec les projets No Language Left Behind et Universal Speech Translator et gr\u00e2ce aux efforts de la communaut\u00e9 de recherche en traduction automatique, nous parvenons \u00e0 cr\u00e9er des technologies de traduction inclusives, les mondes virtuel et r\u00e9el s\u2019ouvriront d\u2019une fa\u00e7on qui \u00e9tait jusqu\u2019\u00e0 pr\u00e9sent impossible. Nous sommes d\u00e9j\u00e0 en train de faire des progr\u00e8s dans la traduction de langues \u00e0 faibles ressources, un obstacle important \u00e0 la traduction universelle pour la majeure partie de la population mondiale. En faisant progresser et en rendant accessibles nos travaux sur la cr\u00e9ation de corpus, la mod\u00e9lisation multilingue et l\u2019\u00e9valuation, nous esp\u00e9rons que d\u2019autres \u00e9quipes de recherche nous aideront \u00e0 faire de ces syst\u00e8mes de traduction une r\u00e9alit\u00e9 du quotidien.\u00a0 La communication est l\u2019une des caract\u00e9ristiques les plus importantes de l\u2019\u00eatre humain. Les technologies, de la presse \u00e9crite \u00e0 la discussion vid\u00e9o, ont souvent transform\u00e9 notre fa\u00e7on de communiquer et de partager des id\u00e9es. L\u2019efficacit\u00e9 de ces technologies et d\u2019autres augmentera lorsqu\u2019elles pourront fonctionner de la m\u00eame mani\u00e8re, et ce pour des milliards de personnes dans le monde, en leur donnant un acc\u00e8s \u00e9gal \u00e0 l\u2019information et en leur permettant de communiquer avec une audience beaucoup plus large, quelles que soient les langues qu\u2019elles parlent ou \u00e9crivent. Si nous voulons cr\u00e9er un monde plus inclusif et connect\u00e9, nous devons tout mettre en \u0153uvre pour supprimer les obstacles \u00e0 l\u2019information et aux opportunit\u00e9s existants en donnant aux personnes les moyens de s\u2019exprimer dans la langue de leur choix.\u00a0","protected":false},"author":164097090,"featured_media":22864,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[243897990,243897944,243897985,243897952],"tags":[243898035,243898215,134004,243898218,243898193,243898192,243898217,243898208,243898216],"class_list":["post-22858","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualites","category-intelligence-artificielle","category-meta","category-realite-augmentee-et-realite-virtuelle","tag-inclusion","tag-inside-the-lab","tag-intelligence-artificielle","tag-langage","tag-meta","tag-meta-ai","tag-nlp","tag-outils-linguistiques","tag-traduction"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.2 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle | \u00c0 propos de Meta<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle | \u00c0 propos de Meta\" \/>\n<meta property=\"og:description\" content=\"Si vous parlez des langues comme l\u2019anglais, le mandarin ou l\u2019espagnol, vous pensez peut-\u00eatre que les applications et les outils web d\u2019aujourd\u2019hui fournissent d\u00e9j\u00e0 les technologies de traduction dont nous avons besoin. Mais des milliards de personnes ne peuvent pas encore acc\u00e9der facilement \u00e0 des informations et communiquer en ligne dans leur langue maternelle. Les syst\u00e8mes de traduction automatique d\u2019aujourd\u2019hui s\u2019am\u00e9liorent rapidement, mais leur entra\u00eenement repose encore sur de grandes quantit\u00e9s de donn\u00e9es textuelles. C\u2019est pour cette raison qu\u2019ils ne fonctionnent g\u00e9n\u00e9ralement pas bien pour les langues \u00e0 faibles ressources, c\u2019est-\u00e0-dire celles pour lesquelles peu de donn\u00e9es d\u2019entra\u00eenement sont disponibles, ni pour les langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9.\u00a0 Faire tomber compl\u00e8tement les barri\u00e8res linguistiques pourrait changer le monde. Cela permettrait \u00e0 des milliards de personnes d\u2019acc\u00e9der \u00e0 des informations en ligne dans leur langue maternelle ou pr\u00e9f\u00e9r\u00e9e. En plus d\u2019inclure les personnes qui ne parlent pas l\u2019une des langues qui dominent actuellement Internet, les progr\u00e8s de la traduction automatique pourraient changer fondamentalement la fa\u00e7on dont les populations communiquent et \u00e9changent des id\u00e9es \u00e0 travers le monde.\u00a0 Alors que nous travaillons \u00e0 cr\u00e9er le m\u00e9tavers, nous devrons inventer des espaces virtuels immersifs auxquels tout le monde pourra participer, quelles que soient les langues parl\u00e9es.\u00a0 Par exemple, imaginez que des personnes se trouvant dans un pays o\u00f9 diff\u00e9rentes langues sont parl\u00e9es puissent communiquer entre elles en temps r\u00e9el \u00e0 l\u2019aide d\u2019un t\u00e9l\u00e9phone, d\u2019une montre ou de lunettes. Ou encore qu\u2019un contenu multim\u00e9dia sur le web soit accessible pour n\u2019importe qui dans le monde dans sa langue pr\u00e9f\u00e9r\u00e9e. Dans un avenir pas si lointain, alors que des technologies \u00e9mergentes comme la r\u00e9alit\u00e9 virtuelle et la r\u00e9alit\u00e9 augment\u00e9e pourraient estomper les fronti\u00e8res entre le monde virtuel et le monde r\u00e9el dans le m\u00e9tavers, les outils de traduction permettront \u00e0 tout le monde de participer \u00e0 des activit\u00e9s du quotidien (comme cr\u00e9er un club de lecture ou collaborer sur un projet de travail) avec n\u2019importe qui et de n\u2019importe o\u00f9.\u00a0 Meta\u00a0AI annonce une initiative \u00e0 long terme visant \u00e0 cr\u00e9er des outils linguistiques et de traduction automatique qui incluront la plupart des langues du monde. Cette initiative comprend deux nouveaux projets. Le premier, No Language Left Behind, consiste \u00e0 d\u00e9velopper un nouveau mod\u00e8le d\u2019IA avanc\u00e9 qui pourra apprendre des langues sans avoir besoin d\u2019autant d\u2019exemples d\u2019entra\u00eenement que les mod\u00e8les actuels. Nous l\u2019utiliserons pour permettre des traductions professionnelles dans des centaines de langues, de l\u2019asturien au luganda en passant par l\u2019ourdou. Le deuxi\u00e8me, Universal Speech Translator, vise \u00e0 concevoir de nouvelles approches pour traduire le langage parl\u00e9 d\u2019une langue \u00e0 une autre en temps r\u00e9el, afin de prendre en charge les langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9 ainsi que celles qui sont \u00e0 la fois \u00e9crites et parl\u00e9es.\u00a0 De nombreux efforts seront n\u00e9cessaires pour proposer des outils de traduction v\u00e9ritablement universels. Mais nous pensons que cela constitue un grand pas en avant. En partageant des informations sur notre code et nos mod\u00e8les et en les rendant open source, nous permettrons aux autres de s\u2019appuyer sur notre travail et de nous aider \u00e0 atteindre cet objectif important.\u00a0 Les d\u00e9fis de la traduction dans toutes les langues Les syst\u00e8mes de traduction bas\u00e9s sur l\u2019IA d\u2019aujourd\u2019hui ne prennent pas en charge les milliers de langues en usage \u00e0 travers le monde, et ne sont pas con\u00e7us pour fournir une traduction vocale en temps r\u00e9el. Pour que tout le monde puisse en profiter, la communaut\u00e9 de la recherche en traduction automatique devra surmonter trois d\u00e9fis importants. Nous devrons surmonter le manque de donn\u00e9es. Pour cela, il faudra acqu\u00e9rir plus de donn\u00e9es d\u2019entra\u00eenement dans plus de langues et trouver de nouvelles fa\u00e7ons de tirer parti de celles d\u00e9j\u00e0 disponibles aujourd\u2019hui. Nous devrons surmonter les d\u00e9fis en mati\u00e8re de mod\u00e9lisation qui se poseront \u00e0 mesure que les mod\u00e8les se d\u00e9velopperont pour servir de plus en plus de langues. Et nous devrons \u00e9galement trouver de nouvelles fa\u00e7ons d\u2019\u00e9valuer et d\u2019am\u00e9liorer leurs r\u00e9sultats.\u00a0 Le manque de donn\u00e9es reste l\u2019un des principaux obstacles au d\u00e9veloppement des outils de traduction dans plus de langues. Les syst\u00e8mes de traduction automatique de texte reposent g\u00e9n\u00e9ralement sur un entra\u00eenement \u00e0 partir de millions de phrases issues de donn\u00e9es annot\u00e9es. C\u2019est pour cette raison que des syst\u00e8mes de traduction automatique pouvant produire des traductions de haute qualit\u00e9 n\u2019ont \u00e9t\u00e9 d\u00e9velopp\u00e9s que pour les quelques langues qui dominent le web. Pour en d\u00e9velopper dans d\u2019autres langues, il faut trouver des moyens d\u2019acqu\u00e9rir et d\u2019utiliser des exemples d\u2019entra\u00eenement \u00e0 partir de langues peu pr\u00e9sentes sur le web.\u00a0 Pour la traduction orale directe, acqu\u00e9rir des donn\u00e9es est encore plus difficile. La plupart des syst\u00e8mes de traduction automatique vocale utilisent le texte en tant qu\u2019\u00e9tape interm\u00e9diaire\u00a0: le discours oral dans une langue est d\u2019abord converti en texte, puis ce texte est traduit dans la langue cible et la traduction est entr\u00e9e dans un syst\u00e8me de synth\u00e8se vocale pour g\u00e9n\u00e9rer de l\u2019audio. Les traductions vocales sont donc d\u00e9pendantes du texte, ce qui limite leur efficacit\u00e9 et les rend difficiles \u00e0 adapter aux langues qui sont principalement parl\u00e9es. Les mod\u00e8les de traduction vocale directe peuvent permettre la traduction de langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9. Cette approche pourra \u00e9galement rendre les syst\u00e8mes de traduction beaucoup plus rapides et efficaces, car elle \u00e9limine les \u00e9tapes suppl\u00e9mentaires de conversion du discours en texte, de traduction et de g\u00e9n\u00e9ration du discours dans la langue cible.\u00a0 En plus de requ\u00e9rir des donn\u00e9es d\u2019entra\u00eenement appropri\u00e9es dans des milliers de langues, les syst\u00e8mes de traduction automatique d\u2019aujourd\u2019hui ne sont pas con\u00e7us pour s\u2019adapter aux besoins individuels. De nombreux syst\u00e8mes de traduction automatique sont bilingues, ce qui signifie qu\u2019il existe un mod\u00e8le distinct pour chaque combinaison, comme anglais-russe ou japonais-espagnol. Cette approche est extr\u00eamement difficile \u00e0 adapter \u00e0 des dizaines de combinaisons et \u00e0 toutes les langues utilis\u00e9es dans le monde. Imaginez devoir cr\u00e9er et maintenir plusieurs milliers de mod\u00e8les diff\u00e9rents pour chaque combinaison, de tha\u00ef-lao \u00e0 n\u00e9palais-assamais. Un grand nombre de sp\u00e9cialistes ont sugg\u00e9r\u00e9 que des syst\u00e8mes multilingues pourraient \u00eatre la solution. Mais il est extr\u00eamement difficile d\u2019int\u00e9grer de nombreuses langues \u00e0 un seul mod\u00e8le multilingue efficace et performant capable de repr\u00e9senter toutes les langues.\u00a0 En plus d\u2019\u00eatre confront\u00e9s aux m\u00eames d\u00e9fis que les mod\u00e8les textuels, les mod\u00e8les de traduction vocale doivent rem\u00e9dier \u00e0 la latence (le d\u00e9calage qui se produit lorsqu\u2019une langue est traduite dans une autre) avant de pouvoir \u00eatre utilis\u00e9s efficacement pour une traduction en temps r\u00e9el. Un d\u00e9fi qui est principalement d\u00fb au fait que l\u2019ordre des mots d\u2019une phrase peut ne pas \u00eatre le m\u00eame dans une langue que dans une autre. M\u00eame les sp\u00e9cialistes de la traduction simultan\u00e9e ont un retard d\u2019environ trois secondes sur le discours original. Prenons l\u2019exemple d\u2019une phrase en allemand, \u00ab Ich m\u00f6chte alle Sprachen \u00fcbersetzen \u00bb, et de son \u00e9quivalent en espagnol, \u00ab Quisiera traducir todos los idiomas \u00bb. Les deux phrases signifient \u00ab Je voudrais traduire toutes les langues \u00bb. Mais traduire de l\u2019allemand vers le fran\u00e7ais en temps r\u00e9el serait plus difficile, car le verbe \u00ab traduire \u00bb appara\u00eet \u00e0 la fin de la phrase en allemand, alors qu\u2019en espagnol et en fran\u00e7ais, l\u2019ordre des mots est similaire. Enfin, alors que nous prenons en charge de plus en plus de langues, nous devons d\u00e9velopper de nouvelles fa\u00e7ons d\u2019\u00e9valuer le travail produit par les mod\u00e8les de traduction automatique. Il existe d\u00e9j\u00e0 des ressources qui permettent d\u2019\u00e9valuer la qualit\u00e9 des traductions, par exemple, de l\u2019anglais vers le russe. Mais qu\u2019en est-il de la combinaison amharique-kazakh, par exemple\u00a0? \u00c0 mesure que le nombre de langues que nos mod\u00e8les de traduction automatique peuvent traduire augmente, nous devrons d\u00e9velopper de nouvelles approches pour l\u2019entra\u00eenement des donn\u00e9es et la mesure. Et en plus d\u2019\u00e9valuer les performances des syst\u00e8mes de traduction automatique en termes de pr\u00e9cision, il est important de s\u2019assurer que les traductions sont effectu\u00e9es de mani\u00e8re responsable. Nous devrons trouver des moyens de nous assurer que les syst\u00e8mes de traduction automatique tiennent compte des \u00e9l\u00e9ments culturels et ne favorisent pas les pr\u00e9jug\u00e9s. Meta\u00a0AI s\u2019efforce de relever chacun de ces trois d\u00e9fis, tels que nous les d\u00e9crivons dans les sections ci-dessous. Entra\u00eener les syst\u00e8mes de traduction vocale directe et \u00e0 faibles ressources Pour permettre la traduction de langues \u00e0 faibles ressources et poser les bases d\u2019un avenir o\u00f9 un plus grand nombre de langues pourront \u00eatre traduites, qu\u2019elles soient tr\u00e8s r\u00e9pandues ou non, nous d\u00e9veloppons nos techniques de cr\u00e9ation automatique d\u2019ensembles de donn\u00e9es. L\u2019une de ces techniques est LASER, une bo\u00eete \u00e0 outils open source qui couvre d\u00e9sormais plus de 125\u00a0langues \u00e9crites et 28\u00a0scripts diff\u00e9rents.\u00a0 LASER convertit des phrases dans diff\u00e9rentes langues en une seule repr\u00e9sentation multilingue. Nous effectuons ensuite une recherche de similitude multilingue \u00e0 grande \u00e9chelle afin d\u2019identifier les phrases ayant une repr\u00e9sentation similaire, c\u2019est-\u00e0-dire susceptibles d\u2019avoir la m\u00eame d\u00e9finition dans diff\u00e9rentes langues. Nous avons utilis\u00e9 LASER pour d\u00e9velopper des syst\u00e8mes tels que ccMatrix et ccAligned, qui sont capables de trouver des textes parall\u00e8les sur Internet. Pour les langues \u00e0 faibles ressources, nous avons cr\u00e9\u00e9 une nouvelle m\u00e9thode d\u2019entra\u00eenement qui permet \u00e0 LASER de se concentrer sur des sous-groupes de langues sp\u00e9cifiques (tels que les langues bantoues) et d\u2019apprendre \u00e0 partir d\u2019ensembles de donn\u00e9es beaucoup plus r\u00e9duits. LASER peut ainsi fonctionner efficacement \u00e0 grande \u00e9chelle dans toutes les langues. Ces progr\u00e8s nous permettront de couvrir plus de langues alors que nous travaillons \u00e0 les d\u00e9velopper et \u00e0 les am\u00e9liorer, le but \u00e9tant de prendre en charge l\u2019exploration de donn\u00e9es pour des centaines de langues, voire toutes les langues ayant un syst\u00e8me d\u2019\u00e9criture. Nous avons r\u00e9cemment d\u00e9velopp\u00e9 le syst\u00e8me LASER afin qu\u2019il fonctionne \u00e9galement avec le discours oral\u00a0: en d\u00e9veloppant des repr\u00e9sentations pour le discours oral et le texte dans le m\u00eame espace multilingue, nous sommes en mesure d\u2019extraire des traductions d\u2019un discours oral dans une langue \u00e0 du texte dans une autre langue, voire m\u00eame des traductions vocales directes. Gr\u00e2ce \u00e0 cette m\u00e9thode, nous avons d\u00e9j\u00e0 mis en correspondance pr\u00e8s de 1\u00a0400\u00a0heures de discours en fran\u00e7ais, en allemand, en espagnol et en anglais. Les donn\u00e9es textuelles sont importantes, mais elles ne sont pas suffisantes pour cr\u00e9er des outils de traduction r\u00e9pondant \u00e0 tous les besoins. Pour la traduction vocale, des donn\u00e9es de r\u00e9f\u00e9rence n\u2019\u00e9taient auparavant disponibles que dans quelques langues. C\u2019est pour cela que nous avons cr\u00e9\u00e9 CoVoST\u00a02, qui couvre 22\u00a0langues et 36\u00a0combinaisons, ainsi que diff\u00e9rents niveaux de ressources. De plus, il est difficile de trouver de grandes quantit\u00e9s d\u2019audio dans diff\u00e9rentes langues. VoxPopuli, qui contient 400\u00a0000\u00a0heures de langage parl\u00e9 dans 23\u00a0langues, permet un apprentissage semi-supervis\u00e9 et auto-contr\u00f4l\u00e9 \u00e0 grande \u00e9chelle pour des cas d\u2019utilisation tels que la reconnaissance vocale et la traduction vocale. VoxPopuli a ensuite \u00e9t\u00e9 utilis\u00e9 pour cr\u00e9er le plus grand mod\u00e8le pr\u00e9-entra\u00een\u00e9 ouvert et universel pour 128\u00a0langues et plusieurs t\u00e2ches ax\u00e9es sur le discours, y compris la traduction vocale. Un mod\u00e8le qui a am\u00e9lior\u00e9 la traduction de discours oral en 21\u00a0langues vers du texte en anglais de 7,4\u00a0BLEU sur l\u2019ensemble de donn\u00e9es CoVoST\u00a02. D\u00e9velopper des mod\u00e8les qui fonctionnent pour de nombreuses langues et diff\u00e9rentes modalit\u00e9s En plus de produire plus de donn\u00e9es pour l\u2019entra\u00eenement des syst\u00e8mes de traduction automatique et de les mettre \u00e0 la disposition d\u2019autres \u00e9quipes de recherche, nous cherchons \u00e0 am\u00e9liorer les capacit\u00e9s des mod\u00e8les afin de prendre en charge la traduction de beaucoup plus de langues. Aujourd\u2019hui, les syst\u00e8mes de traduction automatique ne fonctionnent souvent que pour une seule modalit\u00e9 et un ensemble limit\u00e9 de langues. Si le mod\u00e8le est trop petit pour repr\u00e9senter de nombreuses langues, ses performances peuvent en p\u00e2tir et des inexactitudes peuvent appara\u00eetre dans les traductions textuelles et vocales. Les innovations en mati\u00e8re de mod\u00e9lisation nous aideront \u00e0 cr\u00e9er un avenir o\u00f9 les traductions passeront d\u2019une modalit\u00e9 \u00e0 l\u2019autre rapidement et de mani\u00e8re transparente, \u00e0 savoir de la voix au texte, du texte \u00e0 la voix, du texte au texte ou de la voix \u00e0 la voix, et ce, dans une multitude de langues.\u00a0\u00a0 Pour am\u00e9liorer les performances de nos mod\u00e8les de traduction automatique, nous avons \u00e9norm\u00e9ment investi dans la cr\u00e9ation de mod\u00e8les qui s\u2019entra\u00eenent efficacement malgr\u00e9 une grande capacit\u00e9, en nous concentrant sur des mod\u00e8les multicouches appel\u00e9s \u00ab\u00a0MoE\u00a0\u00bb (pour \u00ab\u00a0Mixture of Experts\u00a0\u00bb). En augmentant la taille des mod\u00e8les et en utilisant une fonction de routage automatique afin que diff\u00e9rents tokens utilisent diff\u00e9rentes routes, nous avons pu \u00e9quilibrer les performances des traductions \u00e0 ressources \u00e9lev\u00e9es et \u00e0 faibles ressources.\u00a0 Pour \u00e9tendre la traduction automatique de texte \u00e0 101\u00a0langues, nous avons cr\u00e9\u00e9 le premier syst\u00e8me de traduction de texte multilingue qui n\u2019est pas ax\u00e9 sur l\u2019anglais. En g\u00e9n\u00e9ral, les syst\u00e8mes bilingues traduisent d\u2019abord la langue source vers l\u2019anglais, puis l\u2019anglais vers la langue cible. Pour rendre ces syst\u00e8mes plus efficaces et am\u00e9liorer leur qualit\u00e9, nous avons arr\u00eat\u00e9 d\u2019utiliser l\u2019anglais en tant que r\u00e9f\u00e9rence, afin que les langues puissent \u00eatre traduites directement dans d\u2019autres langues, sans passer par l\u2019anglais. Bien que cela ait augment\u00e9 la capacit\u00e9 du mod\u00e8le, les mod\u00e8les multilingues \u00e9taient auparavant incapables d\u2019atteindre le m\u00eame niveau de qualit\u00e9 que les syst\u00e8mes bilingues personnalis\u00e9s. Mais r\u00e9cemment, notre syst\u00e8me de traduction multilingue a remport\u00e9 le concours de la conf\u00e9rence annuelle sur la traduction automatique (WMT), prenant ainsi le pas sur les meilleurs mod\u00e8les bilingues. Notre objectif est que notre technologie soit inclusive et qu\u2019elle prenne en charge \u00e0 la fois les langues \u00e9crites et celles qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9. Pour cela, nous d\u00e9veloppons actuellement un syst\u00e8me de traduction vocale qui ne repose pas sur la g\u00e9n\u00e9ration d\u2019une repr\u00e9sentation textuelle interm\u00e9diaire. Cette approche s\u2019est av\u00e9r\u00e9e plus rapide que le syst\u00e8me en cascade traditionnel qui combine des mod\u00e8les de reconnaissance vocale, de traduction automatique et de synth\u00e8se vocale s\u00e9par\u00e9s. Gr\u00e2ce \u00e0 une efficacit\u00e9 am\u00e9lior\u00e9e et \u00e0 une architecture plus simple, la reconnaissance vocale directe pourrait permettre une traduction en temps r\u00e9el de qualit\u00e9 presque humaine pour les appareils du futur, comme les lunettes de r\u00e9alit\u00e9 augment\u00e9e. Enfin, afin de cr\u00e9er des traductions parl\u00e9es qui pr\u00e9servent le ton et le caract\u00e8re du discours de chaque personne, nous nous effor\u00e7ons de conserver certains aspects de l\u2019audio d\u2019entr\u00e9e, tels que l\u2019intonation, dans les traductions audio g\u00e9n\u00e9r\u00e9es. Mesurer nos performances dans des centaines de langues Le d\u00e9veloppement de mod\u00e8les capables de traduire de nombreuses langues \u00e0 grande \u00e9chelle soul\u00e8ve une question importante\u00a0: comment pouvons-nous d\u00e9terminer si nous avons d\u00e9velopp\u00e9 de meilleures donn\u00e9es ou de meilleurs mod\u00e8les\u00a0? L\u2019\u00e9valuation des performances d\u2019un mod\u00e8le multilingue \u00e0 grande \u00e9chelle est compliqu\u00e9e, en particulier parce que cela nous oblige \u00e0 avoir une expertise de terrain dans toutes les langues prises en charge par le mod\u00e8le. Un d\u00e9fi qui prend du temps, qui demande beaucoup de ressources et qui est souvent tr\u00e8s peu pratique.\u00a0 Nous avons cr\u00e9\u00e9 FLORES-101, les premiers ensembles de donn\u00e9es d\u2019\u00e9valuation de la traduction multilingue couvrant 101\u00a0langues, ce qui a permis aux \u00e9quipes de recherche de tester et d\u2019am\u00e9liorer rapidement les mod\u00e8les de traduction multilingue. Contrairement aux ensembles de donn\u00e9es existants, FLORES-101 permet aux \u00e9quipes de recherche de quantifier les performances des syst\u00e8mes pour toutes les combinaisons, pas seulement depuis et vers l\u2019anglais. Pour les millions de personnes dans le monde qui vivent dans des r\u00e9gions o\u00f9 il existe des dizaines de langues officielles, cela permet de cr\u00e9er des syst\u00e8mes de traduction qui r\u00e9pondent \u00e0 des besoins importants.\u00a0 En utilisant FLORES-101, nous avons collabor\u00e9 avec d\u2019autres leaders de la communaut\u00e9 de recherche en IA pour faire progresser la traduction multilingue \u00e0 faibles ressources. Lors de la conf\u00e9rence WMT 2021, nous avons mis en place un groupe de travail pour progresser collectivement dans ce domaine. Des \u00e9quipes de recherche du monde entier y ont particip\u00e9, une grande partie en se concentrant sur les langues qui les concernaient personnellement. Nous avons h\u00e2te de continuer \u00e0 d\u00e9velopper FLORES afin de prendre en charge des centaines de langues. Et si nous faisons des progr\u00e8s importants vers la traduction universelle, nous nous effor\u00e7ons \u00e9galement de le faire de mani\u00e8re responsable. Nous travaillons avec des linguistes pour mieux comprendre les d\u00e9fis li\u00e9s \u00e0 la collection d\u2019ensembles de donn\u00e9es pr\u00e9cises, ainsi qu\u2019avec des r\u00e9seaux d\u2019\u00e9valuation afin de nous assurer que les traductions sont exactes. Nous menons \u00e9galement des \u00e9tudes de cas avec des locuteurs et locutrices de plus de 20\u00a0langues pour comprendre quelles fonctionnalit\u00e9s de traduction sont importantes pour les personnes d\u2019horizons diff\u00e9rents, et comment elles utiliseront les traductions produites par nos mod\u00e8les d\u2019IA. Le d\u00e9veloppement responsable de la traduction universelle comporte de nombreux autres aspects, de l\u2019att\u00e9nuation des pr\u00e9jug\u00e9s et des dommages potentiels \u00e0 la pr\u00e9servation des \u00e9l\u00e9ments culturels lorsque les informations sont transmises d\u2019une langue \u00e0 l\u2019autre. Pour atteindre nos objectifs de traduction \u00e0 long terme, nous aurons non seulement besoin d\u2019une expertise en IA, mais aussi de la contribution durable d\u2019un grand nombre de sp\u00e9cialistes, d\u2019\u00e9quipes de recherche et d\u2019individus du monde entier.\u00a0 Et maintenant\u00a0? Si avec les projets No Language Left Behind et Universal Speech Translator et gr\u00e2ce aux efforts de la communaut\u00e9 de recherche en traduction automatique, nous parvenons \u00e0 cr\u00e9er des technologies de traduction inclusives, les mondes virtuel et r\u00e9el s\u2019ouvriront d\u2019une fa\u00e7on qui \u00e9tait jusqu\u2019\u00e0 pr\u00e9sent impossible. Nous sommes d\u00e9j\u00e0 en train de faire des progr\u00e8s dans la traduction de langues \u00e0 faibles ressources, un obstacle important \u00e0 la traduction universelle pour la majeure partie de la population mondiale. En faisant progresser et en rendant accessibles nos travaux sur la cr\u00e9ation de corpus, la mod\u00e9lisation multilingue et l\u2019\u00e9valuation, nous esp\u00e9rons que d\u2019autres \u00e9quipes de recherche nous aideront \u00e0 faire de ces syst\u00e8mes de traduction une r\u00e9alit\u00e9 du quotidien.\u00a0 La communication est l\u2019une des caract\u00e9ristiques les plus importantes de l\u2019\u00eatre humain. Les technologies, de la presse \u00e9crite \u00e0 la discussion vid\u00e9o, ont souvent transform\u00e9 notre fa\u00e7on de communiquer et de partager des id\u00e9es. L\u2019efficacit\u00e9 de ces technologies et d\u2019autres augmentera lorsqu\u2019elles pourront fonctionner de la m\u00eame mani\u00e8re, et ce pour des milliards de personnes dans le monde, en leur donnant un acc\u00e8s \u00e9gal \u00e0 l\u2019information et en leur permettant de communiquer avec une audience beaucoup plus large, quelles que soient les langues qu\u2019elles parlent ou \u00e9crivent. Si nous voulons cr\u00e9er un monde plus inclusif et connect\u00e9, nous devons tout mettre en \u0153uvre pour supprimer les obstacles \u00e0 l\u2019information et aux opportunit\u00e9s existants en donnant aux personnes les moyens de s\u2019exprimer dans la langue de leur choix.\u00a0\" \/>\n<meta property=\"og:url\" content=\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/\" \/>\n<meta property=\"og:site_name\" content=\"\u00c0 propos de Meta\" \/>\n<meta property=\"article:published_time\" content=\"2022-02-23T19:30:01+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349\" \/>\n\t<meta property=\"og:image:width\" content=\"605\" \/>\n\t<meta property=\"og:image:height\" content=\"349\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"hopscotch\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@METAfrance\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Meta\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"14 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/\"},\"author\":\"Facebook company\",\"headline\":\"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle\",\"datePublished\":\"2022-02-23T19:30:01+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/\"},\"wordCount\":3471,\"publisher\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#organization\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349\",\"keywords\":[\"inclusion\",\"Inside the lab\",\"intelligence artificielle\",\"Langage\",\"Meta\",\"Meta AI\",\"NLP\",\"outils linguistiques\",\"traduction\"],\"articleSection\":[\"Actualit\u00e9s\",\"Intelligence Artificielle\",\"Meta\",\"R\u00e9alit\u00e9 Augment\u00e9e et R\u00e9alit\u00e9 Virtuelle\"],\"inLanguage\":\"fr-FR\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/\",\"url\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/\",\"name\":\"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle | \u00c0 propos de Meta\",\"isPartOf\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349\",\"datePublished\":\"2022-02-23T19:30:01+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/\"]}],\"author\":\"\u00c0 propos de Meta\"},{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#primaryimage\",\"url\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349\",\"contentUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349\",\"width\":605,\"height\":349},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/about.fb.com\/fr\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/about.fb.com\/fr\/#website\",\"url\":\"https:\/\/about.fb.com\/news\/\",\"name\":\"\u00c0 propos de Meta\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/about.fb.com\/fr\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\",\"alternateName\":[\"Meta Newsroom\",\"Meta\"]},{\"@type\":\"Organization\",\"@id\":\"https:\/\/about.fb.com\/fr\/#organization\",\"name\":\"Meta\",\"url\":\"https:\/\/about.fb.com\/fr\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500\",\"contentUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500\",\"width\":8000,\"height\":4500,\"caption\":\"Meta\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/\"}}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle | \u00c0 propos de Meta","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/","og_locale":"fr_FR","og_type":"article","og_title":"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle | \u00c0 propos de Meta","og_description":"Si vous parlez des langues comme l\u2019anglais, le mandarin ou l\u2019espagnol, vous pensez peut-\u00eatre que les applications et les outils web d\u2019aujourd\u2019hui fournissent d\u00e9j\u00e0 les technologies de traduction dont nous avons besoin. Mais des milliards de personnes ne peuvent pas encore acc\u00e9der facilement \u00e0 des informations et communiquer en ligne dans leur langue maternelle. Les syst\u00e8mes de traduction automatique d\u2019aujourd\u2019hui s\u2019am\u00e9liorent rapidement, mais leur entra\u00eenement repose encore sur de grandes quantit\u00e9s de donn\u00e9es textuelles. C\u2019est pour cette raison qu\u2019ils ne fonctionnent g\u00e9n\u00e9ralement pas bien pour les langues \u00e0 faibles ressources, c\u2019est-\u00e0-dire celles pour lesquelles peu de donn\u00e9es d\u2019entra\u00eenement sont disponibles, ni pour les langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9.\u00a0 Faire tomber compl\u00e8tement les barri\u00e8res linguistiques pourrait changer le monde. Cela permettrait \u00e0 des milliards de personnes d\u2019acc\u00e9der \u00e0 des informations en ligne dans leur langue maternelle ou pr\u00e9f\u00e9r\u00e9e. En plus d\u2019inclure les personnes qui ne parlent pas l\u2019une des langues qui dominent actuellement Internet, les progr\u00e8s de la traduction automatique pourraient changer fondamentalement la fa\u00e7on dont les populations communiquent et \u00e9changent des id\u00e9es \u00e0 travers le monde.\u00a0 Alors que nous travaillons \u00e0 cr\u00e9er le m\u00e9tavers, nous devrons inventer des espaces virtuels immersifs auxquels tout le monde pourra participer, quelles que soient les langues parl\u00e9es.\u00a0 Par exemple, imaginez que des personnes se trouvant dans un pays o\u00f9 diff\u00e9rentes langues sont parl\u00e9es puissent communiquer entre elles en temps r\u00e9el \u00e0 l\u2019aide d\u2019un t\u00e9l\u00e9phone, d\u2019une montre ou de lunettes. Ou encore qu\u2019un contenu multim\u00e9dia sur le web soit accessible pour n\u2019importe qui dans le monde dans sa langue pr\u00e9f\u00e9r\u00e9e. Dans un avenir pas si lointain, alors que des technologies \u00e9mergentes comme la r\u00e9alit\u00e9 virtuelle et la r\u00e9alit\u00e9 augment\u00e9e pourraient estomper les fronti\u00e8res entre le monde virtuel et le monde r\u00e9el dans le m\u00e9tavers, les outils de traduction permettront \u00e0 tout le monde de participer \u00e0 des activit\u00e9s du quotidien (comme cr\u00e9er un club de lecture ou collaborer sur un projet de travail) avec n\u2019importe qui et de n\u2019importe o\u00f9.\u00a0 Meta\u00a0AI annonce une initiative \u00e0 long terme visant \u00e0 cr\u00e9er des outils linguistiques et de traduction automatique qui incluront la plupart des langues du monde. Cette initiative comprend deux nouveaux projets. Le premier, No Language Left Behind, consiste \u00e0 d\u00e9velopper un nouveau mod\u00e8le d\u2019IA avanc\u00e9 qui pourra apprendre des langues sans avoir besoin d\u2019autant d\u2019exemples d\u2019entra\u00eenement que les mod\u00e8les actuels. Nous l\u2019utiliserons pour permettre des traductions professionnelles dans des centaines de langues, de l\u2019asturien au luganda en passant par l\u2019ourdou. Le deuxi\u00e8me, Universal Speech Translator, vise \u00e0 concevoir de nouvelles approches pour traduire le langage parl\u00e9 d\u2019une langue \u00e0 une autre en temps r\u00e9el, afin de prendre en charge les langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9 ainsi que celles qui sont \u00e0 la fois \u00e9crites et parl\u00e9es.\u00a0 De nombreux efforts seront n\u00e9cessaires pour proposer des outils de traduction v\u00e9ritablement universels. Mais nous pensons que cela constitue un grand pas en avant. En partageant des informations sur notre code et nos mod\u00e8les et en les rendant open source, nous permettrons aux autres de s\u2019appuyer sur notre travail et de nous aider \u00e0 atteindre cet objectif important.\u00a0 Les d\u00e9fis de la traduction dans toutes les langues Les syst\u00e8mes de traduction bas\u00e9s sur l\u2019IA d\u2019aujourd\u2019hui ne prennent pas en charge les milliers de langues en usage \u00e0 travers le monde, et ne sont pas con\u00e7us pour fournir une traduction vocale en temps r\u00e9el. Pour que tout le monde puisse en profiter, la communaut\u00e9 de la recherche en traduction automatique devra surmonter trois d\u00e9fis importants. Nous devrons surmonter le manque de donn\u00e9es. Pour cela, il faudra acqu\u00e9rir plus de donn\u00e9es d\u2019entra\u00eenement dans plus de langues et trouver de nouvelles fa\u00e7ons de tirer parti de celles d\u00e9j\u00e0 disponibles aujourd\u2019hui. Nous devrons surmonter les d\u00e9fis en mati\u00e8re de mod\u00e9lisation qui se poseront \u00e0 mesure que les mod\u00e8les se d\u00e9velopperont pour servir de plus en plus de langues. Et nous devrons \u00e9galement trouver de nouvelles fa\u00e7ons d\u2019\u00e9valuer et d\u2019am\u00e9liorer leurs r\u00e9sultats.\u00a0 Le manque de donn\u00e9es reste l\u2019un des principaux obstacles au d\u00e9veloppement des outils de traduction dans plus de langues. Les syst\u00e8mes de traduction automatique de texte reposent g\u00e9n\u00e9ralement sur un entra\u00eenement \u00e0 partir de millions de phrases issues de donn\u00e9es annot\u00e9es. C\u2019est pour cette raison que des syst\u00e8mes de traduction automatique pouvant produire des traductions de haute qualit\u00e9 n\u2019ont \u00e9t\u00e9 d\u00e9velopp\u00e9s que pour les quelques langues qui dominent le web. Pour en d\u00e9velopper dans d\u2019autres langues, il faut trouver des moyens d\u2019acqu\u00e9rir et d\u2019utiliser des exemples d\u2019entra\u00eenement \u00e0 partir de langues peu pr\u00e9sentes sur le web.\u00a0 Pour la traduction orale directe, acqu\u00e9rir des donn\u00e9es est encore plus difficile. La plupart des syst\u00e8mes de traduction automatique vocale utilisent le texte en tant qu\u2019\u00e9tape interm\u00e9diaire\u00a0: le discours oral dans une langue est d\u2019abord converti en texte, puis ce texte est traduit dans la langue cible et la traduction est entr\u00e9e dans un syst\u00e8me de synth\u00e8se vocale pour g\u00e9n\u00e9rer de l\u2019audio. Les traductions vocales sont donc d\u00e9pendantes du texte, ce qui limite leur efficacit\u00e9 et les rend difficiles \u00e0 adapter aux langues qui sont principalement parl\u00e9es. Les mod\u00e8les de traduction vocale directe peuvent permettre la traduction de langues qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9. Cette approche pourra \u00e9galement rendre les syst\u00e8mes de traduction beaucoup plus rapides et efficaces, car elle \u00e9limine les \u00e9tapes suppl\u00e9mentaires de conversion du discours en texte, de traduction et de g\u00e9n\u00e9ration du discours dans la langue cible.\u00a0 En plus de requ\u00e9rir des donn\u00e9es d\u2019entra\u00eenement appropri\u00e9es dans des milliers de langues, les syst\u00e8mes de traduction automatique d\u2019aujourd\u2019hui ne sont pas con\u00e7us pour s\u2019adapter aux besoins individuels. De nombreux syst\u00e8mes de traduction automatique sont bilingues, ce qui signifie qu\u2019il existe un mod\u00e8le distinct pour chaque combinaison, comme anglais-russe ou japonais-espagnol. Cette approche est extr\u00eamement difficile \u00e0 adapter \u00e0 des dizaines de combinaisons et \u00e0 toutes les langues utilis\u00e9es dans le monde. Imaginez devoir cr\u00e9er et maintenir plusieurs milliers de mod\u00e8les diff\u00e9rents pour chaque combinaison, de tha\u00ef-lao \u00e0 n\u00e9palais-assamais. Un grand nombre de sp\u00e9cialistes ont sugg\u00e9r\u00e9 que des syst\u00e8mes multilingues pourraient \u00eatre la solution. Mais il est extr\u00eamement difficile d\u2019int\u00e9grer de nombreuses langues \u00e0 un seul mod\u00e8le multilingue efficace et performant capable de repr\u00e9senter toutes les langues.\u00a0 En plus d\u2019\u00eatre confront\u00e9s aux m\u00eames d\u00e9fis que les mod\u00e8les textuels, les mod\u00e8les de traduction vocale doivent rem\u00e9dier \u00e0 la latence (le d\u00e9calage qui se produit lorsqu\u2019une langue est traduite dans une autre) avant de pouvoir \u00eatre utilis\u00e9s efficacement pour une traduction en temps r\u00e9el. Un d\u00e9fi qui est principalement d\u00fb au fait que l\u2019ordre des mots d\u2019une phrase peut ne pas \u00eatre le m\u00eame dans une langue que dans une autre. M\u00eame les sp\u00e9cialistes de la traduction simultan\u00e9e ont un retard d\u2019environ trois secondes sur le discours original. Prenons l\u2019exemple d\u2019une phrase en allemand, \u00ab Ich m\u00f6chte alle Sprachen \u00fcbersetzen \u00bb, et de son \u00e9quivalent en espagnol, \u00ab Quisiera traducir todos los idiomas \u00bb. Les deux phrases signifient \u00ab Je voudrais traduire toutes les langues \u00bb. Mais traduire de l\u2019allemand vers le fran\u00e7ais en temps r\u00e9el serait plus difficile, car le verbe \u00ab traduire \u00bb appara\u00eet \u00e0 la fin de la phrase en allemand, alors qu\u2019en espagnol et en fran\u00e7ais, l\u2019ordre des mots est similaire. Enfin, alors que nous prenons en charge de plus en plus de langues, nous devons d\u00e9velopper de nouvelles fa\u00e7ons d\u2019\u00e9valuer le travail produit par les mod\u00e8les de traduction automatique. Il existe d\u00e9j\u00e0 des ressources qui permettent d\u2019\u00e9valuer la qualit\u00e9 des traductions, par exemple, de l\u2019anglais vers le russe. Mais qu\u2019en est-il de la combinaison amharique-kazakh, par exemple\u00a0? \u00c0 mesure que le nombre de langues que nos mod\u00e8les de traduction automatique peuvent traduire augmente, nous devrons d\u00e9velopper de nouvelles approches pour l\u2019entra\u00eenement des donn\u00e9es et la mesure. Et en plus d\u2019\u00e9valuer les performances des syst\u00e8mes de traduction automatique en termes de pr\u00e9cision, il est important de s\u2019assurer que les traductions sont effectu\u00e9es de mani\u00e8re responsable. Nous devrons trouver des moyens de nous assurer que les syst\u00e8mes de traduction automatique tiennent compte des \u00e9l\u00e9ments culturels et ne favorisent pas les pr\u00e9jug\u00e9s. Meta\u00a0AI s\u2019efforce de relever chacun de ces trois d\u00e9fis, tels que nous les d\u00e9crivons dans les sections ci-dessous. Entra\u00eener les syst\u00e8mes de traduction vocale directe et \u00e0 faibles ressources Pour permettre la traduction de langues \u00e0 faibles ressources et poser les bases d\u2019un avenir o\u00f9 un plus grand nombre de langues pourront \u00eatre traduites, qu\u2019elles soient tr\u00e8s r\u00e9pandues ou non, nous d\u00e9veloppons nos techniques de cr\u00e9ation automatique d\u2019ensembles de donn\u00e9es. L\u2019une de ces techniques est LASER, une bo\u00eete \u00e0 outils open source qui couvre d\u00e9sormais plus de 125\u00a0langues \u00e9crites et 28\u00a0scripts diff\u00e9rents.\u00a0 LASER convertit des phrases dans diff\u00e9rentes langues en une seule repr\u00e9sentation multilingue. Nous effectuons ensuite une recherche de similitude multilingue \u00e0 grande \u00e9chelle afin d\u2019identifier les phrases ayant une repr\u00e9sentation similaire, c\u2019est-\u00e0-dire susceptibles d\u2019avoir la m\u00eame d\u00e9finition dans diff\u00e9rentes langues. Nous avons utilis\u00e9 LASER pour d\u00e9velopper des syst\u00e8mes tels que ccMatrix et ccAligned, qui sont capables de trouver des textes parall\u00e8les sur Internet. Pour les langues \u00e0 faibles ressources, nous avons cr\u00e9\u00e9 une nouvelle m\u00e9thode d\u2019entra\u00eenement qui permet \u00e0 LASER de se concentrer sur des sous-groupes de langues sp\u00e9cifiques (tels que les langues bantoues) et d\u2019apprendre \u00e0 partir d\u2019ensembles de donn\u00e9es beaucoup plus r\u00e9duits. LASER peut ainsi fonctionner efficacement \u00e0 grande \u00e9chelle dans toutes les langues. Ces progr\u00e8s nous permettront de couvrir plus de langues alors que nous travaillons \u00e0 les d\u00e9velopper et \u00e0 les am\u00e9liorer, le but \u00e9tant de prendre en charge l\u2019exploration de donn\u00e9es pour des centaines de langues, voire toutes les langues ayant un syst\u00e8me d\u2019\u00e9criture. Nous avons r\u00e9cemment d\u00e9velopp\u00e9 le syst\u00e8me LASER afin qu\u2019il fonctionne \u00e9galement avec le discours oral\u00a0: en d\u00e9veloppant des repr\u00e9sentations pour le discours oral et le texte dans le m\u00eame espace multilingue, nous sommes en mesure d\u2019extraire des traductions d\u2019un discours oral dans une langue \u00e0 du texte dans une autre langue, voire m\u00eame des traductions vocales directes. Gr\u00e2ce \u00e0 cette m\u00e9thode, nous avons d\u00e9j\u00e0 mis en correspondance pr\u00e8s de 1\u00a0400\u00a0heures de discours en fran\u00e7ais, en allemand, en espagnol et en anglais. Les donn\u00e9es textuelles sont importantes, mais elles ne sont pas suffisantes pour cr\u00e9er des outils de traduction r\u00e9pondant \u00e0 tous les besoins. Pour la traduction vocale, des donn\u00e9es de r\u00e9f\u00e9rence n\u2019\u00e9taient auparavant disponibles que dans quelques langues. C\u2019est pour cela que nous avons cr\u00e9\u00e9 CoVoST\u00a02, qui couvre 22\u00a0langues et 36\u00a0combinaisons, ainsi que diff\u00e9rents niveaux de ressources. De plus, il est difficile de trouver de grandes quantit\u00e9s d\u2019audio dans diff\u00e9rentes langues. VoxPopuli, qui contient 400\u00a0000\u00a0heures de langage parl\u00e9 dans 23\u00a0langues, permet un apprentissage semi-supervis\u00e9 et auto-contr\u00f4l\u00e9 \u00e0 grande \u00e9chelle pour des cas d\u2019utilisation tels que la reconnaissance vocale et la traduction vocale. VoxPopuli a ensuite \u00e9t\u00e9 utilis\u00e9 pour cr\u00e9er le plus grand mod\u00e8le pr\u00e9-entra\u00een\u00e9 ouvert et universel pour 128\u00a0langues et plusieurs t\u00e2ches ax\u00e9es sur le discours, y compris la traduction vocale. Un mod\u00e8le qui a am\u00e9lior\u00e9 la traduction de discours oral en 21\u00a0langues vers du texte en anglais de 7,4\u00a0BLEU sur l\u2019ensemble de donn\u00e9es CoVoST\u00a02. D\u00e9velopper des mod\u00e8les qui fonctionnent pour de nombreuses langues et diff\u00e9rentes modalit\u00e9s En plus de produire plus de donn\u00e9es pour l\u2019entra\u00eenement des syst\u00e8mes de traduction automatique et de les mettre \u00e0 la disposition d\u2019autres \u00e9quipes de recherche, nous cherchons \u00e0 am\u00e9liorer les capacit\u00e9s des mod\u00e8les afin de prendre en charge la traduction de beaucoup plus de langues. Aujourd\u2019hui, les syst\u00e8mes de traduction automatique ne fonctionnent souvent que pour une seule modalit\u00e9 et un ensemble limit\u00e9 de langues. Si le mod\u00e8le est trop petit pour repr\u00e9senter de nombreuses langues, ses performances peuvent en p\u00e2tir et des inexactitudes peuvent appara\u00eetre dans les traductions textuelles et vocales. Les innovations en mati\u00e8re de mod\u00e9lisation nous aideront \u00e0 cr\u00e9er un avenir o\u00f9 les traductions passeront d\u2019une modalit\u00e9 \u00e0 l\u2019autre rapidement et de mani\u00e8re transparente, \u00e0 savoir de la voix au texte, du texte \u00e0 la voix, du texte au texte ou de la voix \u00e0 la voix, et ce, dans une multitude de langues.\u00a0\u00a0 Pour am\u00e9liorer les performances de nos mod\u00e8les de traduction automatique, nous avons \u00e9norm\u00e9ment investi dans la cr\u00e9ation de mod\u00e8les qui s\u2019entra\u00eenent efficacement malgr\u00e9 une grande capacit\u00e9, en nous concentrant sur des mod\u00e8les multicouches appel\u00e9s \u00ab\u00a0MoE\u00a0\u00bb (pour \u00ab\u00a0Mixture of Experts\u00a0\u00bb). En augmentant la taille des mod\u00e8les et en utilisant une fonction de routage automatique afin que diff\u00e9rents tokens utilisent diff\u00e9rentes routes, nous avons pu \u00e9quilibrer les performances des traductions \u00e0 ressources \u00e9lev\u00e9es et \u00e0 faibles ressources.\u00a0 Pour \u00e9tendre la traduction automatique de texte \u00e0 101\u00a0langues, nous avons cr\u00e9\u00e9 le premier syst\u00e8me de traduction de texte multilingue qui n\u2019est pas ax\u00e9 sur l\u2019anglais. En g\u00e9n\u00e9ral, les syst\u00e8mes bilingues traduisent d\u2019abord la langue source vers l\u2019anglais, puis l\u2019anglais vers la langue cible. Pour rendre ces syst\u00e8mes plus efficaces et am\u00e9liorer leur qualit\u00e9, nous avons arr\u00eat\u00e9 d\u2019utiliser l\u2019anglais en tant que r\u00e9f\u00e9rence, afin que les langues puissent \u00eatre traduites directement dans d\u2019autres langues, sans passer par l\u2019anglais. Bien que cela ait augment\u00e9 la capacit\u00e9 du mod\u00e8le, les mod\u00e8les multilingues \u00e9taient auparavant incapables d\u2019atteindre le m\u00eame niveau de qualit\u00e9 que les syst\u00e8mes bilingues personnalis\u00e9s. Mais r\u00e9cemment, notre syst\u00e8me de traduction multilingue a remport\u00e9 le concours de la conf\u00e9rence annuelle sur la traduction automatique (WMT), prenant ainsi le pas sur les meilleurs mod\u00e8les bilingues. Notre objectif est que notre technologie soit inclusive et qu\u2019elle prenne en charge \u00e0 la fois les langues \u00e9crites et celles qui n\u2019ont pas de syst\u00e8me d\u2019\u00e9criture standardis\u00e9. Pour cela, nous d\u00e9veloppons actuellement un syst\u00e8me de traduction vocale qui ne repose pas sur la g\u00e9n\u00e9ration d\u2019une repr\u00e9sentation textuelle interm\u00e9diaire. Cette approche s\u2019est av\u00e9r\u00e9e plus rapide que le syst\u00e8me en cascade traditionnel qui combine des mod\u00e8les de reconnaissance vocale, de traduction automatique et de synth\u00e8se vocale s\u00e9par\u00e9s. Gr\u00e2ce \u00e0 une efficacit\u00e9 am\u00e9lior\u00e9e et \u00e0 une architecture plus simple, la reconnaissance vocale directe pourrait permettre une traduction en temps r\u00e9el de qualit\u00e9 presque humaine pour les appareils du futur, comme les lunettes de r\u00e9alit\u00e9 augment\u00e9e. Enfin, afin de cr\u00e9er des traductions parl\u00e9es qui pr\u00e9servent le ton et le caract\u00e8re du discours de chaque personne, nous nous effor\u00e7ons de conserver certains aspects de l\u2019audio d\u2019entr\u00e9e, tels que l\u2019intonation, dans les traductions audio g\u00e9n\u00e9r\u00e9es. Mesurer nos performances dans des centaines de langues Le d\u00e9veloppement de mod\u00e8les capables de traduire de nombreuses langues \u00e0 grande \u00e9chelle soul\u00e8ve une question importante\u00a0: comment pouvons-nous d\u00e9terminer si nous avons d\u00e9velopp\u00e9 de meilleures donn\u00e9es ou de meilleurs mod\u00e8les\u00a0? L\u2019\u00e9valuation des performances d\u2019un mod\u00e8le multilingue \u00e0 grande \u00e9chelle est compliqu\u00e9e, en particulier parce que cela nous oblige \u00e0 avoir une expertise de terrain dans toutes les langues prises en charge par le mod\u00e8le. Un d\u00e9fi qui prend du temps, qui demande beaucoup de ressources et qui est souvent tr\u00e8s peu pratique.\u00a0 Nous avons cr\u00e9\u00e9 FLORES-101, les premiers ensembles de donn\u00e9es d\u2019\u00e9valuation de la traduction multilingue couvrant 101\u00a0langues, ce qui a permis aux \u00e9quipes de recherche de tester et d\u2019am\u00e9liorer rapidement les mod\u00e8les de traduction multilingue. Contrairement aux ensembles de donn\u00e9es existants, FLORES-101 permet aux \u00e9quipes de recherche de quantifier les performances des syst\u00e8mes pour toutes les combinaisons, pas seulement depuis et vers l\u2019anglais. Pour les millions de personnes dans le monde qui vivent dans des r\u00e9gions o\u00f9 il existe des dizaines de langues officielles, cela permet de cr\u00e9er des syst\u00e8mes de traduction qui r\u00e9pondent \u00e0 des besoins importants.\u00a0 En utilisant FLORES-101, nous avons collabor\u00e9 avec d\u2019autres leaders de la communaut\u00e9 de recherche en IA pour faire progresser la traduction multilingue \u00e0 faibles ressources. Lors de la conf\u00e9rence WMT 2021, nous avons mis en place un groupe de travail pour progresser collectivement dans ce domaine. Des \u00e9quipes de recherche du monde entier y ont particip\u00e9, une grande partie en se concentrant sur les langues qui les concernaient personnellement. Nous avons h\u00e2te de continuer \u00e0 d\u00e9velopper FLORES afin de prendre en charge des centaines de langues. Et si nous faisons des progr\u00e8s importants vers la traduction universelle, nous nous effor\u00e7ons \u00e9galement de le faire de mani\u00e8re responsable. Nous travaillons avec des linguistes pour mieux comprendre les d\u00e9fis li\u00e9s \u00e0 la collection d\u2019ensembles de donn\u00e9es pr\u00e9cises, ainsi qu\u2019avec des r\u00e9seaux d\u2019\u00e9valuation afin de nous assurer que les traductions sont exactes. Nous menons \u00e9galement des \u00e9tudes de cas avec des locuteurs et locutrices de plus de 20\u00a0langues pour comprendre quelles fonctionnalit\u00e9s de traduction sont importantes pour les personnes d\u2019horizons diff\u00e9rents, et comment elles utiliseront les traductions produites par nos mod\u00e8les d\u2019IA. Le d\u00e9veloppement responsable de la traduction universelle comporte de nombreux autres aspects, de l\u2019att\u00e9nuation des pr\u00e9jug\u00e9s et des dommages potentiels \u00e0 la pr\u00e9servation des \u00e9l\u00e9ments culturels lorsque les informations sont transmises d\u2019une langue \u00e0 l\u2019autre. Pour atteindre nos objectifs de traduction \u00e0 long terme, nous aurons non seulement besoin d\u2019une expertise en IA, mais aussi de la contribution durable d\u2019un grand nombre de sp\u00e9cialistes, d\u2019\u00e9quipes de recherche et d\u2019individus du monde entier.\u00a0 Et maintenant\u00a0? Si avec les projets No Language Left Behind et Universal Speech Translator et gr\u00e2ce aux efforts de la communaut\u00e9 de recherche en traduction automatique, nous parvenons \u00e0 cr\u00e9er des technologies de traduction inclusives, les mondes virtuel et r\u00e9el s\u2019ouvriront d\u2019une fa\u00e7on qui \u00e9tait jusqu\u2019\u00e0 pr\u00e9sent impossible. Nous sommes d\u00e9j\u00e0 en train de faire des progr\u00e8s dans la traduction de langues \u00e0 faibles ressources, un obstacle important \u00e0 la traduction universelle pour la majeure partie de la population mondiale. En faisant progresser et en rendant accessibles nos travaux sur la cr\u00e9ation de corpus, la mod\u00e9lisation multilingue et l\u2019\u00e9valuation, nous esp\u00e9rons que d\u2019autres \u00e9quipes de recherche nous aideront \u00e0 faire de ces syst\u00e8mes de traduction une r\u00e9alit\u00e9 du quotidien.\u00a0 La communication est l\u2019une des caract\u00e9ristiques les plus importantes de l\u2019\u00eatre humain. Les technologies, de la presse \u00e9crite \u00e0 la discussion vid\u00e9o, ont souvent transform\u00e9 notre fa\u00e7on de communiquer et de partager des id\u00e9es. L\u2019efficacit\u00e9 de ces technologies et d\u2019autres augmentera lorsqu\u2019elles pourront fonctionner de la m\u00eame mani\u00e8re, et ce pour des milliards de personnes dans le monde, en leur donnant un acc\u00e8s \u00e9gal \u00e0 l\u2019information et en leur permettant de communiquer avec une audience beaucoup plus large, quelles que soient les langues qu\u2019elles parlent ou \u00e9crivent. Si nous voulons cr\u00e9er un monde plus inclusif et connect\u00e9, nous devons tout mettre en \u0153uvre pour supprimer les obstacles \u00e0 l\u2019information et aux opportunit\u00e9s existants en donnant aux personnes les moyens de s\u2019exprimer dans la langue de leur choix.\u00a0","og_url":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/","og_site_name":"\u00c0 propos de Meta","article_published_time":"2022-02-23T19:30:01+00:00","og_image":[{"url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349","width":605,"height":349,"type":"image\/png"}],"author":"hopscotch","twitter_card":"summary_large_image","twitter_creator":"@METAfrance","twitter_misc":{"Written by":"Meta","Est. reading time":"14 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#article","isPartOf":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/"},"author":"Facebook company","headline":"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle","datePublished":"2022-02-23T19:30:01+00:00","mainEntityOfPage":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/"},"wordCount":3471,"publisher":{"@id":"https:\/\/about.fb.com\/fr\/#organization"},"image":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#primaryimage"},"thumbnailUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349","keywords":["inclusion","Inside the lab","intelligence artificielle","Langage","Meta","Meta AI","NLP","outils linguistiques","traduction"],"articleSection":["Actualit\u00e9s","Intelligence Artificielle","Meta","R\u00e9alit\u00e9 Augment\u00e9e et R\u00e9alit\u00e9 Virtuelle"],"inLanguage":"fr-FR"},{"@type":"WebPage","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/","url":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/","name":"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle | \u00c0 propos de Meta","isPartOf":{"@id":"https:\/\/about.fb.com\/fr\/#website"},"primaryImageOfPage":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#primaryimage"},"image":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#primaryimage"},"thumbnailUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349","datePublished":"2022-02-23T19:30:01+00:00","breadcrumb":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/"]}],"author":"\u00c0 propos de Meta"},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#primaryimage","url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349","contentUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349","width":605,"height":349},{"@type":"BreadcrumbList","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/traduire-des-centaines-de-langues-parlees-et-ecrites-en-temps-reel-grace-a-lintelligence-artificielle\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/about.fb.com\/fr\/"},{"@type":"ListItem","position":2,"name":"Traduire des centaines de langues parl\u00e9es et \u00e9crites en temps r\u00e9el gr\u00e2ce \u00e0 l\u2019intelligence artificielle"}]},{"@type":"WebSite","@id":"https:\/\/about.fb.com\/fr\/#website","url":"https:\/\/about.fb.com\/news\/","name":"\u00c0 propos de Meta","description":"","publisher":{"@id":"https:\/\/about.fb.com\/fr\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/about.fb.com\/fr\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR","alternateName":["Meta Newsroom","Meta"]},{"@type":"Organization","@id":"https:\/\/about.fb.com\/fr\/#organization","name":"Meta","url":"https:\/\/about.fb.com\/fr\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/","url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500","contentUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500","width":8000,"height":4500,"caption":"Meta"},"image":{"@id":"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/"}}]}},"jetpack_featured_media_url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL2.png?fit=605%2C349","jetpack-related-posts":[],"jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts\/22858","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/users\/164097090"}],"replies":[{"embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/comments?post=22858"}],"version-history":[{"count":2,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts\/22858\/revisions"}],"predecessor-version":[{"id":22868,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts\/22858\/revisions\/22868"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/media\/22864"}],"wp:attachment":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/media?parent=22858"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/categories?post=22858"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/tags?post=22858"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}