{"id":22856,"date":"2022-02-23T20:30:38","date_gmt":"2022-02-23T19:30:38","guid":{"rendered":"https:\/\/about.fb.com\/fr\/?p=22856"},"modified":"2022-02-24T08:18:01","modified_gmt":"2022-02-24T07:18:01","slug":"projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle","status":"publish","type":"post","link":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/","title":{"rendered":"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle"},"content":{"rendered":"<p><span style=\"font-weight: 400\">Pouvoir interagir avec un assistant virtuel intelligent dans un langage naturel et conversationnel, de la m\u00eame mani\u00e8re que nous interagissons avec des personnes r\u00e9elles, nous faciliterait la vie de bien des mani\u00e8res. Seulement, les assistants virtuels d\u2019aujourd\u2019hui ne sont souvent pas \u00e0 la hauteur, que nous \u00e9changions \u00e0 l\u2019oral ou par \u00e9crit. Ils sont tr\u00e8s vite d\u00e9concert\u00e9s par des demandes du quotidien, telles que \u00ab Mets en sourdine toutes les notifications aujourd\u2019hui, sauf si c\u2019est ma m\u00e8re qui appelle \u00bb, ou encore \u00ab Est-ce que je peux louer la salle des f\u00eates pour organiser une soir\u00e9e ? \u00bb, sans parler de t\u00e2ches comme \u00ab Organise des vacances \u00e0 la plage pour notre famille pour le week-end du 4 juillet \u00e0 un prix raisonnable \u00bb.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Il est donc grand temps d\u2019am\u00e9liorer l\u2019IA conversationnelle.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Pour cela, nous avons le plaisir d\u2019annoncer le projet CAIRaoke, par le biais duquel nous avons d\u00e9velopp\u00e9 un mod\u00e8le de bout en bout bas\u00e9 sur un r\u00e9seau de neurones capable d\u2019alimenter des conversations beaucoup plus personnelles et contextuelles que les syst\u00e8mes utilis\u00e9s jusqu\u2019\u00e0 pr\u00e9sent. Nous utilisons d\u00e9j\u00e0 ce mod\u00e8le issu du projet CAIRaoke dans l\u2019un de nos produits, Portal, et nous visons \u00e0 l\u2019int\u00e9grer \u00e0 des dispositifs de r\u00e9alit\u00e9 augment\u00e9e et de r\u00e9alit\u00e9 virtuelle afin de permettre prochainement des interactions immersives et multimodales avec des assistants virtuels.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Le plus grand obstacle \u00e0 une meilleure IA conversationnelle est, selon nous, l\u2019architecture sur laquelle se basent les assistants virtuels d\u2019aujourd\u2019hui, m\u00eame les plus avanc\u00e9s. En effet, bien que ces syst\u00e8mes fournissent un service unique, ils reposent, en r\u00e9alit\u00e9, sur quatre composants distincts : la compr\u00e9hension du langage naturel (natural language understanding, NLU), le suivi de l\u2019\u00e9tat du dialogue (dialog state tracking, DST), la gestion des poli<\/span><span style=\"font-weight: 400\">tiques de dialogue (dialog policy, DP) et la g\u00e9n\u00e9ration de langage naturel (natural language generation, NLG). Ces syst\u00e8mes d\u2019IA distincts doivent ensuite \u00eatre reli\u00e9s entre eux. Cela les rend difficiles \u00e0 optimiser, peu adaptables \u00e0 des t\u00e2ches nouvelles ou inconnues et tr\u00e8s d\u00e9pendants d\u2019ensembles de donn\u00e9es \u00e9tiquet\u00e9s qui requi\u00e8rent beaucoup de travail.<\/span><\/p>\n<p><span style=\"font-weight: 400\">C\u2019est l\u2019une des raisons pour lesquelles aujourd\u2019hui, les assistants virtuels qui alimentent la plupart des appareils, proposent des options limit\u00e9es, oublient le contexte de la conversation et suivent principalement des dialogues pr\u00e9d\u00e9finis. Par exemple, si, apr\u00e8s avoir demand\u00e9 la m\u00e9t\u00e9o du jour \u00e0 votre assistant virtuel, vous lui demandez quelque chose de simple mais d\u2019inattendu, comme \u00ab Est-ce qu\u2019il fait plus chaud que la semaine derni\u00e8re ? \u00bb, celui-ci sera compl\u00e8tement perdu.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Les mod\u00e8les cr\u00e9\u00e9s dans le cadre du projet CAIRaoke vous permettront de discuter avec vos assistants conversationnels de fa\u00e7on totalement naturelle. Vous pourrez ainsi vous r\u00e9f\u00e9rer \u00e0 quelque chose qui a \u00e9t\u00e9 dit plus t\u00f4t dans la conversation, changer compl\u00e8tement de sujet ou parler de choses qui d\u00e9pendent d\u2019un contexte complexe et nuanc\u00e9. Vous pourrez \u00e9galement interagir avec eux de diff\u00e9rentes mani\u00e8res, par exemple \u00e0 l\u2019aide de gestes.<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-22872\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL7.png?w=751&#038;resize=614%2C325\" alt=\"\" width=\"614\" height=\"325\" \/><\/p>\n<p><span style=\"font-weight: 400\">Nous avons commenc\u00e9 \u00e0 utiliser ce mod\u00e8le sur Portal, l\u2019appareil d\u2019appels vid\u00e9o de Meta, afin de faciliter la cr\u00e9ation et la gestion des rappels. Par exemple, vous pouvez rapidement clarifier une demande comme celle-ci sans avoir \u00e0 vous r\u00e9p\u00e9ter :<\/span><\/p>\n<p><span style=\"font-weight: 400\">\u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \ud83d\udc69\u200d : D\u00e9finis un rappel pour 6h30.<\/span><\/p>\n<p><span style=\"font-weight: 400\">\u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0: Le matin ou le soir ?<\/span><\/p>\n<p><span style=\"font-weight: 400\">\u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \ud83d\udc69\u200d : Le soir, et intitule-le \u00ab acheter des \u0153ufs \u00bb<\/span><\/p>\n<p><span style=\"font-weight: 400\">\u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0: D\u2019accord, un rappel pour acheter des \u0153ufs a \u00e9t\u00e9 d\u00e9fini pour 18h30 demain.<\/span><\/p>\n<p><span style=\"font-weight: 400\">M\u00eame s\u2019il ne s\u2019agit que du premier test, nous avons des raisons de croire que ce mod\u00e8le est bien plus efficace que les approches standard. Sur Portal, en comparant notre approche classique \u00e0 notre nouvelle approche, nous avons observ\u00e9 une am\u00e9lioration importante de l\u2019\u00e9valuation des rappels. Cette am\u00e9lioration est mesur\u00e9e par le taux de r\u00e9ussite de la r\u00e9alisation d\u2019un ensemble d\u2019objectifs de rappels, tout en maintenant le m\u00eame nombre de tours.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Mais il ne s\u2019agit que de la premi\u00e8re \u00e9tape pour tirer pleinement parti de cette nouvelle technologie. Nous pensons que les progr\u00e8s r\u00e9alis\u00e9s gr\u00e2ce au projet CAIRaoke permettront une communication plus riche entre les personnes et l\u2019IA. Ce sera un outil essentiel pour le d\u00e9veloppement du m\u00e9tavers. Un jour, un assistant aliment\u00e9 par le projet CAIRaoke pourra \u00eatre int\u00e9gr\u00e9 \u00e0 des lunettes de r\u00e9alit\u00e9 augment\u00e9e et remplir de nouvelles fonctions tr\u00e8s utiles. Et si par exemple, vous lui demandiez : \u00ab Qu\u2019est-ce qui va avec ce pantalon ? \u00bb, il vous r\u00e9pondrait : \u00ab Voici un T-shirt dans votre couleur pr\u00e9f\u00e9r\u00e9e, le rouge \u00bb et vous montrerait la photo d\u2019un article qu\u2019il a trouv\u00e9 pour vous. Et si vous lui disiez : \u00ab Je l\u2019aime bien, mais les rayures sont trop larges \u00bb, il vous montrerait un mod\u00e8le \u00e0 rayures fines \u00e0 la place.<\/span><\/p>\n<p><span style=\"font-weight: 400\">\u00c0 l\u2019avenir, nous esp\u00e9rons que des millions de personnes dans le monde pourront tirer parti des mod\u00e8les issus de ce projet dans des situations du quotidien comme celle d\u00e9crite ci-dessus.<\/span><\/p>\n<p><strong>D\u00e9velopper une IA conversationnelle vraiment interactive<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Pour faire progresser l\u2019IA conversationnelle, il est important de comprendre toute l\u2019\u00e9tendue du probl\u00e8me. De nombreuses personnes pensent qu\u2019avec les innovations r\u00e9centes en compr\u00e9hension du langage naturel, comme<\/span><a href=\"https:\/\/aclanthology.org\/2020.acl-main.703\/\"> <span style=\"font-weight: 400\">BART<\/span><\/a><span style=\"font-weight: 400\"> et GPT-3, le d\u00e9fi de comprendre et de g\u00e9n\u00e9rer un texte humain a \u00e9t\u00e9 surmont\u00e9. Nous n\u2019en sommes pas encore l\u00e0 : analysons s\u00e9par\u00e9ment, par exemple, l\u2019IA pour la compr\u00e9hension et l\u2019IA pour l\u2019interaction. L\u2019IA pour la compr\u00e9hension a \u00e9t\u00e9 largement \u00e9tudi\u00e9e et d\u00e9velopp\u00e9e dans l\u2019ensemble du secteur. Elle est utilis\u00e9e pour extraire le sens de plusieurs modalit\u00e9s d\u2019entr\u00e9e, comme la reconnaissance automatique de la parole, la classification des images et la compr\u00e9hension du langage naturel. L\u2019IA pour l\u2019interaction, quant \u00e0 elle, repose sur la fa\u00e7on dont nous utilisons notre compr\u00e9hension du monde pour interagir avec d\u2019autres personnes \u00e0 l\u2019aide de la technologie. Il peut s\u2019agir de l\u2019envoi d\u2019un SMS, d\u2019une commande vocale, d\u2019un retour haptique, de l\u2019affichage d\u2019une image, d\u2019une vid\u00e9o, d\u2019un avatar ou d\u2019une combinaison de tout cela.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Les \u00e9quipes de recherche et d\u2019ing\u00e9nierie du secteur s\u2019accordent \u00e0 dire que pour \u00eatre efficaces, les syst\u00e8mes conversationnels doivent disposer d\u2019une base de compr\u00e9hension solide aliment\u00e9e par des mod\u00e8les d\u2019IA. Mais beaucoup pensent que l\u2019interaction est un probl\u00e8me d\u2019ing\u00e9nierie plut\u00f4t qu\u2019un probl\u00e8me d\u2019IA. Par cons\u00e9quent, un sp\u00e9cialiste en ing\u00e9nierie qui conna\u00eet l\u2019\u00e9tat du monde peut cr\u00e9er une logique complexe pour g\u00e9rer l\u2019interaction requise. L\u2019approche d\u2019ing\u00e9nierie permet de comprendre facilement le fonctionnement du syst\u00e8me et de d\u00e9buguer rapidement la logique si n\u00e9cessaire. Mais cela engendre une IA conversationnelle moins puissante, l\u2019une des principales raisons pour lesquelles votre assistant virtuel ne vous permet pas de planifier vos vacances facilement, par exemple.<\/span><\/p>\n<p><strong>Une nouvelle approche unifi\u00e9e\u00a0<\/strong><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-22874\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/AAAAAAA.png?w=890&#038;resize=677%2C444\" alt=\"\" width=\"677\" height=\"444\" \/><\/p>\n<p style=\"text-align: center\"><i><span style=\"font-weight: 400\">Dans ces exemples de dialogues, nous mettons en avant les principales comp\u00e9tences que nous voulons donner aux assistants : fournir des connaissances pr\u00e9cises et \u00e0 jour sur le monde r\u00e9el et travailler de fa\u00e7on multimodale (dans ce cas, \u00e0 travers la vision et la parole), dans plusieurs domaines (envoyer un message ou estimer votre heure d\u2019arriv\u00e9e) et en vous permettant d\u2019orienter la conversation plut\u00f4t que de devoir suivre un mod\u00e8le de conversation rigide.<\/span><\/i><\/p>\n<p><span style=\"font-weight: 400\">L\u2019approche traditionnelle concernant les assistants virtuels intelligents n\u00e9cessite quatre ensembles d\u2019entr\u00e9es et de sorties, un par composant (compr\u00e9hension du langage naturel, suivi de l\u2019\u00e9tat du dialogue, gestion des politiques de dialogue et g\u00e9n\u00e9ration de langage naturel). Et des normes doivent \u00eatre d\u00e9finies pour les entr\u00e9es et les sorties de chaque composant. Par exemple, pour la compr\u00e9hension du langage naturel, un syst\u00e8me d\u2019IA conversationnel traditionnel n\u00e9cessite des ontologies d\u00e9finies (par exemple, plusieurs intentions et entit\u00e9s).<\/span><\/p>\n<p><span style=\"font-weight: 400\">Le mod\u00e8le du projet CAIRaoke utilise, lui, un r\u00e9seau de neurones, et n\u2019impose aucun flux conversationnel. En utilisant ce mod\u00e8le, nous n\u2019avons donc besoin que d\u2019un seul ensemble de donn\u00e9es d\u2019entra\u00eenement.\u00a0<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-22873\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL8.png?w=605&#038;resize=605%2C337\" alt=\"\" width=\"605\" height=\"337\" srcset=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL8.png?w=605 605w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL8.png?w=600 600w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL8.png?w=300 300w\" sizes=\"auto, (max-width: 605px) 100vw, 605px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Le projet CAIRaoke r\u00e9duit les efforts requis pour ajouter un nouveau domaine. Dans l\u2019ancienne approche, le d\u00e9veloppement d\u2019un nouveau domaine oblige \u00e0 cr\u00e9er et \u00e0 corriger chaque module un par un avant de pouvoir entra\u00eener le suivant de mani\u00e8re fiable. En d\u2019autres termes, l\u2019entra\u00eenement aux politiques de dialogue ne peut pas \u00eatre effectu\u00e9 efficacement si la compr\u00e9hension du langage naturel et le suivi de l\u2019\u00e9tat du dialogue changent constamment. Des changements au niveau d\u2019un composant peuvent perturber les autres, ce qui obligerait \u00e0 entra\u00eener \u00e0 nouveau tous les modules suivants. Cette interd\u00e9pendance ralentit la progression dans les modules suivants. Notre technique de bout en bout<\/span> <span style=\"font-weight: 400\">supprime cette d\u00e9pendance aux modules pr\u00e9c\u00e9dents, ce qui acc\u00e9l\u00e8re la vitesse de d\u00e9veloppement et d\u2019entra\u00eenement et nous permet d\u2019affiner d\u2019autres mod\u00e8les en utilisant moins d\u2019efforts et de donn\u00e9es.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Dans notre nouvelle approche, les dialogues sont beaucoup plus puissants, car ils sont capables de prendre des d\u00e9cisions en analysant toutes les informations disponibles en un seul et m\u00eame endroit. Auparavant, m\u00eame une petite erreur au niveau de l\u2019un des composants pouvait se propager \u00e0 d\u2019autres composants de mani\u00e8re inattendue, et ce probl\u00e8me \u00e9tait difficile \u00e0 r\u00e9soudre. Par exemple, les assistants virtuels actuels bas\u00e9s sur des r\u00e8gles sont explicitement programm\u00e9s pour rechercher des mots ou des phrases sp\u00e9cifiques (comme \u00ab apr\u00e8s-midi \u00bb), alors que le projet CAIRaoke tire parti de mod\u00e8les de langage pr\u00e9-entra\u00een\u00e9s avanc\u00e9s qui comprennent mieux le contexte et peuvent reconna\u00eetre diff\u00e9rentes fa\u00e7ons de dire la m\u00eame chose.\u00a0\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Enfin, le projet CAIRaoke allie la technologie qui sous-tend le bot conversationnel le plus r\u00e9cent de Meta,<\/span><a href=\"https:\/\/ai.facebook.com\/blog\/blender-bot-2-an-open-source-chatbot-that-builds-long-term-memory-and-searches-the-internet\/\"><span style=\"font-weight: 400\"> BlenderBot 2.0<\/span><\/a><span style=\"font-weight: 400\">, \u00e0 des dialogues ax\u00e9s sur les t\u00e2ches. Les assistants virtuels d\u00e9velopp\u00e9s \u00e0 l\u2019aide de notre mod\u00e8le pourraient donc utiliser un langage empathique, transmettre des informations trouv\u00e9es sur Internet en temps r\u00e9el et avoir une personnalit\u00e9 coh\u00e9rente.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Lorsque les syst\u00e8mes g\u00e9n\u00e8rent un langage naturel, <\/span><span style=\"font-weight: 400\">il est essentiel de tenir compte des d\u00e9fis potentiels en mati\u00e8re de s\u00e9curit\u00e9 et de confidentialit\u00e9. La plupart des syst\u00e8mes de g\u00e9n\u00e9ration de langage naturel <\/span><span style=\"font-weight: 400\">d\u2019aujourd\u2019hui sont pr\u00e9d\u00e9finis, afin que les \u00e9quipes charg\u00e9es de la mod\u00e9ration du contenu puissent s\u2019assurer que les assistants virtuels ne r\u00e9pondent pas de fa\u00e7on ind\u00e9sirable. Mais lorsque l\u2019assistant virtuel est en contact direct avec une personne r\u00e9elle, il existe un risque d\u2019erreurs et d\u2019interactions potentiellement blessantes, comme cela a d\u00e9j\u00e0 pu \u00eatre constat\u00e9 par le pass\u00e9.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Notez que nous avons int\u00e9gr\u00e9<\/span><a href=\"https:\/\/ai.facebook.com\/blog\/blender-bot-2-an-open-source-chatbot-that-builds-long-term-memory-and-searches-the-internet\/\"> <span style=\"font-weight: 400\">des protections \u00e0 BlenderBot<\/span><\/a><span style=\"font-weight: 400\"> afin de r\u00e9duire ces cas de r\u00e9ponses blessantes. Nous tenons \u00e9galement compte de la confidentialit\u00e9 lors de la conception de ces technologies. Par exemple, avec les Ray-Ban Stories et<\/span><a href=\"https:\/\/portal.facebook.com\/\"> <span style=\"font-weight: 400\">Portal<\/span><\/a><span style=\"font-weight: 400\">, l\u2019utilisation des commandes vocales est facultative, vous pouvez donc afficher et supprimer les transcriptions de vos commandes vocales, et vous avez toujours la possibilit\u00e9 de d\u00e9sactiver leur stockage.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Pour att\u00e9nuer le risque de r\u00e9ponses ind\u00e9sirables, la premi\u00e8re \u00e9tape du projet CAIRaoke \u00e9tait de g\u00e9n\u00e9rer \u00e0 la fois des actions de dialogue et un langage naturel. \u00c0 court terme, nous g\u00e9n\u00e9rons des actions de dialogue et nous nous appuyons sur un syst\u00e8me de g\u00e9n\u00e9ration de langage naturel test\u00e9 et tr\u00e8s limit\u00e9 pour fournir la r\u00e9ponse attendue. \u00c0 long terme, nous exposerons les phrases g\u00e9n\u00e9r\u00e9es apr\u00e8s avoir assur\u00e9 l\u2019int\u00e9grit\u00e9 de bout en bout de notre mod\u00e8le.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Un autre probl\u00e8me que rencontrent \u00e9<\/span><span style=\"font-weight: 400\">galement d\u2019autres types de syst\u00e8mes de traitement automatique du langage naturel est ce qu\u2019on appelle\u00a0 l\u2019hallucination, c\u2019est-\u00e0-dire lorsqu\u2019un mod\u00e8le transmet des informations incorrectes avec assurance. Un v\u00e9ritable d\u00e9fi pour les techniques de bout en bout, car les mod\u00e8les peuvent \u00eatre incit\u00e9s \u00e0 introduire ou \u00e0 m<\/span><span style=\"font-weight: 400\">odifier des entit\u00e9s dans le dialogue en fonction des donn\u00e9es d\u2019entra\u00eenement. Par exemple, si vous demandez \u00e0 votre assistant virtuel de vous rappeler d\u2019appeler Monica, il pourrait configurer un rappel pour appeler Monique, car Monica est un pr\u00e9nom moins courant. Nous avons utilis\u00e9 plusieurs<\/span><a href=\"https:\/\/arxiv.org\/abs\/2110.11205\"> <span style=\"font-weight: 400\">techniques d\u2019augmentation des donn\u00e9es<\/span><\/a><span style=\"font-weight: 400\"> et r\u00e9seaux d\u2019attention pour renforcer le projet CAIRaoke, en tirant parti de ce que nous avons appris de BlenderBot 2.0 pour<\/span><a href=\"https:\/\/ai.facebook.com\/blog\/blender-bot-2-an-open-source-chatbot-that-builds-long-term-memory-and-searches-the-internet\/\"> <span style=\"font-weight: 400\">r\u00e9duire les hallucinations<\/span><\/a><span style=\"font-weight: 400\">.\u00a0<\/span><\/p>\n<p><strong>Utiliser la voix pour de nombreuses t\u00e2ches quotidiennes<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Bien que notre mise en \u0153uvre \u00e0 court terme du mod\u00e8le du projet CAIRaoke s\u2019applique aux rappels sur Portal, nous esp\u00e9rons pouvoir bient\u00f4t l\u2019utiliser dans de nombreux autres domaines, notamment afin de personnaliser les exp\u00e9riences d\u2019achat, de permettre aux assistants virtuels de maintenir le contexte au fil des discussions et de donner au public le pouvoir d\u2019orienter la conversation.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Nous pensons \u00e9galement que cette innovation sera particuli\u00e8rement utile pour d\u00e9velopper des fonctionnalit\u00e9s de dialogue bas\u00e9es sur l\u2019IA pour la r\u00e9alit\u00e9 augment\u00e9e. Dans un avenir plus ou moins proche, les personnes utiliseront r\u00e9guli\u00e8rement l\u2019assistant vocal de leurs lunettes de r\u00e9alit\u00e9 augment\u00e9e, comme elles le font aujourd\u2019hui avec leurs enceintes intelligentes, leurs montres et d\u2019autres appareils. Nous nous effor\u00e7ons donc de r\u00e9duire la taille des mod\u00e8les de bout en bout comme celui-ci afin de les adapter \u00e0 l\u2019appareil, car ces mod\u00e8les int\u00e9gr\u00e9s offrent des avantages suppl\u00e9mentaires en mati\u00e8re de s\u00e9curit\u00e9, de confidentialit\u00e9 et de performance. Nous tra<\/span><span style=\"font-weight: 400\">vaillons \u00e9galement \u00e0 rendre le mod\u00e8le plus facile \u00e0 d\u00e9buguer, ce qui repr\u00e9sente un v\u00e9ritable d\u00e9fi, car dans ce nouveau cadre, les informations figurent dans l\u2019espace d\u2019int\u00e9gration, alors que dans le mod\u00e8le traditionnel, elles sont explicites. Pour concr\u00e9tiser notre vision du projet CAIRaoke, nous devons \u00e9galement l\u2019adapter <\/span><span style=\"font-weight: 400\">\u00e0 de nombreuses langues et trouver des moyens de rendre le mod\u00e8le efficace pour des milliards de personnes.<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-22875\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/y.png?w=890&#038;resize=680%2C463\" alt=\"\" width=\"680\" height=\"463\" srcset=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/y.png?w=1193 1193w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/y.png?w=588 588w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/y.png?w=300 300w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/y.png?w=768 768w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/y.png?w=1024 1024w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/y.png?w=800 800w\" sizes=\"auto, (max-width: 680px) 100vw, 680px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Dans quelques ann\u00e9es, la technologie du projet CAIRaoke pourra \u00eatre la base de l\u2019interaction nouvelle g\u00e9n\u00e9ration entre les personnes et les appareils. Sur des appareils tels que les casques de r\u00e9alit\u00e9 virtuelle et les lunettes de r\u00e9alit\u00e9 augment\u00e9e, nous nous attendons \u00e0 ce que ce type de communication devienne la principale m\u00e9thode de navigation et d\u2019interaction, tout comme les \u00e9crans tactiles ont remplac\u00e9 les claviers sur les smartphones. Notre mod\u00e8le actuel est une innovation importante, mais nous avons encore beaucoup de travail pour concr\u00e9tiser cette vision. Nous sommes tr\u00e8s enthousiastes devant les progr\u00e8s que nous avons r\u00e9alis\u00e9s jusqu\u2019\u00e0 pr\u00e9sent et avons h\u00e2te de relever tous les d\u00e9fis \u00e0 venir.\u00a0<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"Pouvoir interagir avec un assistant virtuel intelligent dans un langage naturel et conversationnel, de la m\u00eame mani\u00e8re que nous interagissons avec des personnes r\u00e9elles, nous faciliterait la vie de bien des mani\u00e8res. Seulement, les assistants virtuels d\u2019aujourd\u2019hui ne sont souvent pas \u00e0 la hauteur, que nous \u00e9changions \u00e0 l\u2019oral ou par \u00e9crit. Ils sont tr\u00e8s vite d\u00e9concert\u00e9s par des demandes du quotidien, telles que \u00ab Mets en sourdine toutes les notifications aujourd\u2019hui, sauf si c\u2019est ma m\u00e8re qui appelle \u00bb, ou encore \u00ab Est-ce que je peux louer la salle des f\u00eates pour organiser une soir\u00e9e ? \u00bb, sans parler de t\u00e2ches comme \u00ab Organise des vacances \u00e0 la plage pour notre famille pour le week-end du 4 juillet \u00e0 un prix raisonnable \u00bb. Il est donc grand temps d\u2019am\u00e9liorer l\u2019IA conversationnelle. Pour cela, nous avons le plaisir d\u2019annoncer le projet CAIRaoke, par le biais duquel nous avons d\u00e9velopp\u00e9 un mod\u00e8le de bout en bout bas\u00e9 sur un r\u00e9seau de neurones capable d\u2019alimenter des conversations beaucoup plus personnelles et contextuelles que les syst\u00e8mes utilis\u00e9s jusqu\u2019\u00e0 pr\u00e9sent. Nous utilisons d\u00e9j\u00e0 ce mod\u00e8le issu du projet CAIRaoke dans l\u2019un de nos produits, Portal, et nous visons \u00e0 l\u2019int\u00e9grer \u00e0 des dispositifs de r\u00e9alit\u00e9 augment\u00e9e et de r\u00e9alit\u00e9 virtuelle afin de permettre prochainement des interactions immersives et multimodales avec des assistants virtuels. Le plus grand obstacle \u00e0 une meilleure IA conversationnelle est, selon nous, l\u2019architecture sur laquelle se basent les assistants virtuels d\u2019aujourd\u2019hui, m\u00eame les plus avanc\u00e9s. En effet, bien que ces syst\u00e8mes fournissent un service unique, ils reposent, en r\u00e9alit\u00e9, sur quatre composants distincts : la compr\u00e9hension du langage naturel (natural language understanding, NLU), le suivi de l\u2019\u00e9tat du dialogue (dialog state tracking, DST), la gestion des politiques de dialogue (dialog policy, DP) et la g\u00e9n\u00e9ration de langage naturel (natural language generation, NLG). Ces syst\u00e8mes d\u2019IA distincts doivent ensuite \u00eatre reli\u00e9s entre eux. Cela les rend difficiles \u00e0 optimiser, peu adaptables \u00e0 des t\u00e2ches nouvelles ou inconnues et tr\u00e8s d\u00e9pendants d\u2019ensembles de donn\u00e9es \u00e9tiquet\u00e9s qui requi\u00e8rent beaucoup de travail. C\u2019est l\u2019une des raisons pour lesquelles aujourd\u2019hui, les assistants virtuels qui alimentent la plupart des appareils, proposent des options limit\u00e9es, oublient le contexte de la conversation et suivent principalement des dialogues pr\u00e9d\u00e9finis. Par exemple, si, apr\u00e8s avoir demand\u00e9 la m\u00e9t\u00e9o du jour \u00e0 votre assistant virtuel, vous lui demandez quelque chose de simple mais d\u2019inattendu, comme \u00ab Est-ce qu\u2019il fait plus chaud que la semaine derni\u00e8re ? \u00bb, celui-ci sera compl\u00e8tement perdu. Les mod\u00e8les cr\u00e9\u00e9s dans le cadre du projet CAIRaoke vous permettront de discuter avec vos assistants conversationnels de fa\u00e7on totalement naturelle. Vous pourrez ainsi vous r\u00e9f\u00e9rer \u00e0 quelque chose qui a \u00e9t\u00e9 dit plus t\u00f4t dans la conversation, changer compl\u00e8tement de sujet ou parler de choses qui d\u00e9pendent d\u2019un contexte complexe et nuanc\u00e9. Vous pourrez \u00e9galement interagir avec eux de diff\u00e9rentes mani\u00e8res, par exemple \u00e0 l\u2019aide de gestes. Nous avons commenc\u00e9 \u00e0 utiliser ce mod\u00e8le sur Portal, l\u2019appareil d\u2019appels vid\u00e9o de Meta, afin de faciliter la cr\u00e9ation et la gestion des rappels. Par exemple, vous pouvez rapidement clarifier une demande comme celle-ci sans avoir \u00e0 vous r\u00e9p\u00e9ter : \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \ud83d\udc69\u200d : D\u00e9finis un rappel pour 6h30. \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0: Le matin ou le soir ? \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \ud83d\udc69\u200d : Le soir, et intitule-le \u00ab acheter des \u0153ufs \u00bb \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0: D\u2019accord, un rappel pour acheter des \u0153ufs a \u00e9t\u00e9 d\u00e9fini pour 18h30 demain. M\u00eame s\u2019il ne s\u2019agit que du premier test, nous avons des raisons de croire que ce mod\u00e8le est bien plus efficace que les approches standard. Sur Portal, en comparant notre approche classique \u00e0 notre nouvelle approche, nous avons observ\u00e9 une am\u00e9lioration importante de l\u2019\u00e9valuation des rappels. Cette am\u00e9lioration est mesur\u00e9e par le taux de r\u00e9ussite de la r\u00e9alisation d\u2019un ensemble d\u2019objectifs de rappels, tout en maintenant le m\u00eame nombre de tours. Mais il ne s\u2019agit que de la premi\u00e8re \u00e9tape pour tirer pleinement parti de cette nouvelle technologie. Nous pensons que les progr\u00e8s r\u00e9alis\u00e9s gr\u00e2ce au projet CAIRaoke permettront une communication plus riche entre les personnes et l\u2019IA. Ce sera un outil essentiel pour le d\u00e9veloppement du m\u00e9tavers. Un jour, un assistant aliment\u00e9 par le projet CAIRaoke pourra \u00eatre int\u00e9gr\u00e9 \u00e0 des lunettes de r\u00e9alit\u00e9 augment\u00e9e et remplir de nouvelles fonctions tr\u00e8s utiles. Et si par exemple, vous lui demandiez : \u00ab Qu\u2019est-ce qui va avec ce pantalon ? \u00bb, il vous r\u00e9pondrait : \u00ab Voici un T-shirt dans votre couleur pr\u00e9f\u00e9r\u00e9e, le rouge \u00bb et vous montrerait la photo d\u2019un article qu\u2019il a trouv\u00e9 pour vous. Et si vous lui disiez : \u00ab Je l\u2019aime bien, mais les rayures sont trop larges \u00bb, il vous montrerait un mod\u00e8le \u00e0 rayures fines \u00e0 la place. \u00c0 l\u2019avenir, nous esp\u00e9rons que des millions de personnes dans le monde pourront tirer parti des mod\u00e8les issus de ce projet dans des situations du quotidien comme celle d\u00e9crite ci-dessus. D\u00e9velopper une IA conversationnelle vraiment interactive Pour faire progresser l\u2019IA conversationnelle, il est important de comprendre toute l\u2019\u00e9tendue du probl\u00e8me. De nombreuses personnes pensent qu\u2019avec les innovations r\u00e9centes en compr\u00e9hension du langage naturel, comme BART et GPT-3, le d\u00e9fi de comprendre et de g\u00e9n\u00e9rer un texte humain a \u00e9t\u00e9 surmont\u00e9. Nous n\u2019en sommes pas encore l\u00e0 : analysons s\u00e9par\u00e9ment, par exemple, l\u2019IA pour la compr\u00e9hension et l\u2019IA pour l\u2019interaction. L\u2019IA pour la compr\u00e9hension a \u00e9t\u00e9 largement \u00e9tudi\u00e9e et d\u00e9velopp\u00e9e dans l\u2019ensemble du secteur. Elle est utilis\u00e9e pour extraire le sens de plusieurs modalit\u00e9s d\u2019entr\u00e9e, comme la reconnaissance automatique de la parole, la classification des images et la compr\u00e9hension du langage naturel. L\u2019IA pour l\u2019interaction, quant \u00e0 elle, repose sur la fa\u00e7on dont nous utilisons notre compr\u00e9hension du monde pour interagir avec d\u2019autres personnes \u00e0 l\u2019aide de la technologie. Il peut s\u2019agir de l\u2019envoi d\u2019un SMS, d\u2019une commande vocale, d\u2019un retour haptique, de l\u2019affichage d\u2019une image, d\u2019une vid\u00e9o, d\u2019un avatar ou d\u2019une combinaison de tout cela.\u00a0 Les \u00e9quipes de recherche et d\u2019ing\u00e9nierie du secteur s\u2019accordent \u00e0 dire que pour \u00eatre efficaces, les syst\u00e8mes conversationnels doivent disposer d\u2019une base de compr\u00e9hension solide aliment\u00e9e par des mod\u00e8les d\u2019IA. Mais beaucoup pensent que l\u2019interaction est un probl\u00e8me d\u2019ing\u00e9nierie plut\u00f4t qu\u2019un probl\u00e8me d\u2019IA. Par cons\u00e9quent, un sp\u00e9cialiste en ing\u00e9nierie qui conna\u00eet l\u2019\u00e9tat du monde peut cr\u00e9er une logique complexe pour g\u00e9rer l\u2019interaction requise. L\u2019approche d\u2019ing\u00e9nierie permet de comprendre facilement le fonctionnement du syst\u00e8me et de d\u00e9buguer rapidement la logique si n\u00e9cessaire. Mais cela engendre une IA conversationnelle moins puissante, l\u2019une des principales raisons pour lesquelles votre assistant virtuel ne vous permet pas de planifier vos vacances facilement, par exemple. Une nouvelle approche unifi\u00e9e\u00a0 Dans ces exemples de dialogues, nous mettons en avant les principales comp\u00e9tences que nous voulons donner aux assistants : fournir des connaissances pr\u00e9cises et \u00e0 jour sur le monde r\u00e9el et travailler de fa\u00e7on multimodale (dans ce cas, \u00e0 travers la vision et la parole), dans plusieurs domaines (envoyer un message ou estimer votre heure d\u2019arriv\u00e9e) et en vous permettant d\u2019orienter la conversation plut\u00f4t que de devoir suivre un mod\u00e8le de conversation rigide. L\u2019approche traditionnelle concernant les assistants virtuels intelligents n\u00e9cessite quatre ensembles d\u2019entr\u00e9es et de sorties, un par composant (compr\u00e9hension du langage naturel, suivi de l\u2019\u00e9tat du dialogue, gestion des politiques de dialogue et g\u00e9n\u00e9ration de langage naturel). Et des normes doivent \u00eatre d\u00e9finies pour les entr\u00e9es et les sorties de chaque composant. Par exemple, pour la compr\u00e9hension du langage naturel, un syst\u00e8me d\u2019IA conversationnel traditionnel n\u00e9cessite des ontologies d\u00e9finies (par exemple, plusieurs intentions et entit\u00e9s). Le mod\u00e8le du projet CAIRaoke utilise, lui, un r\u00e9seau de neurones, et n\u2019impose aucun flux conversationnel. En utilisant ce mod\u00e8le, nous n\u2019avons donc besoin que d\u2019un seul ensemble de donn\u00e9es d\u2019entra\u00eenement.\u00a0 Le projet CAIRaoke r\u00e9duit les efforts requis pour ajouter un nouveau domaine. Dans l\u2019ancienne approche, le d\u00e9veloppement d\u2019un nouveau domaine oblige \u00e0 cr\u00e9er et \u00e0 corriger chaque module un par un avant de pouvoir entra\u00eener le suivant de mani\u00e8re fiable. En d\u2019autres termes, l\u2019entra\u00eenement aux politiques de dialogue ne peut pas \u00eatre effectu\u00e9 efficacement si la compr\u00e9hension du langage naturel et le suivi de l\u2019\u00e9tat du dialogue changent constamment. Des changements au niveau d\u2019un composant peuvent perturber les autres, ce qui obligerait \u00e0 entra\u00eener \u00e0 nouveau tous les modules suivants. Cette interd\u00e9pendance ralentit la progression dans les modules suivants. Notre technique de bout en bout supprime cette d\u00e9pendance aux modules pr\u00e9c\u00e9dents, ce qui acc\u00e9l\u00e8re la vitesse de d\u00e9veloppement et d\u2019entra\u00eenement et nous permet d\u2019affiner d\u2019autres mod\u00e8les en utilisant moins d\u2019efforts et de donn\u00e9es. Dans notre nouvelle approche, les dialogues sont beaucoup plus puissants, car ils sont capables de prendre des d\u00e9cisions en analysant toutes les informations disponibles en un seul et m\u00eame endroit. Auparavant, m\u00eame une petite erreur au niveau de l\u2019un des composants pouvait se propager \u00e0 d\u2019autres composants de mani\u00e8re inattendue, et ce probl\u00e8me \u00e9tait difficile \u00e0 r\u00e9soudre. Par exemple, les assistants virtuels actuels bas\u00e9s sur des r\u00e8gles sont explicitement programm\u00e9s pour rechercher des mots ou des phrases sp\u00e9cifiques (comme \u00ab apr\u00e8s-midi \u00bb), alors que le projet CAIRaoke tire parti de mod\u00e8les de langage pr\u00e9-entra\u00een\u00e9s avanc\u00e9s qui comprennent mieux le contexte et peuvent reconna\u00eetre diff\u00e9rentes fa\u00e7ons de dire la m\u00eame chose.\u00a0\u00a0 Enfin, le projet CAIRaoke allie la technologie qui sous-tend le bot conversationnel le plus r\u00e9cent de Meta, BlenderBot 2.0, \u00e0 des dialogues ax\u00e9s sur les t\u00e2ches. Les assistants virtuels d\u00e9velopp\u00e9s \u00e0 l\u2019aide de notre mod\u00e8le pourraient donc utiliser un langage empathique, transmettre des informations trouv\u00e9es sur Internet en temps r\u00e9el et avoir une personnalit\u00e9 coh\u00e9rente. Lorsque les syst\u00e8mes g\u00e9n\u00e8rent un langage naturel, il est essentiel de tenir compte des d\u00e9fis potentiels en mati\u00e8re de s\u00e9curit\u00e9 et de confidentialit\u00e9. La plupart des syst\u00e8mes de g\u00e9n\u00e9ration de langage naturel d\u2019aujourd\u2019hui sont pr\u00e9d\u00e9finis, afin que les \u00e9quipes charg\u00e9es de la mod\u00e9ration du contenu puissent s\u2019assurer que les assistants virtuels ne r\u00e9pondent pas de fa\u00e7on ind\u00e9sirable. Mais lorsque l\u2019assistant virtuel est en contact direct avec une personne r\u00e9elle, il existe un risque d\u2019erreurs et d\u2019interactions potentiellement blessantes, comme cela a d\u00e9j\u00e0 pu \u00eatre constat\u00e9 par le pass\u00e9.\u00a0 Notez que nous avons int\u00e9gr\u00e9 des protections \u00e0 BlenderBot afin de r\u00e9duire ces cas de r\u00e9ponses blessantes. Nous tenons \u00e9galement compte de la confidentialit\u00e9 lors de la conception de ces technologies. Par exemple, avec les Ray-Ban Stories et Portal, l\u2019utilisation des commandes vocales est facultative, vous pouvez donc afficher et supprimer les transcriptions de vos commandes vocales, et vous avez toujours la possibilit\u00e9 de d\u00e9sactiver leur stockage.\u00a0 Pour att\u00e9nuer le risque de r\u00e9ponses ind\u00e9sirables, la premi\u00e8re \u00e9tape du projet CAIRaoke \u00e9tait de g\u00e9n\u00e9rer \u00e0 la fois des actions de dialogue et un langage naturel. \u00c0 court terme, nous g\u00e9n\u00e9rons des actions de dialogue et nous nous appuyons sur un syst\u00e8me de g\u00e9n\u00e9ration de langage naturel test\u00e9 et tr\u00e8s limit\u00e9 pour fournir la r\u00e9ponse attendue. \u00c0 long terme, nous exposerons les phrases g\u00e9n\u00e9r\u00e9es apr\u00e8s avoir assur\u00e9 l\u2019int\u00e9grit\u00e9 de bout en bout de notre mod\u00e8le. Un autre probl\u00e8me que rencontrent \u00e9galement d\u2019autres types de syst\u00e8mes de traitement automatique du langage naturel est ce qu\u2019on appelle\u00a0 l\u2019hallucination, c\u2019est-\u00e0-dire lorsqu\u2019un mod\u00e8le transmet des informations incorrectes avec assurance. Un v\u00e9ritable d\u00e9fi pour les techniques de bout en bout, car les mod\u00e8les peuvent \u00eatre incit\u00e9s \u00e0 introduire ou \u00e0 modifier des entit\u00e9s dans le dialogue en fonction des donn\u00e9es d\u2019entra\u00eenement. Par exemple, si vous demandez \u00e0 votre assistant virtuel de vous rappeler d\u2019appeler Monica, il pourrait configurer un rappel pour appeler Monique, car Monica est un pr\u00e9nom moins courant. Nous avons utilis\u00e9 plusieurs techniques d\u2019augmentation des donn\u00e9es et r\u00e9seaux d\u2019attention pour renforcer le projet CAIRaoke, en tirant parti de ce que nous avons appris de BlenderBot 2.0 pour r\u00e9duire les hallucinations.\u00a0 Utiliser la voix pour de nombreuses t\u00e2ches quotidiennes Bien que notre mise en \u0153uvre \u00e0 court terme du mod\u00e8le du projet CAIRaoke s\u2019applique aux rappels sur Portal, nous esp\u00e9rons pouvoir bient\u00f4t l\u2019utiliser dans de nombreux autres domaines, notamment afin de personnaliser les exp\u00e9riences d\u2019achat, de permettre aux assistants virtuels de maintenir le contexte au fil des discussions et de donner au public le pouvoir d\u2019orienter la conversation.\u00a0 Nous pensons \u00e9galement que cette innovation sera particuli\u00e8rement utile pour d\u00e9velopper des fonctionnalit\u00e9s de dialogue bas\u00e9es sur l\u2019IA pour la r\u00e9alit\u00e9 augment\u00e9e. Dans un avenir plus ou moins proche, les personnes utiliseront r\u00e9guli\u00e8rement l\u2019assistant vocal de leurs lunettes de r\u00e9alit\u00e9 augment\u00e9e, comme elles le font aujourd\u2019hui avec leurs enceintes intelligentes, leurs montres et d\u2019autres appareils. Nous nous effor\u00e7ons donc de r\u00e9duire la taille des mod\u00e8les de bout en bout comme celui-ci afin de les adapter \u00e0 l\u2019appareil, car ces mod\u00e8les int\u00e9gr\u00e9s offrent des avantages suppl\u00e9mentaires en mati\u00e8re de s\u00e9curit\u00e9, de confidentialit\u00e9 et de performance. Nous travaillons \u00e9galement \u00e0 rendre le mod\u00e8le plus facile \u00e0 d\u00e9buguer, ce qui repr\u00e9sente un v\u00e9ritable d\u00e9fi, car dans ce nouveau cadre, les informations figurent dans l\u2019espace d\u2019int\u00e9gration, alors que dans le mod\u00e8le traditionnel, elles sont explicites. Pour concr\u00e9tiser notre vision du projet CAIRaoke, nous devons \u00e9galement l\u2019adapter \u00e0 de nombreuses langues et trouver des moyens de rendre le mod\u00e8le efficace pour des milliards de personnes. Dans quelques ann\u00e9es, la technologie du projet CAIRaoke pourra \u00eatre la base de l\u2019interaction nouvelle g\u00e9n\u00e9ration entre les personnes et les appareils. Sur des appareils tels que les casques de r\u00e9alit\u00e9 virtuelle et les lunettes de r\u00e9alit\u00e9 augment\u00e9e, nous nous attendons \u00e0 ce que ce type de communication devienne la principale m\u00e9thode de navigation et d\u2019interaction, tout comme les \u00e9crans tactiles ont remplac\u00e9 les claviers sur les smartphones. Notre mod\u00e8le actuel est une innovation importante, mais nous avons encore beaucoup de travail pour concr\u00e9tiser cette vision. Nous sommes tr\u00e8s enthousiastes devant les progr\u00e8s que nous avons r\u00e9alis\u00e9s jusqu\u2019\u00e0 pr\u00e9sent et avons h\u00e2te de relever tous les d\u00e9fis \u00e0 venir.\u00a0","protected":false},"author":164097090,"featured_media":22871,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[243897990,243897944,243897985,243897952],"tags":[243898205,243898212,134004,243898206,243898211,243898213,243898209,243898210],"class_list":["post-22856","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualites","category-intelligence-artificielle","category-meta","category-realite-augmentee-et-realite-virtuelle","tag-assistants-virtuels","tag-cairaoke","tag-intelligence-artificielle","tag-langages","tag-portal","tag-systemes-dia","tag-technologie","tag-voix"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.2 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle | \u00c0 propos de Meta<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle | \u00c0 propos de Meta\" \/>\n<meta property=\"og:description\" content=\"Pouvoir interagir avec un assistant virtuel intelligent dans un langage naturel et conversationnel, de la m\u00eame mani\u00e8re que nous interagissons avec des personnes r\u00e9elles, nous faciliterait la vie de bien des mani\u00e8res. Seulement, les assistants virtuels d\u2019aujourd\u2019hui ne sont souvent pas \u00e0 la hauteur, que nous \u00e9changions \u00e0 l\u2019oral ou par \u00e9crit. Ils sont tr\u00e8s vite d\u00e9concert\u00e9s par des demandes du quotidien, telles que \u00ab Mets en sourdine toutes les notifications aujourd\u2019hui, sauf si c\u2019est ma m\u00e8re qui appelle \u00bb, ou encore \u00ab Est-ce que je peux louer la salle des f\u00eates pour organiser une soir\u00e9e ? \u00bb, sans parler de t\u00e2ches comme \u00ab Organise des vacances \u00e0 la plage pour notre famille pour le week-end du 4 juillet \u00e0 un prix raisonnable \u00bb. Il est donc grand temps d\u2019am\u00e9liorer l\u2019IA conversationnelle. Pour cela, nous avons le plaisir d\u2019annoncer le projet CAIRaoke, par le biais duquel nous avons d\u00e9velopp\u00e9 un mod\u00e8le de bout en bout bas\u00e9 sur un r\u00e9seau de neurones capable d\u2019alimenter des conversations beaucoup plus personnelles et contextuelles que les syst\u00e8mes utilis\u00e9s jusqu\u2019\u00e0 pr\u00e9sent. Nous utilisons d\u00e9j\u00e0 ce mod\u00e8le issu du projet CAIRaoke dans l\u2019un de nos produits, Portal, et nous visons \u00e0 l\u2019int\u00e9grer \u00e0 des dispositifs de r\u00e9alit\u00e9 augment\u00e9e et de r\u00e9alit\u00e9 virtuelle afin de permettre prochainement des interactions immersives et multimodales avec des assistants virtuels. Le plus grand obstacle \u00e0 une meilleure IA conversationnelle est, selon nous, l\u2019architecture sur laquelle se basent les assistants virtuels d\u2019aujourd\u2019hui, m\u00eame les plus avanc\u00e9s. En effet, bien que ces syst\u00e8mes fournissent un service unique, ils reposent, en r\u00e9alit\u00e9, sur quatre composants distincts : la compr\u00e9hension du langage naturel (natural language understanding, NLU), le suivi de l\u2019\u00e9tat du dialogue (dialog state tracking, DST), la gestion des politiques de dialogue (dialog policy, DP) et la g\u00e9n\u00e9ration de langage naturel (natural language generation, NLG). Ces syst\u00e8mes d\u2019IA distincts doivent ensuite \u00eatre reli\u00e9s entre eux. Cela les rend difficiles \u00e0 optimiser, peu adaptables \u00e0 des t\u00e2ches nouvelles ou inconnues et tr\u00e8s d\u00e9pendants d\u2019ensembles de donn\u00e9es \u00e9tiquet\u00e9s qui requi\u00e8rent beaucoup de travail. C\u2019est l\u2019une des raisons pour lesquelles aujourd\u2019hui, les assistants virtuels qui alimentent la plupart des appareils, proposent des options limit\u00e9es, oublient le contexte de la conversation et suivent principalement des dialogues pr\u00e9d\u00e9finis. Par exemple, si, apr\u00e8s avoir demand\u00e9 la m\u00e9t\u00e9o du jour \u00e0 votre assistant virtuel, vous lui demandez quelque chose de simple mais d\u2019inattendu, comme \u00ab Est-ce qu\u2019il fait plus chaud que la semaine derni\u00e8re ? \u00bb, celui-ci sera compl\u00e8tement perdu. Les mod\u00e8les cr\u00e9\u00e9s dans le cadre du projet CAIRaoke vous permettront de discuter avec vos assistants conversationnels de fa\u00e7on totalement naturelle. Vous pourrez ainsi vous r\u00e9f\u00e9rer \u00e0 quelque chose qui a \u00e9t\u00e9 dit plus t\u00f4t dans la conversation, changer compl\u00e8tement de sujet ou parler de choses qui d\u00e9pendent d\u2019un contexte complexe et nuanc\u00e9. Vous pourrez \u00e9galement interagir avec eux de diff\u00e9rentes mani\u00e8res, par exemple \u00e0 l\u2019aide de gestes. Nous avons commenc\u00e9 \u00e0 utiliser ce mod\u00e8le sur Portal, l\u2019appareil d\u2019appels vid\u00e9o de Meta, afin de faciliter la cr\u00e9ation et la gestion des rappels. Par exemple, vous pouvez rapidement clarifier une demande comme celle-ci sans avoir \u00e0 vous r\u00e9p\u00e9ter : \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \ud83d\udc69\u200d : D\u00e9finis un rappel pour 6h30. \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0: Le matin ou le soir ? \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \ud83d\udc69\u200d : Le soir, et intitule-le \u00ab acheter des \u0153ufs \u00bb \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0: D\u2019accord, un rappel pour acheter des \u0153ufs a \u00e9t\u00e9 d\u00e9fini pour 18h30 demain. M\u00eame s\u2019il ne s\u2019agit que du premier test, nous avons des raisons de croire que ce mod\u00e8le est bien plus efficace que les approches standard. Sur Portal, en comparant notre approche classique \u00e0 notre nouvelle approche, nous avons observ\u00e9 une am\u00e9lioration importante de l\u2019\u00e9valuation des rappels. Cette am\u00e9lioration est mesur\u00e9e par le taux de r\u00e9ussite de la r\u00e9alisation d\u2019un ensemble d\u2019objectifs de rappels, tout en maintenant le m\u00eame nombre de tours. Mais il ne s\u2019agit que de la premi\u00e8re \u00e9tape pour tirer pleinement parti de cette nouvelle technologie. Nous pensons que les progr\u00e8s r\u00e9alis\u00e9s gr\u00e2ce au projet CAIRaoke permettront une communication plus riche entre les personnes et l\u2019IA. Ce sera un outil essentiel pour le d\u00e9veloppement du m\u00e9tavers. Un jour, un assistant aliment\u00e9 par le projet CAIRaoke pourra \u00eatre int\u00e9gr\u00e9 \u00e0 des lunettes de r\u00e9alit\u00e9 augment\u00e9e et remplir de nouvelles fonctions tr\u00e8s utiles. Et si par exemple, vous lui demandiez : \u00ab Qu\u2019est-ce qui va avec ce pantalon ? \u00bb, il vous r\u00e9pondrait : \u00ab Voici un T-shirt dans votre couleur pr\u00e9f\u00e9r\u00e9e, le rouge \u00bb et vous montrerait la photo d\u2019un article qu\u2019il a trouv\u00e9 pour vous. Et si vous lui disiez : \u00ab Je l\u2019aime bien, mais les rayures sont trop larges \u00bb, il vous montrerait un mod\u00e8le \u00e0 rayures fines \u00e0 la place. \u00c0 l\u2019avenir, nous esp\u00e9rons que des millions de personnes dans le monde pourront tirer parti des mod\u00e8les issus de ce projet dans des situations du quotidien comme celle d\u00e9crite ci-dessus. D\u00e9velopper une IA conversationnelle vraiment interactive Pour faire progresser l\u2019IA conversationnelle, il est important de comprendre toute l\u2019\u00e9tendue du probl\u00e8me. De nombreuses personnes pensent qu\u2019avec les innovations r\u00e9centes en compr\u00e9hension du langage naturel, comme BART et GPT-3, le d\u00e9fi de comprendre et de g\u00e9n\u00e9rer un texte humain a \u00e9t\u00e9 surmont\u00e9. Nous n\u2019en sommes pas encore l\u00e0 : analysons s\u00e9par\u00e9ment, par exemple, l\u2019IA pour la compr\u00e9hension et l\u2019IA pour l\u2019interaction. L\u2019IA pour la compr\u00e9hension a \u00e9t\u00e9 largement \u00e9tudi\u00e9e et d\u00e9velopp\u00e9e dans l\u2019ensemble du secteur. Elle est utilis\u00e9e pour extraire le sens de plusieurs modalit\u00e9s d\u2019entr\u00e9e, comme la reconnaissance automatique de la parole, la classification des images et la compr\u00e9hension du langage naturel. L\u2019IA pour l\u2019interaction, quant \u00e0 elle, repose sur la fa\u00e7on dont nous utilisons notre compr\u00e9hension du monde pour interagir avec d\u2019autres personnes \u00e0 l\u2019aide de la technologie. Il peut s\u2019agir de l\u2019envoi d\u2019un SMS, d\u2019une commande vocale, d\u2019un retour haptique, de l\u2019affichage d\u2019une image, d\u2019une vid\u00e9o, d\u2019un avatar ou d\u2019une combinaison de tout cela.\u00a0 Les \u00e9quipes de recherche et d\u2019ing\u00e9nierie du secteur s\u2019accordent \u00e0 dire que pour \u00eatre efficaces, les syst\u00e8mes conversationnels doivent disposer d\u2019une base de compr\u00e9hension solide aliment\u00e9e par des mod\u00e8les d\u2019IA. Mais beaucoup pensent que l\u2019interaction est un probl\u00e8me d\u2019ing\u00e9nierie plut\u00f4t qu\u2019un probl\u00e8me d\u2019IA. Par cons\u00e9quent, un sp\u00e9cialiste en ing\u00e9nierie qui conna\u00eet l\u2019\u00e9tat du monde peut cr\u00e9er une logique complexe pour g\u00e9rer l\u2019interaction requise. L\u2019approche d\u2019ing\u00e9nierie permet de comprendre facilement le fonctionnement du syst\u00e8me et de d\u00e9buguer rapidement la logique si n\u00e9cessaire. Mais cela engendre une IA conversationnelle moins puissante, l\u2019une des principales raisons pour lesquelles votre assistant virtuel ne vous permet pas de planifier vos vacances facilement, par exemple. Une nouvelle approche unifi\u00e9e\u00a0 Dans ces exemples de dialogues, nous mettons en avant les principales comp\u00e9tences que nous voulons donner aux assistants : fournir des connaissances pr\u00e9cises et \u00e0 jour sur le monde r\u00e9el et travailler de fa\u00e7on multimodale (dans ce cas, \u00e0 travers la vision et la parole), dans plusieurs domaines (envoyer un message ou estimer votre heure d\u2019arriv\u00e9e) et en vous permettant d\u2019orienter la conversation plut\u00f4t que de devoir suivre un mod\u00e8le de conversation rigide. L\u2019approche traditionnelle concernant les assistants virtuels intelligents n\u00e9cessite quatre ensembles d\u2019entr\u00e9es et de sorties, un par composant (compr\u00e9hension du langage naturel, suivi de l\u2019\u00e9tat du dialogue, gestion des politiques de dialogue et g\u00e9n\u00e9ration de langage naturel). Et des normes doivent \u00eatre d\u00e9finies pour les entr\u00e9es et les sorties de chaque composant. Par exemple, pour la compr\u00e9hension du langage naturel, un syst\u00e8me d\u2019IA conversationnel traditionnel n\u00e9cessite des ontologies d\u00e9finies (par exemple, plusieurs intentions et entit\u00e9s). Le mod\u00e8le du projet CAIRaoke utilise, lui, un r\u00e9seau de neurones, et n\u2019impose aucun flux conversationnel. En utilisant ce mod\u00e8le, nous n\u2019avons donc besoin que d\u2019un seul ensemble de donn\u00e9es d\u2019entra\u00eenement.\u00a0 Le projet CAIRaoke r\u00e9duit les efforts requis pour ajouter un nouveau domaine. Dans l\u2019ancienne approche, le d\u00e9veloppement d\u2019un nouveau domaine oblige \u00e0 cr\u00e9er et \u00e0 corriger chaque module un par un avant de pouvoir entra\u00eener le suivant de mani\u00e8re fiable. En d\u2019autres termes, l\u2019entra\u00eenement aux politiques de dialogue ne peut pas \u00eatre effectu\u00e9 efficacement si la compr\u00e9hension du langage naturel et le suivi de l\u2019\u00e9tat du dialogue changent constamment. Des changements au niveau d\u2019un composant peuvent perturber les autres, ce qui obligerait \u00e0 entra\u00eener \u00e0 nouveau tous les modules suivants. Cette interd\u00e9pendance ralentit la progression dans les modules suivants. Notre technique de bout en bout supprime cette d\u00e9pendance aux modules pr\u00e9c\u00e9dents, ce qui acc\u00e9l\u00e8re la vitesse de d\u00e9veloppement et d\u2019entra\u00eenement et nous permet d\u2019affiner d\u2019autres mod\u00e8les en utilisant moins d\u2019efforts et de donn\u00e9es. Dans notre nouvelle approche, les dialogues sont beaucoup plus puissants, car ils sont capables de prendre des d\u00e9cisions en analysant toutes les informations disponibles en un seul et m\u00eame endroit. Auparavant, m\u00eame une petite erreur au niveau de l\u2019un des composants pouvait se propager \u00e0 d\u2019autres composants de mani\u00e8re inattendue, et ce probl\u00e8me \u00e9tait difficile \u00e0 r\u00e9soudre. Par exemple, les assistants virtuels actuels bas\u00e9s sur des r\u00e8gles sont explicitement programm\u00e9s pour rechercher des mots ou des phrases sp\u00e9cifiques (comme \u00ab apr\u00e8s-midi \u00bb), alors que le projet CAIRaoke tire parti de mod\u00e8les de langage pr\u00e9-entra\u00een\u00e9s avanc\u00e9s qui comprennent mieux le contexte et peuvent reconna\u00eetre diff\u00e9rentes fa\u00e7ons de dire la m\u00eame chose.\u00a0\u00a0 Enfin, le projet CAIRaoke allie la technologie qui sous-tend le bot conversationnel le plus r\u00e9cent de Meta, BlenderBot 2.0, \u00e0 des dialogues ax\u00e9s sur les t\u00e2ches. Les assistants virtuels d\u00e9velopp\u00e9s \u00e0 l\u2019aide de notre mod\u00e8le pourraient donc utiliser un langage empathique, transmettre des informations trouv\u00e9es sur Internet en temps r\u00e9el et avoir une personnalit\u00e9 coh\u00e9rente. Lorsque les syst\u00e8mes g\u00e9n\u00e8rent un langage naturel, il est essentiel de tenir compte des d\u00e9fis potentiels en mati\u00e8re de s\u00e9curit\u00e9 et de confidentialit\u00e9. La plupart des syst\u00e8mes de g\u00e9n\u00e9ration de langage naturel d\u2019aujourd\u2019hui sont pr\u00e9d\u00e9finis, afin que les \u00e9quipes charg\u00e9es de la mod\u00e9ration du contenu puissent s\u2019assurer que les assistants virtuels ne r\u00e9pondent pas de fa\u00e7on ind\u00e9sirable. Mais lorsque l\u2019assistant virtuel est en contact direct avec une personne r\u00e9elle, il existe un risque d\u2019erreurs et d\u2019interactions potentiellement blessantes, comme cela a d\u00e9j\u00e0 pu \u00eatre constat\u00e9 par le pass\u00e9.\u00a0 Notez que nous avons int\u00e9gr\u00e9 des protections \u00e0 BlenderBot afin de r\u00e9duire ces cas de r\u00e9ponses blessantes. Nous tenons \u00e9galement compte de la confidentialit\u00e9 lors de la conception de ces technologies. Par exemple, avec les Ray-Ban Stories et Portal, l\u2019utilisation des commandes vocales est facultative, vous pouvez donc afficher et supprimer les transcriptions de vos commandes vocales, et vous avez toujours la possibilit\u00e9 de d\u00e9sactiver leur stockage.\u00a0 Pour att\u00e9nuer le risque de r\u00e9ponses ind\u00e9sirables, la premi\u00e8re \u00e9tape du projet CAIRaoke \u00e9tait de g\u00e9n\u00e9rer \u00e0 la fois des actions de dialogue et un langage naturel. \u00c0 court terme, nous g\u00e9n\u00e9rons des actions de dialogue et nous nous appuyons sur un syst\u00e8me de g\u00e9n\u00e9ration de langage naturel test\u00e9 et tr\u00e8s limit\u00e9 pour fournir la r\u00e9ponse attendue. \u00c0 long terme, nous exposerons les phrases g\u00e9n\u00e9r\u00e9es apr\u00e8s avoir assur\u00e9 l\u2019int\u00e9grit\u00e9 de bout en bout de notre mod\u00e8le. Un autre probl\u00e8me que rencontrent \u00e9galement d\u2019autres types de syst\u00e8mes de traitement automatique du langage naturel est ce qu\u2019on appelle\u00a0 l\u2019hallucination, c\u2019est-\u00e0-dire lorsqu\u2019un mod\u00e8le transmet des informations incorrectes avec assurance. Un v\u00e9ritable d\u00e9fi pour les techniques de bout en bout, car les mod\u00e8les peuvent \u00eatre incit\u00e9s \u00e0 introduire ou \u00e0 modifier des entit\u00e9s dans le dialogue en fonction des donn\u00e9es d\u2019entra\u00eenement. Par exemple, si vous demandez \u00e0 votre assistant virtuel de vous rappeler d\u2019appeler Monica, il pourrait configurer un rappel pour appeler Monique, car Monica est un pr\u00e9nom moins courant. Nous avons utilis\u00e9 plusieurs techniques d\u2019augmentation des donn\u00e9es et r\u00e9seaux d\u2019attention pour renforcer le projet CAIRaoke, en tirant parti de ce que nous avons appris de BlenderBot 2.0 pour r\u00e9duire les hallucinations.\u00a0 Utiliser la voix pour de nombreuses t\u00e2ches quotidiennes Bien que notre mise en \u0153uvre \u00e0 court terme du mod\u00e8le du projet CAIRaoke s\u2019applique aux rappels sur Portal, nous esp\u00e9rons pouvoir bient\u00f4t l\u2019utiliser dans de nombreux autres domaines, notamment afin de personnaliser les exp\u00e9riences d\u2019achat, de permettre aux assistants virtuels de maintenir le contexte au fil des discussions et de donner au public le pouvoir d\u2019orienter la conversation.\u00a0 Nous pensons \u00e9galement que cette innovation sera particuli\u00e8rement utile pour d\u00e9velopper des fonctionnalit\u00e9s de dialogue bas\u00e9es sur l\u2019IA pour la r\u00e9alit\u00e9 augment\u00e9e. Dans un avenir plus ou moins proche, les personnes utiliseront r\u00e9guli\u00e8rement l\u2019assistant vocal de leurs lunettes de r\u00e9alit\u00e9 augment\u00e9e, comme elles le font aujourd\u2019hui avec leurs enceintes intelligentes, leurs montres et d\u2019autres appareils. Nous nous effor\u00e7ons donc de r\u00e9duire la taille des mod\u00e8les de bout en bout comme celui-ci afin de les adapter \u00e0 l\u2019appareil, car ces mod\u00e8les int\u00e9gr\u00e9s offrent des avantages suppl\u00e9mentaires en mati\u00e8re de s\u00e9curit\u00e9, de confidentialit\u00e9 et de performance. Nous travaillons \u00e9galement \u00e0 rendre le mod\u00e8le plus facile \u00e0 d\u00e9buguer, ce qui repr\u00e9sente un v\u00e9ritable d\u00e9fi, car dans ce nouveau cadre, les informations figurent dans l\u2019espace d\u2019int\u00e9gration, alors que dans le mod\u00e8le traditionnel, elles sont explicites. Pour concr\u00e9tiser notre vision du projet CAIRaoke, nous devons \u00e9galement l\u2019adapter \u00e0 de nombreuses langues et trouver des moyens de rendre le mod\u00e8le efficace pour des milliards de personnes. Dans quelques ann\u00e9es, la technologie du projet CAIRaoke pourra \u00eatre la base de l\u2019interaction nouvelle g\u00e9n\u00e9ration entre les personnes et les appareils. Sur des appareils tels que les casques de r\u00e9alit\u00e9 virtuelle et les lunettes de r\u00e9alit\u00e9 augment\u00e9e, nous nous attendons \u00e0 ce que ce type de communication devienne la principale m\u00e9thode de navigation et d\u2019interaction, tout comme les \u00e9crans tactiles ont remplac\u00e9 les claviers sur les smartphones. Notre mod\u00e8le actuel est une innovation importante, mais nous avons encore beaucoup de travail pour concr\u00e9tiser cette vision. Nous sommes tr\u00e8s enthousiastes devant les progr\u00e8s que nous avons r\u00e9alis\u00e9s jusqu\u2019\u00e0 pr\u00e9sent et avons h\u00e2te de relever tous les d\u00e9fis \u00e0 venir.\u00a0\" \/>\n<meta property=\"og:url\" content=\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/\" \/>\n<meta property=\"og:site_name\" content=\"\u00c0 propos de Meta\" \/>\n<meta property=\"article:published_time\" content=\"2022-02-23T19:30:38+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-02-24T07:18:01+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300\" \/>\n\t<meta property=\"og:image:width\" content=\"535\" \/>\n\t<meta property=\"og:image:height\" content=\"300\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"hopscotch\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@METAfrance\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Meta\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"11 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/\"},\"author\":\"Facebook company\",\"headline\":\"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle\",\"datePublished\":\"2022-02-23T19:30:38+00:00\",\"dateModified\":\"2022-02-24T07:18:01+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/\"},\"wordCount\":2616,\"publisher\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#organization\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300\",\"keywords\":[\"assistants virtuels\",\"CAIRaoke\",\"intelligence artificielle\",\"langages\",\"Portal\",\"syst\u00e8mes d'IA\",\"technologie\",\"voix\"],\"articleSection\":[\"Actualit\u00e9s\",\"Intelligence Artificielle\",\"Meta\",\"R\u00e9alit\u00e9 Augment\u00e9e et R\u00e9alit\u00e9 Virtuelle\"],\"inLanguage\":\"fr-FR\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/\",\"url\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/\",\"name\":\"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle | \u00c0 propos de Meta\",\"isPartOf\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300\",\"datePublished\":\"2022-02-23T19:30:38+00:00\",\"dateModified\":\"2022-02-24T07:18:01+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/\"]}],\"author\":\"\u00c0 propos de Meta\"},{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#primaryimage\",\"url\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300\",\"contentUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300\",\"width\":535,\"height\":300},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/about.fb.com\/fr\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/about.fb.com\/fr\/#website\",\"url\":\"https:\/\/about.fb.com\/news\/\",\"name\":\"\u00c0 propos de Meta\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/about.fb.com\/fr\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\",\"alternateName\":[\"Meta Newsroom\",\"Meta\"]},{\"@type\":\"Organization\",\"@id\":\"https:\/\/about.fb.com\/fr\/#organization\",\"name\":\"Meta\",\"url\":\"https:\/\/about.fb.com\/fr\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500\",\"contentUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500\",\"width\":8000,\"height\":4500,\"caption\":\"Meta\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/\"}}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle | \u00c0 propos de Meta","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/","og_locale":"fr_FR","og_type":"article","og_title":"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle | \u00c0 propos de Meta","og_description":"Pouvoir interagir avec un assistant virtuel intelligent dans un langage naturel et conversationnel, de la m\u00eame mani\u00e8re que nous interagissons avec des personnes r\u00e9elles, nous faciliterait la vie de bien des mani\u00e8res. Seulement, les assistants virtuels d\u2019aujourd\u2019hui ne sont souvent pas \u00e0 la hauteur, que nous \u00e9changions \u00e0 l\u2019oral ou par \u00e9crit. Ils sont tr\u00e8s vite d\u00e9concert\u00e9s par des demandes du quotidien, telles que \u00ab Mets en sourdine toutes les notifications aujourd\u2019hui, sauf si c\u2019est ma m\u00e8re qui appelle \u00bb, ou encore \u00ab Est-ce que je peux louer la salle des f\u00eates pour organiser une soir\u00e9e ? \u00bb, sans parler de t\u00e2ches comme \u00ab Organise des vacances \u00e0 la plage pour notre famille pour le week-end du 4 juillet \u00e0 un prix raisonnable \u00bb. Il est donc grand temps d\u2019am\u00e9liorer l\u2019IA conversationnelle. Pour cela, nous avons le plaisir d\u2019annoncer le projet CAIRaoke, par le biais duquel nous avons d\u00e9velopp\u00e9 un mod\u00e8le de bout en bout bas\u00e9 sur un r\u00e9seau de neurones capable d\u2019alimenter des conversations beaucoup plus personnelles et contextuelles que les syst\u00e8mes utilis\u00e9s jusqu\u2019\u00e0 pr\u00e9sent. Nous utilisons d\u00e9j\u00e0 ce mod\u00e8le issu du projet CAIRaoke dans l\u2019un de nos produits, Portal, et nous visons \u00e0 l\u2019int\u00e9grer \u00e0 des dispositifs de r\u00e9alit\u00e9 augment\u00e9e et de r\u00e9alit\u00e9 virtuelle afin de permettre prochainement des interactions immersives et multimodales avec des assistants virtuels. Le plus grand obstacle \u00e0 une meilleure IA conversationnelle est, selon nous, l\u2019architecture sur laquelle se basent les assistants virtuels d\u2019aujourd\u2019hui, m\u00eame les plus avanc\u00e9s. En effet, bien que ces syst\u00e8mes fournissent un service unique, ils reposent, en r\u00e9alit\u00e9, sur quatre composants distincts : la compr\u00e9hension du langage naturel (natural language understanding, NLU), le suivi de l\u2019\u00e9tat du dialogue (dialog state tracking, DST), la gestion des politiques de dialogue (dialog policy, DP) et la g\u00e9n\u00e9ration de langage naturel (natural language generation, NLG). Ces syst\u00e8mes d\u2019IA distincts doivent ensuite \u00eatre reli\u00e9s entre eux. Cela les rend difficiles \u00e0 optimiser, peu adaptables \u00e0 des t\u00e2ches nouvelles ou inconnues et tr\u00e8s d\u00e9pendants d\u2019ensembles de donn\u00e9es \u00e9tiquet\u00e9s qui requi\u00e8rent beaucoup de travail. C\u2019est l\u2019une des raisons pour lesquelles aujourd\u2019hui, les assistants virtuels qui alimentent la plupart des appareils, proposent des options limit\u00e9es, oublient le contexte de la conversation et suivent principalement des dialogues pr\u00e9d\u00e9finis. Par exemple, si, apr\u00e8s avoir demand\u00e9 la m\u00e9t\u00e9o du jour \u00e0 votre assistant virtuel, vous lui demandez quelque chose de simple mais d\u2019inattendu, comme \u00ab Est-ce qu\u2019il fait plus chaud que la semaine derni\u00e8re ? \u00bb, celui-ci sera compl\u00e8tement perdu. Les mod\u00e8les cr\u00e9\u00e9s dans le cadre du projet CAIRaoke vous permettront de discuter avec vos assistants conversationnels de fa\u00e7on totalement naturelle. Vous pourrez ainsi vous r\u00e9f\u00e9rer \u00e0 quelque chose qui a \u00e9t\u00e9 dit plus t\u00f4t dans la conversation, changer compl\u00e8tement de sujet ou parler de choses qui d\u00e9pendent d\u2019un contexte complexe et nuanc\u00e9. Vous pourrez \u00e9galement interagir avec eux de diff\u00e9rentes mani\u00e8res, par exemple \u00e0 l\u2019aide de gestes. Nous avons commenc\u00e9 \u00e0 utiliser ce mod\u00e8le sur Portal, l\u2019appareil d\u2019appels vid\u00e9o de Meta, afin de faciliter la cr\u00e9ation et la gestion des rappels. Par exemple, vous pouvez rapidement clarifier une demande comme celle-ci sans avoir \u00e0 vous r\u00e9p\u00e9ter : \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \ud83d\udc69\u200d : D\u00e9finis un rappel pour 6h30. \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0: Le matin ou le soir ? \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \ud83d\udc69\u200d : Le soir, et intitule-le \u00ab acheter des \u0153ufs \u00bb \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0: D\u2019accord, un rappel pour acheter des \u0153ufs a \u00e9t\u00e9 d\u00e9fini pour 18h30 demain. M\u00eame s\u2019il ne s\u2019agit que du premier test, nous avons des raisons de croire que ce mod\u00e8le est bien plus efficace que les approches standard. Sur Portal, en comparant notre approche classique \u00e0 notre nouvelle approche, nous avons observ\u00e9 une am\u00e9lioration importante de l\u2019\u00e9valuation des rappels. Cette am\u00e9lioration est mesur\u00e9e par le taux de r\u00e9ussite de la r\u00e9alisation d\u2019un ensemble d\u2019objectifs de rappels, tout en maintenant le m\u00eame nombre de tours. Mais il ne s\u2019agit que de la premi\u00e8re \u00e9tape pour tirer pleinement parti de cette nouvelle technologie. Nous pensons que les progr\u00e8s r\u00e9alis\u00e9s gr\u00e2ce au projet CAIRaoke permettront une communication plus riche entre les personnes et l\u2019IA. Ce sera un outil essentiel pour le d\u00e9veloppement du m\u00e9tavers. Un jour, un assistant aliment\u00e9 par le projet CAIRaoke pourra \u00eatre int\u00e9gr\u00e9 \u00e0 des lunettes de r\u00e9alit\u00e9 augment\u00e9e et remplir de nouvelles fonctions tr\u00e8s utiles. Et si par exemple, vous lui demandiez : \u00ab Qu\u2019est-ce qui va avec ce pantalon ? \u00bb, il vous r\u00e9pondrait : \u00ab Voici un T-shirt dans votre couleur pr\u00e9f\u00e9r\u00e9e, le rouge \u00bb et vous montrerait la photo d\u2019un article qu\u2019il a trouv\u00e9 pour vous. Et si vous lui disiez : \u00ab Je l\u2019aime bien, mais les rayures sont trop larges \u00bb, il vous montrerait un mod\u00e8le \u00e0 rayures fines \u00e0 la place. \u00c0 l\u2019avenir, nous esp\u00e9rons que des millions de personnes dans le monde pourront tirer parti des mod\u00e8les issus de ce projet dans des situations du quotidien comme celle d\u00e9crite ci-dessus. D\u00e9velopper une IA conversationnelle vraiment interactive Pour faire progresser l\u2019IA conversationnelle, il est important de comprendre toute l\u2019\u00e9tendue du probl\u00e8me. De nombreuses personnes pensent qu\u2019avec les innovations r\u00e9centes en compr\u00e9hension du langage naturel, comme BART et GPT-3, le d\u00e9fi de comprendre et de g\u00e9n\u00e9rer un texte humain a \u00e9t\u00e9 surmont\u00e9. Nous n\u2019en sommes pas encore l\u00e0 : analysons s\u00e9par\u00e9ment, par exemple, l\u2019IA pour la compr\u00e9hension et l\u2019IA pour l\u2019interaction. L\u2019IA pour la compr\u00e9hension a \u00e9t\u00e9 largement \u00e9tudi\u00e9e et d\u00e9velopp\u00e9e dans l\u2019ensemble du secteur. Elle est utilis\u00e9e pour extraire le sens de plusieurs modalit\u00e9s d\u2019entr\u00e9e, comme la reconnaissance automatique de la parole, la classification des images et la compr\u00e9hension du langage naturel. L\u2019IA pour l\u2019interaction, quant \u00e0 elle, repose sur la fa\u00e7on dont nous utilisons notre compr\u00e9hension du monde pour interagir avec d\u2019autres personnes \u00e0 l\u2019aide de la technologie. Il peut s\u2019agir de l\u2019envoi d\u2019un SMS, d\u2019une commande vocale, d\u2019un retour haptique, de l\u2019affichage d\u2019une image, d\u2019une vid\u00e9o, d\u2019un avatar ou d\u2019une combinaison de tout cela.\u00a0 Les \u00e9quipes de recherche et d\u2019ing\u00e9nierie du secteur s\u2019accordent \u00e0 dire que pour \u00eatre efficaces, les syst\u00e8mes conversationnels doivent disposer d\u2019une base de compr\u00e9hension solide aliment\u00e9e par des mod\u00e8les d\u2019IA. Mais beaucoup pensent que l\u2019interaction est un probl\u00e8me d\u2019ing\u00e9nierie plut\u00f4t qu\u2019un probl\u00e8me d\u2019IA. Par cons\u00e9quent, un sp\u00e9cialiste en ing\u00e9nierie qui conna\u00eet l\u2019\u00e9tat du monde peut cr\u00e9er une logique complexe pour g\u00e9rer l\u2019interaction requise. L\u2019approche d\u2019ing\u00e9nierie permet de comprendre facilement le fonctionnement du syst\u00e8me et de d\u00e9buguer rapidement la logique si n\u00e9cessaire. Mais cela engendre une IA conversationnelle moins puissante, l\u2019une des principales raisons pour lesquelles votre assistant virtuel ne vous permet pas de planifier vos vacances facilement, par exemple. Une nouvelle approche unifi\u00e9e\u00a0 Dans ces exemples de dialogues, nous mettons en avant les principales comp\u00e9tences que nous voulons donner aux assistants : fournir des connaissances pr\u00e9cises et \u00e0 jour sur le monde r\u00e9el et travailler de fa\u00e7on multimodale (dans ce cas, \u00e0 travers la vision et la parole), dans plusieurs domaines (envoyer un message ou estimer votre heure d\u2019arriv\u00e9e) et en vous permettant d\u2019orienter la conversation plut\u00f4t que de devoir suivre un mod\u00e8le de conversation rigide. L\u2019approche traditionnelle concernant les assistants virtuels intelligents n\u00e9cessite quatre ensembles d\u2019entr\u00e9es et de sorties, un par composant (compr\u00e9hension du langage naturel, suivi de l\u2019\u00e9tat du dialogue, gestion des politiques de dialogue et g\u00e9n\u00e9ration de langage naturel). Et des normes doivent \u00eatre d\u00e9finies pour les entr\u00e9es et les sorties de chaque composant. Par exemple, pour la compr\u00e9hension du langage naturel, un syst\u00e8me d\u2019IA conversationnel traditionnel n\u00e9cessite des ontologies d\u00e9finies (par exemple, plusieurs intentions et entit\u00e9s). Le mod\u00e8le du projet CAIRaoke utilise, lui, un r\u00e9seau de neurones, et n\u2019impose aucun flux conversationnel. En utilisant ce mod\u00e8le, nous n\u2019avons donc besoin que d\u2019un seul ensemble de donn\u00e9es d\u2019entra\u00eenement.\u00a0 Le projet CAIRaoke r\u00e9duit les efforts requis pour ajouter un nouveau domaine. Dans l\u2019ancienne approche, le d\u00e9veloppement d\u2019un nouveau domaine oblige \u00e0 cr\u00e9er et \u00e0 corriger chaque module un par un avant de pouvoir entra\u00eener le suivant de mani\u00e8re fiable. En d\u2019autres termes, l\u2019entra\u00eenement aux politiques de dialogue ne peut pas \u00eatre effectu\u00e9 efficacement si la compr\u00e9hension du langage naturel et le suivi de l\u2019\u00e9tat du dialogue changent constamment. Des changements au niveau d\u2019un composant peuvent perturber les autres, ce qui obligerait \u00e0 entra\u00eener \u00e0 nouveau tous les modules suivants. Cette interd\u00e9pendance ralentit la progression dans les modules suivants. Notre technique de bout en bout supprime cette d\u00e9pendance aux modules pr\u00e9c\u00e9dents, ce qui acc\u00e9l\u00e8re la vitesse de d\u00e9veloppement et d\u2019entra\u00eenement et nous permet d\u2019affiner d\u2019autres mod\u00e8les en utilisant moins d\u2019efforts et de donn\u00e9es. Dans notre nouvelle approche, les dialogues sont beaucoup plus puissants, car ils sont capables de prendre des d\u00e9cisions en analysant toutes les informations disponibles en un seul et m\u00eame endroit. Auparavant, m\u00eame une petite erreur au niveau de l\u2019un des composants pouvait se propager \u00e0 d\u2019autres composants de mani\u00e8re inattendue, et ce probl\u00e8me \u00e9tait difficile \u00e0 r\u00e9soudre. Par exemple, les assistants virtuels actuels bas\u00e9s sur des r\u00e8gles sont explicitement programm\u00e9s pour rechercher des mots ou des phrases sp\u00e9cifiques (comme \u00ab apr\u00e8s-midi \u00bb), alors que le projet CAIRaoke tire parti de mod\u00e8les de langage pr\u00e9-entra\u00een\u00e9s avanc\u00e9s qui comprennent mieux le contexte et peuvent reconna\u00eetre diff\u00e9rentes fa\u00e7ons de dire la m\u00eame chose.\u00a0\u00a0 Enfin, le projet CAIRaoke allie la technologie qui sous-tend le bot conversationnel le plus r\u00e9cent de Meta, BlenderBot 2.0, \u00e0 des dialogues ax\u00e9s sur les t\u00e2ches. Les assistants virtuels d\u00e9velopp\u00e9s \u00e0 l\u2019aide de notre mod\u00e8le pourraient donc utiliser un langage empathique, transmettre des informations trouv\u00e9es sur Internet en temps r\u00e9el et avoir une personnalit\u00e9 coh\u00e9rente. Lorsque les syst\u00e8mes g\u00e9n\u00e8rent un langage naturel, il est essentiel de tenir compte des d\u00e9fis potentiels en mati\u00e8re de s\u00e9curit\u00e9 et de confidentialit\u00e9. La plupart des syst\u00e8mes de g\u00e9n\u00e9ration de langage naturel d\u2019aujourd\u2019hui sont pr\u00e9d\u00e9finis, afin que les \u00e9quipes charg\u00e9es de la mod\u00e9ration du contenu puissent s\u2019assurer que les assistants virtuels ne r\u00e9pondent pas de fa\u00e7on ind\u00e9sirable. Mais lorsque l\u2019assistant virtuel est en contact direct avec une personne r\u00e9elle, il existe un risque d\u2019erreurs et d\u2019interactions potentiellement blessantes, comme cela a d\u00e9j\u00e0 pu \u00eatre constat\u00e9 par le pass\u00e9.\u00a0 Notez que nous avons int\u00e9gr\u00e9 des protections \u00e0 BlenderBot afin de r\u00e9duire ces cas de r\u00e9ponses blessantes. Nous tenons \u00e9galement compte de la confidentialit\u00e9 lors de la conception de ces technologies. Par exemple, avec les Ray-Ban Stories et Portal, l\u2019utilisation des commandes vocales est facultative, vous pouvez donc afficher et supprimer les transcriptions de vos commandes vocales, et vous avez toujours la possibilit\u00e9 de d\u00e9sactiver leur stockage.\u00a0 Pour att\u00e9nuer le risque de r\u00e9ponses ind\u00e9sirables, la premi\u00e8re \u00e9tape du projet CAIRaoke \u00e9tait de g\u00e9n\u00e9rer \u00e0 la fois des actions de dialogue et un langage naturel. \u00c0 court terme, nous g\u00e9n\u00e9rons des actions de dialogue et nous nous appuyons sur un syst\u00e8me de g\u00e9n\u00e9ration de langage naturel test\u00e9 et tr\u00e8s limit\u00e9 pour fournir la r\u00e9ponse attendue. \u00c0 long terme, nous exposerons les phrases g\u00e9n\u00e9r\u00e9es apr\u00e8s avoir assur\u00e9 l\u2019int\u00e9grit\u00e9 de bout en bout de notre mod\u00e8le. Un autre probl\u00e8me que rencontrent \u00e9galement d\u2019autres types de syst\u00e8mes de traitement automatique du langage naturel est ce qu\u2019on appelle\u00a0 l\u2019hallucination, c\u2019est-\u00e0-dire lorsqu\u2019un mod\u00e8le transmet des informations incorrectes avec assurance. Un v\u00e9ritable d\u00e9fi pour les techniques de bout en bout, car les mod\u00e8les peuvent \u00eatre incit\u00e9s \u00e0 introduire ou \u00e0 modifier des entit\u00e9s dans le dialogue en fonction des donn\u00e9es d\u2019entra\u00eenement. Par exemple, si vous demandez \u00e0 votre assistant virtuel de vous rappeler d\u2019appeler Monica, il pourrait configurer un rappel pour appeler Monique, car Monica est un pr\u00e9nom moins courant. Nous avons utilis\u00e9 plusieurs techniques d\u2019augmentation des donn\u00e9es et r\u00e9seaux d\u2019attention pour renforcer le projet CAIRaoke, en tirant parti de ce que nous avons appris de BlenderBot 2.0 pour r\u00e9duire les hallucinations.\u00a0 Utiliser la voix pour de nombreuses t\u00e2ches quotidiennes Bien que notre mise en \u0153uvre \u00e0 court terme du mod\u00e8le du projet CAIRaoke s\u2019applique aux rappels sur Portal, nous esp\u00e9rons pouvoir bient\u00f4t l\u2019utiliser dans de nombreux autres domaines, notamment afin de personnaliser les exp\u00e9riences d\u2019achat, de permettre aux assistants virtuels de maintenir le contexte au fil des discussions et de donner au public le pouvoir d\u2019orienter la conversation.\u00a0 Nous pensons \u00e9galement que cette innovation sera particuli\u00e8rement utile pour d\u00e9velopper des fonctionnalit\u00e9s de dialogue bas\u00e9es sur l\u2019IA pour la r\u00e9alit\u00e9 augment\u00e9e. Dans un avenir plus ou moins proche, les personnes utiliseront r\u00e9guli\u00e8rement l\u2019assistant vocal de leurs lunettes de r\u00e9alit\u00e9 augment\u00e9e, comme elles le font aujourd\u2019hui avec leurs enceintes intelligentes, leurs montres et d\u2019autres appareils. Nous nous effor\u00e7ons donc de r\u00e9duire la taille des mod\u00e8les de bout en bout comme celui-ci afin de les adapter \u00e0 l\u2019appareil, car ces mod\u00e8les int\u00e9gr\u00e9s offrent des avantages suppl\u00e9mentaires en mati\u00e8re de s\u00e9curit\u00e9, de confidentialit\u00e9 et de performance. Nous travaillons \u00e9galement \u00e0 rendre le mod\u00e8le plus facile \u00e0 d\u00e9buguer, ce qui repr\u00e9sente un v\u00e9ritable d\u00e9fi, car dans ce nouveau cadre, les informations figurent dans l\u2019espace d\u2019int\u00e9gration, alors que dans le mod\u00e8le traditionnel, elles sont explicites. Pour concr\u00e9tiser notre vision du projet CAIRaoke, nous devons \u00e9galement l\u2019adapter \u00e0 de nombreuses langues et trouver des moyens de rendre le mod\u00e8le efficace pour des milliards de personnes. Dans quelques ann\u00e9es, la technologie du projet CAIRaoke pourra \u00eatre la base de l\u2019interaction nouvelle g\u00e9n\u00e9ration entre les personnes et les appareils. Sur des appareils tels que les casques de r\u00e9alit\u00e9 virtuelle et les lunettes de r\u00e9alit\u00e9 augment\u00e9e, nous nous attendons \u00e0 ce que ce type de communication devienne la principale m\u00e9thode de navigation et d\u2019interaction, tout comme les \u00e9crans tactiles ont remplac\u00e9 les claviers sur les smartphones. Notre mod\u00e8le actuel est une innovation importante, mais nous avons encore beaucoup de travail pour concr\u00e9tiser cette vision. Nous sommes tr\u00e8s enthousiastes devant les progr\u00e8s que nous avons r\u00e9alis\u00e9s jusqu\u2019\u00e0 pr\u00e9sent et avons h\u00e2te de relever tous les d\u00e9fis \u00e0 venir.\u00a0","og_url":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/","og_site_name":"\u00c0 propos de Meta","article_published_time":"2022-02-23T19:30:38+00:00","article_modified_time":"2022-02-24T07:18:01+00:00","og_image":[{"url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300","width":535,"height":300,"type":"image\/jpeg"}],"author":"hopscotch","twitter_card":"summary_large_image","twitter_creator":"@METAfrance","twitter_misc":{"Written by":"Meta","Est. reading time":"11 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#article","isPartOf":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/"},"author":"Facebook company","headline":"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle","datePublished":"2022-02-23T19:30:38+00:00","dateModified":"2022-02-24T07:18:01+00:00","mainEntityOfPage":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/"},"wordCount":2616,"publisher":{"@id":"https:\/\/about.fb.com\/fr\/#organization"},"image":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#primaryimage"},"thumbnailUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300","keywords":["assistants virtuels","CAIRaoke","intelligence artificielle","langages","Portal","syst\u00e8mes d'IA","technologie","voix"],"articleSection":["Actualit\u00e9s","Intelligence Artificielle","Meta","R\u00e9alit\u00e9 Augment\u00e9e et R\u00e9alit\u00e9 Virtuelle"],"inLanguage":"fr-FR"},{"@type":"WebPage","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/","url":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/","name":"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle | \u00c0 propos de Meta","isPartOf":{"@id":"https:\/\/about.fb.com\/fr\/#website"},"primaryImageOfPage":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#primaryimage"},"image":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#primaryimage"},"thumbnailUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300","datePublished":"2022-02-23T19:30:38+00:00","dateModified":"2022-02-24T07:18:01+00:00","breadcrumb":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/"]}],"author":"\u00c0 propos de Meta"},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#primaryimage","url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300","contentUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300","width":535,"height":300},{"@type":"BreadcrumbList","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/02\/projet-cairaoke-developper-les-assistants-virtuels-du-futur-en-faisant-progresser-lia-conversationnelle\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/about.fb.com\/fr\/"},{"@type":"ListItem","position":2,"name":"Projet CAIRaoke : d\u00e9velopper les assistants virtuels du futur en faisant progresser l\u2019IA conversationnelle"}]},{"@type":"WebSite","@id":"https:\/\/about.fb.com\/fr\/#website","url":"https:\/\/about.fb.com\/news\/","name":"\u00c0 propos de Meta","description":"","publisher":{"@id":"https:\/\/about.fb.com\/fr\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/about.fb.com\/fr\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR","alternateName":["Meta Newsroom","Meta"]},{"@type":"Organization","@id":"https:\/\/about.fb.com\/fr\/#organization","name":"Meta","url":"https:\/\/about.fb.com\/fr\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/","url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500","contentUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500","width":8000,"height":4500,"caption":"Meta"},"image":{"@id":"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/"}}]}},"jetpack_featured_media_url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/02\/ITL6.jpg?fit=535%2C300","jetpack-related-posts":[],"jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts\/22856","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/users\/164097090"}],"replies":[{"embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/comments?post=22856"}],"version-history":[{"count":3,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts\/22856\/revisions"}],"predecessor-version":[{"id":22894,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts\/22856\/revisions\/22894"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/media\/22871"}],"wp:attachment":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/media?parent=22856"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/categories?post=22856"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/tags?post=22856"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}