{"id":22978,"date":"2022-03-30T15:30:02","date_gmt":"2022-03-30T13:30:02","guid":{"rendered":"https:\/\/about.fb.com\/fr\/?p=22978"},"modified":"2022-03-30T15:42:08","modified_gmt":"2022-03-30T13:42:08","slug":"noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia","status":"publish","type":"post","link":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/","title":{"rendered":"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia"},"content":{"rendered":"<p><span style=\"font-weight: 400\">Wikipedia est r\u00e9guli\u00e8rement class\u00e9 parmi les <\/span><a href=\"https:\/\/en.wikipedia.org\/wiki\/List_of_most_visited_websites\"><span style=\"font-weight: 400\">10 sites web les plus consult\u00e9s<\/span><\/a><span style=\"font-weight: 400\"> dans le monde. C\u2019est bien souvent notre premier recours lorsque nous recherchons des informations sur des personnages historiques ou des acteurs du changement. Mais tout le monde n\u2019y est pas repr\u00e9sent\u00e9 de mani\u00e8re \u00e9gale. Environ 20 % seulement des biographies sur le site en anglais concernent des femmes, selon la <\/span><a href=\"https:\/\/wikimediafoundation.org\/news\/2021\/03\/08\/project-rewrite-tell-the-missing-stories-of-women-on-wikipedia-and-beyond\/?fbclid=IwAR2n9u4Au6X1Gd9NKlTtPlBAXQ4R4mWgO-BfsDMwiUbF-KqRbvGis3vHp2Q#:~:text=On%20English%20Wikipedia%2C%20fewer%20than%2020%25%20of%20biographies,This%20is%20a%20reflection%20of%20a%20bigger%20problem.\"><span style=\"font-weight: 400\">Fondation Wikimedia<\/span><\/a><span style=\"font-weight: 400\">. Cette proportion est sans doute encore plus faible pour celles \u00e0 l\u2019intersection de plusieurs minorit\u00e9s, comme les scientifiques, les africaines et les asiatiques.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Dans le cadre de mon projet de doctorat en informatique \u00e0 l\u2019Universit\u00e9 de Lorraine, en France, au sein de l\u2019Institut national de recherche en sciences et technologies du num\u00e9rique (INRIA), j\u2019ai travaill\u00e9 aux c\u00f4t\u00e9s de Claire Gardent, ma directrice de th\u00e8se, au d\u00e9veloppement d\u2019une nouvelle solution qui permettrait de rem\u00e9dier \u00e0 ce d\u00e9s\u00e9quilibre gr\u00e2ce \u00e0 l\u2019intelligence artificielle (IA). Nous avons cr\u00e9\u00e9 un syst\u00e8me d\u2019IA capable d\u2019effectuer des recherches et de r\u00e9diger les premi\u00e8res \u00e9bauches des articles biographiques dans le style propre \u00e0 Wikip\u00e9dia. Il reste encore du travail, mais nous esp\u00e9rons qu&rsquo;\u00e0 terme ce nouveau syst\u00e8me aidera les \u00e9diteurs et \u00e9ditrices de Wikip\u00e9dia \u00e0 cr\u00e9er des milliers d\u2019articles biographiques fiables et int\u00e9ressants sur des personnalit\u00e9s de premier plan qui ne figurent pas encore sur le site.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Le sujet me tenait personnellement \u00e0 c\u0153ur : j\u2019avais observ\u00e9 le manque de repr\u00e9sentation dans les collections des biblioth\u00e8ques durant mes ann\u00e9es d\u2019\u00e9cole primaire. Quand j\u2019\u00e9tais en CE2, on m\u2019a demand\u00e9 de faire une r\u00e9daction sur un personnage historique, avec une seule contrainte : que la biblioth\u00e8que dispose de sa biographie. Je voulais \u00e9crire sur Eleanor Roosevelt, mais j\u2019ai d\u00fb me contenter de Teddy Roosevelt. Et si j\u2019avais voulu parler d\u2019une personne qui me ressemble ? Aurais-je seulement pu le faire ? Si nous imaginions le m\u00eame exercice aujourd\u2019hui, les \u00e9l\u00e8ves utiliseraient s\u00fbrement Internet, et plus probablement Wikip\u00e9dia. Alors que Wikip\u00e9dia compte des millions d\u2019articles en anglais (dont un excellent article sur Eleanor Roosevelt), nous savons qu\u2019il existe encore de nombreuses femmes dont les histoires et les accomplissements n\u2019atteignent pas la post\u00e9rit\u00e9.<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter  wp-image-22989\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/zzz.png?w=890&#038;resize=577%2C325\" alt=\"\" width=\"577\" height=\"325\" \/><\/p>\n<p><span style=\"font-weight: 400\">Alors que les femmes sont plus susceptibles d\u2019\u00e9crire des biographies \u00e0 propos d\u2019autres femmes, le <\/span><a href=\"https:\/\/meta.wikimedia.org\/wiki\/Community_Insights\/Community_Insights_2021_Report\/Thriving_Movement?fbclid=IwAR3040nU65lvbPkJ4rrZ9nGEilw7w44XDJOftnpOCxB3qWI2BMIhI_dUyPA#Community_and_Newcomer_Diversity\"><span style=\"font-weight: 400\">Community Insights 2021 Report de Wikimedia<\/span><\/a><span style=\"font-weight: 400\"> qui porte sur l\u2019ann\u00e9e \u00e9coul\u00e9e, a r\u00e9v\u00e9l\u00e9 que seules 15 % des personnes contribuant \u00e0 Wikip\u00e9dia s&rsquo;identifient comme appartenant \u00e0 la gent f\u00e9minine. Ces derni\u00e8res sont donc oubli\u00e9es et sous-repr\u00e9sent\u00e9es, malgr\u00e9 l\u2019impact consid\u00e9rable qu\u2019elles ont eu au cours de l\u2019histoire dans les sciences, les affaires, la politique et tous les autres domaines de notre soci\u00e9t\u00e9. La physicienne canadienne Donna Strickland a remport\u00e9 le prix Nobel de physique en 2018. Cependant, les internautes cherchant des informations \u00e0 son sujet sur Wikip\u00e9dia ne les auraient pas trouv\u00e9es. Ce n\u2019est que quelques jours apr\u00e8s qu\u2019elle a remport\u00e9 le prix le plus prestigieux dans son domaine d\u2019\u00e9tude qu\u2019une <\/span><a href=\"https:\/\/wikimediafoundation.org\/news\/2018\/10\/04\/donna-strickland-wikipedia\/?fbclid=IwAR1Cl5MYhG4kB76uPIVUMW8zwCdQQ1LdJzgX8GegFP4DKqBbD_7nlRypPXs\"><span style=\"font-weight: 400\">biographie Wikip\u00e9dia<\/span><\/a><span style=\"font-weight: 400\"> est publi\u00e9e \u00e0 propos de ses pr\u00e9cieux travaux. Diverses \u00e9tudes, <\/span><a href=\"https:\/\/wikimediafoundation.org\/story\/facts-of-life\/\"><span style=\"font-weight: 400\">\u00e9manant notamment de la Wikimedia Foundation elle-m\u00eame<\/span><\/a><span style=\"font-weight: 400\">, ont \u00e9galement d\u00e9nonc\u00e9 le d\u00e9s\u00e9quilibre entre les genres sur la plateforme. M\u00eame avec ce manque de repr\u00e9sentation, les biographies de femmes \u00e9taient toujours propos\u00e9es \u00e0 la suppression de fa\u00e7on disproportionn\u00e9e. En effet, une <\/span><a href=\"https:\/\/journals.sagepub.com\/doi\/10.1177\/14614448211023772?fbclid=IwAR0UF1W4uMmriGe5HOZlso88s2SmEeDIxRBwyR-cwwd4mpoeKLsf4ioUXZY&amp;\"><span style=\"font-weight: 400\">\u00e9tude<\/span><\/a><span style=\"font-weight: 400\"> a r\u00e9v\u00e9l\u00e9 qu\u2019en 2017, 41 % des biographies propos\u00e9es \u00e0 la suppression concernaient des femmes.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Nous pensons qu\u2019une m\u00e9thode ouverte et reproductible peut constituer un premier pas vers la r\u00e9solution de ce probl\u00e8me. Aujourd\u2019hui, nous mettons en libre acc\u00e8s un mod\u00e8le d\u2019IA de bout en bout qui cr\u00e9e automatiquement des articles biographiques d\u2019excellente qualit\u00e9 sur des personnalit\u00e9s publiques de premier plan.<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter  wp-image-22990\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/zzzzz.png?w=890&#038;resize=572%2C325\" alt=\"\" width=\"572\" height=\"325\" srcset=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/zzzzz.png?w=914 914w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/zzzzz.png?w=600 600w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/zzzzz.png?w=300 300w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/zzzzz.png?w=768 768w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/zzzzz.png?w=800 800w\" sizes=\"auto, (max-width: 572px) 100vw, 572px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Notre mod\u00e8le explore les sites web \u00e0 la recherche d\u2019informations pertinentes et r\u00e9dige un article type Wikip\u00e9dia sur cette personne, accompagn\u00e9 de r\u00e9f\u00e9rences. Nous publions \u00e9galement un nouvel ensemble de donn\u00e9es cr\u00e9\u00e9 pour \u00e9valuer les performances du mod\u00e8le sur 1 527 biographies de femmes issues de groupes marginalis\u00e9s. Cet ensemble de donn\u00e9es peut servir \u00e0 entra\u00eener des nouveaux mod\u00e8les, ainsi qu\u2019\u00e9valuer les performances du mod\u00e8le existant et le faire progresser. Nous pensons que ces entr\u00e9es g\u00e9n\u00e9r\u00e9es par l\u2019IA peuvent \u00eatre utilis\u00e9es comme point de d\u00e9part par les personnes qui r\u00e9digent le contenu de Wikip\u00e9dia et celles qui v\u00e9rifient les informations, afin de publier davantage de biographies de groupes sous-repr\u00e9sent\u00e9s sur le site.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Nous avons encore tant \u00e0 faire pour diversifier la repr\u00e9sentation des personnalit\u00e9s issues de tous horizons sur Wikip\u00e9dia. Fondamentalement, les syst\u00e8mes d\u2019IA tels que celui que nous avons cr\u00e9\u00e9 devront relever des d\u00e9fis soci\u00e9taux et techniques plus vastes afin de r\u00e9soudre pleinement le probl\u00e8me. \u00c0 commencer par les contenus web utilis\u00e9s pour cr\u00e9er les articles Wikip\u00e9dia, qui sont parfois erron\u00e9s ou refl\u00e8tent nos biais culturels. D\u2019un point de vue technique, le syst\u00e8me de g\u00e9n\u00e9ration de texte peut avoir tendance \u00e0 faire appara\u00eetre des contenus non factuels. M\u00eame les meilleurs moteurs de traitement du langage peinent encore aujourd\u2019hui \u00e0 produire un texte coh\u00e9rent sur plusieurs paragraphes. Nous esp\u00e9rons les am\u00e9liorer en perfectionnant les architectures neuronales qui alimentent ces mod\u00e8les et en innovant en mati\u00e8re de d\u00e9veloppement responsable de l\u2019intelligence artificielle.<\/span><\/p>\n<p><span style=\"font-weight: 400\">\u00c0 terme, nous esp\u00e9rons que cette approche aidera des non-sp\u00e9cialistes \u00e0 produire des articles fiables pour enrichir la documentation disponible sur le web, et ce, sans n\u00e9cessiter de corrections majeures.<\/span><\/p>\n<h2><b>Comment l\u2019IA peut-elle contribuer \u00e0 la lutte contre les pr\u00e9jug\u00e9s ?<\/b><\/h2>\n<p><span style=\"font-weight: 400\">Notre mod\u00e8le est un grand pas en avant pour appuyer et renforcer les autres initiatives existantes qui visent \u00e0 am\u00e9liorer l\u2019\u00e9quilibre des genres sur Wikip\u00e9dia. Les \u00e9ditrices b\u00e9n\u00e9voles <\/span><a href=\"https:\/\/www.aaas.org\/membership\/member-spotlight\/jessica-wade-physicist-and-author-hundreds-wikipedia-entries-about?fbclid=IwAR1OdWn0gVNHDkQTMAvvFvt2JNsaSxskCGmUONoIWCnSWg7CKsAp1CDRZ8A\"><span style=\"font-weight: 400\">Jessica Wade<\/span><\/a><span style=\"font-weight: 400\"> et <\/span><a href=\"https:\/\/twitter.com\/hockeyfan12342\/status\/1477806046462849032?fbclid=IwAR0OP3jDl-lbeUF8JPhsFzmc3sO3eaPZXHbfIeCWdG3uRp_AwdiYHnD5Erk\"><span style=\"font-weight: 400\">Penny Richards<\/span><\/a><span style=\"font-weight: 400\"> ont collabor\u00e9 en toute ind\u00e9pendance pour \u00e9crire et publier sur Wikip\u00e9dia des milliers de biographies de femmes qui m\u00e9ritent d\u2019\u00eatre mises en lumi\u00e8re. Nous pouvons \u00e9galement mentionner une autre initiative collective remarquable, le <\/span><a href=\"https:\/\/wikimediafoundation.org\/news\/2018\/10\/18\/women-in-red-wikiproject\/?fbclid=IwAR198s48zlAKIIqV9nsP7OpYJqn8inmZCrWeK7HapE1qXSkeXGae6-ohTiU\"><span style=\"font-weight: 400\">Women in Red Wiki Project<\/span><\/a><span style=\"font-weight: 400\">, qui mobilise des \u00e9ditrices et \u00e9diteurs d\u00e9sireux de r\u00e9diger des biographies et de compl\u00e9ter celles qui existent d\u00e9j\u00e0 sur des femmes remarquables d\u2019hier et d\u2019aujourd\u2019hui.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Nous avons donc opt\u00e9 pour une solution compl\u00e9mentaire. La recherche, la cr\u00e9ation d\u2019une bibliographie et la r\u00e9daction sont des t\u00e2ches complexes, mais il existe une multitude d\u2019informations disponibles sur le web pour raconter l\u2019histoire de femmes dont les accomplissements, les voix et les h\u00e9ritages ont \u00e9t\u00e9 oubli\u00e9s ou rel\u00e9gu\u00e9s au second plan.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Par exemple, nous avons utilis\u00e9 notre mod\u00e8le pour g\u00e9n\u00e9rer une courte biographie de Libbie Hyman, une pionni\u00e8re dans le domaine de la zoologie des invert\u00e9br\u00e9s. Le texte vert est tir\u00e9 de l\u2019article de r\u00e9f\u00e9rence qui a servi de point de d\u00e9part, le texte violet est tir\u00e9 des informations du web, et le texte orange signale la pr\u00e9sence d\u2019\u00e9l\u00e9ments non factuels, ce qui signifie que le mod\u00e8le a invent\u00e9 des informations non v\u00e9rifiables.<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-22982\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki4.png?w=624&#038;resize=624%2C131\" alt=\"\" width=\"624\" height=\"131\" srcset=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki4.png?w=624 624w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki4.png?w=600 600w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki4.png?w=300 300w\" sizes=\"auto, (max-width: 624px) 100vw, 624px\" \/><\/p>\n<p><span style=\"font-weight: 400\">Le mod\u00e8le a r\u00e9cup\u00e9r\u00e9 des informations biographiques pertinentes sur Libbie Hyman, dont son int\u00e9r\u00eat pour les invert\u00e9br\u00e9s, ses publications importantes et l\u2019impact de son travail, qui peuvent ensuite \u00eatre utilis\u00e9es comme point de d\u00e9part par les \u00e9diteurs et \u00e9ditrices pour v\u00e9rifier les faits (un domaine o\u00f9 le mod\u00e8le pr\u00e9sente encore des lacunes), ainsi qu\u2019\u00e9toffer sa biographie et ses accomplissements.<\/span><\/p>\n<h2><b>Utilisation du pr\u00e9-entra\u00eenement et d\u2019un mod\u00e8le de recherche pour g\u00e9n\u00e9rer des biographies sur Wikip\u00e9dia<\/b><\/h2>\n<p><span style=\"font-weight: 400\">Nous commen\u00e7ons le processus de g\u00e9n\u00e9ration d\u2019une biographie en utilisant une matrice de g\u00e9n\u00e9ration augment\u00e9e par la recherche, qui repose sur un pr\u00e9-entra\u00eenement \u00e0 grande \u00e9chelle, et qui apprend au mod\u00e8le \u00e0 identifier uniquement les informations utiles, telles que le lieu de naissance ou le lieu o\u00f9 la personne a fait ses \u00e9tudes, \u00e0 mesure qu\u2019il \u00e9labore la biographie.<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter  wp-image-22991\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/zzzzzzz.png?w=771&#038;resize=584%2C396\" alt=\"\" width=\"584\" height=\"396\" \/><\/p>\n<p><span style=\"font-weight: 400\">Le mod\u00e8le extrait d\u2019abord des informations pertinentes sur Internet pour pr\u00e9senter le sujet. Ensuite, le module de g\u00e9n\u00e9ration cr\u00e9e le texte, et la troisi\u00e8me phase, le module de citation, \u00e9tablit la bibliographie qui renvoie aux sources utilis\u00e9es. Le processus se r\u00e9p\u00e8te alors, chaque partie pr\u00e9disant celle qui suit, pour couvrir tous les aspects constitutifs d\u2019une bonne biographie Wikip\u00e9dia, notamment son enfance, sa formation et son parcours professionnel.<\/span><\/p>\n<p><span style=\"font-weight: 400\">La g\u00e9n\u00e9ration d\u2019informations se fait section par section, \u00e0 l\u2019aide d\u2019un m\u00e9canisme de mise en cache semblable \u00e0 celui de Transformer-XL, afin de renvoyer aux sections existantes et d\u2019atteindre un degr\u00e9 de contextualisation plus \u00e9lev\u00e9 au niveau du document. La mise en cache est essentielle, car elle permet au mod\u00e8le de mieux retracer ce qu\u2019il a d\u00e9j\u00e0 produit.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Les \u00e9valuations automatiques et humaines montrent que le mod\u00e8le est capable de trouver des informations pertinentes et de les utiliser pour g\u00e9n\u00e9rer des biographies, mais beaucoup reste \u00e0 faire. Ces \u00e9valuations ont r\u00e9v\u00e9l\u00e9 que 68 % du texte g\u00e9n\u00e9r\u00e9 dans les biographies que nous avons cr\u00e9\u00e9es ne se trouvait pas dans le corpus de r\u00e9f\u00e9rence. Cela peut signifier plusieurs choses. On pourrait en d\u00e9duire que le mod\u00e8le r\u00e9ussit \u00e0 trouver et \u00e0 synth\u00e9tiser des informations pertinentes sans pour autant devenir un outil de plagiat. Cependant, il est \u00e9galement impr\u00e9cis : il est difficile de savoir quelles informations sont exactes et lesquelles sont erron\u00e9es. Nous avons demand\u00e9 aux \u00e9quipes d\u2019\u00e9valuation de d\u00e9terminer si des phrases compl\u00e8tes \u00e9taient conformes aux faits, et dans de nombreux cas, elles n\u2019\u00e9taient que partiellement v\u00e9rifiables. Ces difficult\u00e9s sont analogues aux d\u00e9fis rencontr\u00e9s par la g\u00e9n\u00e9ration de texte en g\u00e9n\u00e9ral, bien qu\u2019elles soient exacerb\u00e9es dans le cas des groupes marginalis\u00e9s, car il existe tr\u00e8s peu de donn\u00e9es \u00e0 leur sujet. Nous esp\u00e9rons que la diffusion de cet ensemble de donn\u00e9es permettra \u00e0 d\u2019autres sp\u00e9cialistes d\u2019\u00e9tudier ce probl\u00e8me.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Nous avons rencontr\u00e9 plusieurs autres obstacles au cours de nos recherches. Tout d\u2019abord, le manque de donn\u00e9es pour entra\u00eener le moteur ou d\u2019articles biographiques existants sur les femmes s\u2019est r\u00e9v\u00e9l\u00e9 un probl\u00e8me de taille. Les articles qui portent sur les femmes, en particulier celles issues de groupes marginalis\u00e9s, sont nettement plus courts que la moyenne des articles sur les hommes, sont moins d\u00e9taill\u00e9s et utilisent un langage diff\u00e9rent. Par exemple, on lira \u00ab femme scientifique \u00bb au lieu de simplement \u00ab scientifique \u00bb. Ce biais dans les donn\u00e9es d\u2019entra\u00eenement a \u00e9t\u00e9 int\u00e9rioris\u00e9 par les mod\u00e8les. De plus, les articles de Wikip\u00e9dia doivent \u00eatre r\u00e9dig\u00e9s \u00e0 partir de sources factuelles, souvent issues du web. Cependant, le parti pris de Wikipedia vaut aussi pour Internet : il existe tr\u00e8s peu de sites web pouvant faire office de sources v\u00e9rifi\u00e9es.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Les probl\u00e8mes bien ancr\u00e9s ne se r\u00e9solvent pas du jour au lendemain, mais c\u2019est exactement le type de probl\u00e9matique o\u00f9 la technologie peut \u00eatre utilis\u00e9e afin de faire \u00e9voluer les choses.<\/span><\/p>\n<h2><b>Et apr\u00e8s ? Accro\u00eetre la visibilit\u00e9 des personnes sous-repr\u00e9sent\u00e9es sur Wikip\u00e9dia<\/b><\/h2>\n<p><span style=\"font-weight: 400\">Nous nous r\u00e9jouissons de partager ce travail avec la communaut\u00e9 afin de stimuler les \u00e9changes, les exp\u00e9rimentations et les avanc\u00e9es qui permettront d\u2019am\u00e9liorer l\u2019\u00e9quit\u00e9 dans l\u2019offre de contenu sur Wikip\u00e9dia.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Notre mod\u00e8le ne r\u00e9sout que partiellement un probl\u00e8me multidimensionnel. Il reste donc d\u2019autres domaines o\u00f9 de nouvelles technologies devraient \u00eatre \u00e9tudi\u00e9es. Lorsqu\u2019une personne contribuant \u00e0 Wikip\u00e9dia ou notre mod\u00e8le d\u2019IA compose une biographie, des informations sont tir\u00e9es du web, puis cit\u00e9es. Cependant, malgr\u00e9 toute la richesse du savoir disponible sur Internet, certaines sources pr\u00e9sentent un parti pris dont il faut tenir compte. Par exemple, lorsque les femmes sont repr\u00e9sent\u00e9es, leur biographie est plus susceptible de comporter des informations suppl\u00e9mentaires sur leur vie personnelle. Une \u00e9tude de 2015 a r\u00e9v\u00e9l\u00e9 que <\/span><a href=\"https:\/\/wikimediafoundation.org\/news\/2018\/10\/18\/wikipedia-mirror-world-gender-biases\/?fbclid=IwAR1cu2Q0NEsajqI1UAGnHutX_KLGpbYAs_DdRcrsyXSS1Ct_vqV9bFac8OY\"><span style=\"font-weight: 400\">le mot \u00ab divorc\u00e9 \u00bb appara\u00eet quatre fois plus souvent <\/span><\/a><span style=\"font-weight: 400\">dans les biographies des femmes que dans celles des hommes. Les raisons sont multiples, comme le fait que les tablo\u00efds ont tendance \u00e0 se concentrer davantage sur la vie des femmes c\u00e9l\u00e8bres que sur celle des hommes. Il en r\u00e9sulte que les d\u00e9tails personnels sont plus susceptibles d\u2019\u00eatre mentionn\u00e9s dans les articles sur celles-ci, ce qui a pour effet de faire oublier des r\u00e9alisations qui devraient \u00eatre mises en avant et valoris\u00e9es.<\/span><\/p>\n<p><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-22984\" src=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki6.png?w=890&#038;resize=890%2C593\" alt=\"\" width=\"890\" height=\"593\" srcset=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki6.png?w=1180 1180w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki6.png?w=600 600w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki6.png?w=300 300w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki6.png?w=768 768w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki6.png?w=1024 1024w, https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki6.png?w=800 800w\" sizes=\"auto, (max-width: 890px) 100vw, 890px\" \/><\/p>\n<p><span style=\"font-weight: 400\">La technologie a d\u00e9j\u00e0 permis de corriger certains d\u00e9s\u00e9quilibres, ce qui prouve que la communaut\u00e9 a encore une marge de man\u0153uvre pour faire bouger les lignes. Par exemple, l\u2019ancien directeur g\u00e9n\u00e9ral du site <\/span><a href=\"https:\/\/wikimediafoundation.org\/news\/2018\/10\/18\/wikipedia-mirror-world-gender-biases\/?fbclid=IwAR2rjsRaS4ShufcEiKZewKvIBSg1gRiskayxpF74vSZXJvpMmCg7vrF8YCc\"><span style=\"font-weight: 400\">a expliqu\u00e9 comment un algorithme a d\u00e9cel\u00e9<\/span><\/a><span style=\"font-weight: 400\"> une faille majeure. En effet, alors que les articles de Wikip\u00e9dia portant sur la sant\u00e9 sont pass\u00e9s au crible par des personnes sp\u00e9cialis\u00e9es en r\u00e9daction m\u00e9dicale, pendant des ann\u00e9es, certains articles traitant de sujets cruciaux pour la sant\u00e9 des femmes, comme l\u2019allaitement, ont \u00e9t\u00e9 class\u00e9s comme \u00e9tant de \u00ab faible importance \u00bb.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Il reste encore du chemin \u00e0 parcourir pour d\u2019autres groupes marginalis\u00e9s et intersectionnels dans le monde entier et dans toutes les langues. Notre \u00e9valuation et notre ensemble de donn\u00e9es se concentrent sur les femmes, excluant ainsi de nombreux autres groupes, dont les personnes non binaires. Les articles sur les personnes transgenres et non binaires sont g\u00e9n\u00e9ralement plus longs, mais une large partie du surplus de texte est consacr\u00e9e \u00e0 leur vie personnelle au lieu de s\u2019\u00e9tendre sur leurs r\u00e9alisations, selon une <\/span><a href=\"https:\/\/arxiv.org\/pdf\/2101.00078.pdf?fbclid=IwAR0Osr-aInlpg8bkh5z5B1jkOqfgg2yZzjcl0SIb74OxZsbvBp2xodhu32Y\"><span style=\"font-weight: 400\">\u00e9tude de 2021<\/span><\/a><span style=\"font-weight: 400\"> qui a examin\u00e9 les biais sociaux dans les articles de Wikip\u00e9dia. Il est important de reconna\u00eetre que la partialit\u00e9 existe sous diverses formes, notamment dans les sources d\u2019information en ligne propos\u00e9es par d\u00e9faut.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Nous sommes anim\u00e9s par le d\u00e9sir de faire partager ce domaine de recherche important \u00e0 l\u2019ensemble de la communaut\u00e9 des chercheurs et chercheuses dans le domaine de la g\u00e9n\u00e9ration par l\u2019IA. Nous esp\u00e9rons que nos techniques pourront \u00eatre utilis\u00e9es comme point de d\u00e9part pour les personnes qui enrichissent le contenu Wikip\u00e9dia de leurs articles, et qu\u2019elles permettront d\u2019am\u00e9liorer l\u2019\u00e9quit\u00e9 des informations en ligne accessibles aux \u00e9tudiants qui r\u00e9digent des biographies, et \u00e0 bien d\u2019autres.\u00a0<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"Wikipedia est r\u00e9guli\u00e8rement class\u00e9 parmi les 10 sites web les plus consult\u00e9s dans le monde. C\u2019est bien souvent notre premier recours lorsque nous recherchons des informations sur des personnages historiques ou des acteurs du changement. Mais tout le monde n\u2019y est pas repr\u00e9sent\u00e9 de mani\u00e8re \u00e9gale. Environ 20 % seulement des biographies sur le site en anglais concernent des femmes, selon la Fondation Wikimedia. Cette proportion est sans doute encore plus faible pour celles \u00e0 l\u2019intersection de plusieurs minorit\u00e9s, comme les scientifiques, les africaines et les asiatiques. Dans le cadre de mon projet de doctorat en informatique \u00e0 l\u2019Universit\u00e9 de Lorraine, en France, au sein de l\u2019Institut national de recherche en sciences et technologies du num\u00e9rique (INRIA), j\u2019ai travaill\u00e9 aux c\u00f4t\u00e9s de Claire Gardent, ma directrice de th\u00e8se, au d\u00e9veloppement d\u2019une nouvelle solution qui permettrait de rem\u00e9dier \u00e0 ce d\u00e9s\u00e9quilibre gr\u00e2ce \u00e0 l\u2019intelligence artificielle (IA). Nous avons cr\u00e9\u00e9 un syst\u00e8me d\u2019IA capable d\u2019effectuer des recherches et de r\u00e9diger les premi\u00e8res \u00e9bauches des articles biographiques dans le style propre \u00e0 Wikip\u00e9dia. Il reste encore du travail, mais nous esp\u00e9rons qu&rsquo;\u00e0 terme ce nouveau syst\u00e8me aidera les \u00e9diteurs et \u00e9ditrices de Wikip\u00e9dia \u00e0 cr\u00e9er des milliers d\u2019articles biographiques fiables et int\u00e9ressants sur des personnalit\u00e9s de premier plan qui ne figurent pas encore sur le site. Le sujet me tenait personnellement \u00e0 c\u0153ur : j\u2019avais observ\u00e9 le manque de repr\u00e9sentation dans les collections des biblioth\u00e8ques durant mes ann\u00e9es d\u2019\u00e9cole primaire. Quand j\u2019\u00e9tais en CE2, on m\u2019a demand\u00e9 de faire une r\u00e9daction sur un personnage historique, avec une seule contrainte : que la biblioth\u00e8que dispose de sa biographie. Je voulais \u00e9crire sur Eleanor Roosevelt, mais j\u2019ai d\u00fb me contenter de Teddy Roosevelt. Et si j\u2019avais voulu parler d\u2019une personne qui me ressemble ? Aurais-je seulement pu le faire ? Si nous imaginions le m\u00eame exercice aujourd\u2019hui, les \u00e9l\u00e8ves utiliseraient s\u00fbrement Internet, et plus probablement Wikip\u00e9dia. Alors que Wikip\u00e9dia compte des millions d\u2019articles en anglais (dont un excellent article sur Eleanor Roosevelt), nous savons qu\u2019il existe encore de nombreuses femmes dont les histoires et les accomplissements n\u2019atteignent pas la post\u00e9rit\u00e9. Alors que les femmes sont plus susceptibles d\u2019\u00e9crire des biographies \u00e0 propos d\u2019autres femmes, le Community Insights 2021 Report de Wikimedia qui porte sur l\u2019ann\u00e9e \u00e9coul\u00e9e, a r\u00e9v\u00e9l\u00e9 que seules 15 % des personnes contribuant \u00e0 Wikip\u00e9dia s&rsquo;identifient comme appartenant \u00e0 la gent f\u00e9minine. Ces derni\u00e8res sont donc oubli\u00e9es et sous-repr\u00e9sent\u00e9es, malgr\u00e9 l\u2019impact consid\u00e9rable qu\u2019elles ont eu au cours de l\u2019histoire dans les sciences, les affaires, la politique et tous les autres domaines de notre soci\u00e9t\u00e9. La physicienne canadienne Donna Strickland a remport\u00e9 le prix Nobel de physique en 2018. Cependant, les internautes cherchant des informations \u00e0 son sujet sur Wikip\u00e9dia ne les auraient pas trouv\u00e9es. Ce n\u2019est que quelques jours apr\u00e8s qu\u2019elle a remport\u00e9 le prix le plus prestigieux dans son domaine d\u2019\u00e9tude qu\u2019une biographie Wikip\u00e9dia est publi\u00e9e \u00e0 propos de ses pr\u00e9cieux travaux. Diverses \u00e9tudes, \u00e9manant notamment de la Wikimedia Foundation elle-m\u00eame, ont \u00e9galement d\u00e9nonc\u00e9 le d\u00e9s\u00e9quilibre entre les genres sur la plateforme. M\u00eame avec ce manque de repr\u00e9sentation, les biographies de femmes \u00e9taient toujours propos\u00e9es \u00e0 la suppression de fa\u00e7on disproportionn\u00e9e. En effet, une \u00e9tude a r\u00e9v\u00e9l\u00e9 qu\u2019en 2017, 41 % des biographies propos\u00e9es \u00e0 la suppression concernaient des femmes. Nous pensons qu\u2019une m\u00e9thode ouverte et reproductible peut constituer un premier pas vers la r\u00e9solution de ce probl\u00e8me. Aujourd\u2019hui, nous mettons en libre acc\u00e8s un mod\u00e8le d\u2019IA de bout en bout qui cr\u00e9e automatiquement des articles biographiques d\u2019excellente qualit\u00e9 sur des personnalit\u00e9s publiques de premier plan. Notre mod\u00e8le explore les sites web \u00e0 la recherche d\u2019informations pertinentes et r\u00e9dige un article type Wikip\u00e9dia sur cette personne, accompagn\u00e9 de r\u00e9f\u00e9rences. Nous publions \u00e9galement un nouvel ensemble de donn\u00e9es cr\u00e9\u00e9 pour \u00e9valuer les performances du mod\u00e8le sur 1 527 biographies de femmes issues de groupes marginalis\u00e9s. Cet ensemble de donn\u00e9es peut servir \u00e0 entra\u00eener des nouveaux mod\u00e8les, ainsi qu\u2019\u00e9valuer les performances du mod\u00e8le existant et le faire progresser. Nous pensons que ces entr\u00e9es g\u00e9n\u00e9r\u00e9es par l\u2019IA peuvent \u00eatre utilis\u00e9es comme point de d\u00e9part par les personnes qui r\u00e9digent le contenu de Wikip\u00e9dia et celles qui v\u00e9rifient les informations, afin de publier davantage de biographies de groupes sous-repr\u00e9sent\u00e9s sur le site. Nous avons encore tant \u00e0 faire pour diversifier la repr\u00e9sentation des personnalit\u00e9s issues de tous horizons sur Wikip\u00e9dia. Fondamentalement, les syst\u00e8mes d\u2019IA tels que celui que nous avons cr\u00e9\u00e9 devront relever des d\u00e9fis soci\u00e9taux et techniques plus vastes afin de r\u00e9soudre pleinement le probl\u00e8me. \u00c0 commencer par les contenus web utilis\u00e9s pour cr\u00e9er les articles Wikip\u00e9dia, qui sont parfois erron\u00e9s ou refl\u00e8tent nos biais culturels. D\u2019un point de vue technique, le syst\u00e8me de g\u00e9n\u00e9ration de texte peut avoir tendance \u00e0 faire appara\u00eetre des contenus non factuels. M\u00eame les meilleurs moteurs de traitement du langage peinent encore aujourd\u2019hui \u00e0 produire un texte coh\u00e9rent sur plusieurs paragraphes. Nous esp\u00e9rons les am\u00e9liorer en perfectionnant les architectures neuronales qui alimentent ces mod\u00e8les et en innovant en mati\u00e8re de d\u00e9veloppement responsable de l\u2019intelligence artificielle. \u00c0 terme, nous esp\u00e9rons que cette approche aidera des non-sp\u00e9cialistes \u00e0 produire des articles fiables pour enrichir la documentation disponible sur le web, et ce, sans n\u00e9cessiter de corrections majeures. Comment l\u2019IA peut-elle contribuer \u00e0 la lutte contre les pr\u00e9jug\u00e9s ? Notre mod\u00e8le est un grand pas en avant pour appuyer et renforcer les autres initiatives existantes qui visent \u00e0 am\u00e9liorer l\u2019\u00e9quilibre des genres sur Wikip\u00e9dia. Les \u00e9ditrices b\u00e9n\u00e9voles Jessica Wade et Penny Richards ont collabor\u00e9 en toute ind\u00e9pendance pour \u00e9crire et publier sur Wikip\u00e9dia des milliers de biographies de femmes qui m\u00e9ritent d\u2019\u00eatre mises en lumi\u00e8re. Nous pouvons \u00e9galement mentionner une autre initiative collective remarquable, le Women in Red Wiki Project, qui mobilise des \u00e9ditrices et \u00e9diteurs d\u00e9sireux de r\u00e9diger des biographies et de compl\u00e9ter celles qui existent d\u00e9j\u00e0 sur des femmes remarquables d\u2019hier et d\u2019aujourd\u2019hui. Nous avons donc opt\u00e9 pour une solution compl\u00e9mentaire. La recherche, la cr\u00e9ation d\u2019une bibliographie et la r\u00e9daction sont des t\u00e2ches complexes, mais il existe une multitude d\u2019informations disponibles sur le web pour raconter l\u2019histoire de femmes dont les accomplissements, les voix et les h\u00e9ritages ont \u00e9t\u00e9 oubli\u00e9s ou rel\u00e9gu\u00e9s au second plan. Par exemple, nous avons utilis\u00e9 notre mod\u00e8le pour g\u00e9n\u00e9rer une courte biographie de Libbie Hyman, une pionni\u00e8re dans le domaine de la zoologie des invert\u00e9br\u00e9s. Le texte vert est tir\u00e9 de l\u2019article de r\u00e9f\u00e9rence qui a servi de point de d\u00e9part, le texte violet est tir\u00e9 des informations du web, et le texte orange signale la pr\u00e9sence d\u2019\u00e9l\u00e9ments non factuels, ce qui signifie que le mod\u00e8le a invent\u00e9 des informations non v\u00e9rifiables. Le mod\u00e8le a r\u00e9cup\u00e9r\u00e9 des informations biographiques pertinentes sur Libbie Hyman, dont son int\u00e9r\u00eat pour les invert\u00e9br\u00e9s, ses publications importantes et l\u2019impact de son travail, qui peuvent ensuite \u00eatre utilis\u00e9es comme point de d\u00e9part par les \u00e9diteurs et \u00e9ditrices pour v\u00e9rifier les faits (un domaine o\u00f9 le mod\u00e8le pr\u00e9sente encore des lacunes), ainsi qu\u2019\u00e9toffer sa biographie et ses accomplissements. Utilisation du pr\u00e9-entra\u00eenement et d\u2019un mod\u00e8le de recherche pour g\u00e9n\u00e9rer des biographies sur Wikip\u00e9dia Nous commen\u00e7ons le processus de g\u00e9n\u00e9ration d\u2019une biographie en utilisant une matrice de g\u00e9n\u00e9ration augment\u00e9e par la recherche, qui repose sur un pr\u00e9-entra\u00eenement \u00e0 grande \u00e9chelle, et qui apprend au mod\u00e8le \u00e0 identifier uniquement les informations utiles, telles que le lieu de naissance ou le lieu o\u00f9 la personne a fait ses \u00e9tudes, \u00e0 mesure qu\u2019il \u00e9labore la biographie. Le mod\u00e8le extrait d\u2019abord des informations pertinentes sur Internet pour pr\u00e9senter le sujet. Ensuite, le module de g\u00e9n\u00e9ration cr\u00e9e le texte, et la troisi\u00e8me phase, le module de citation, \u00e9tablit la bibliographie qui renvoie aux sources utilis\u00e9es. Le processus se r\u00e9p\u00e8te alors, chaque partie pr\u00e9disant celle qui suit, pour couvrir tous les aspects constitutifs d\u2019une bonne biographie Wikip\u00e9dia, notamment son enfance, sa formation et son parcours professionnel. La g\u00e9n\u00e9ration d\u2019informations se fait section par section, \u00e0 l\u2019aide d\u2019un m\u00e9canisme de mise en cache semblable \u00e0 celui de Transformer-XL, afin de renvoyer aux sections existantes et d\u2019atteindre un degr\u00e9 de contextualisation plus \u00e9lev\u00e9 au niveau du document. La mise en cache est essentielle, car elle permet au mod\u00e8le de mieux retracer ce qu\u2019il a d\u00e9j\u00e0 produit. Les \u00e9valuations automatiques et humaines montrent que le mod\u00e8le est capable de trouver des informations pertinentes et de les utiliser pour g\u00e9n\u00e9rer des biographies, mais beaucoup reste \u00e0 faire. Ces \u00e9valuations ont r\u00e9v\u00e9l\u00e9 que 68 % du texte g\u00e9n\u00e9r\u00e9 dans les biographies que nous avons cr\u00e9\u00e9es ne se trouvait pas dans le corpus de r\u00e9f\u00e9rence. Cela peut signifier plusieurs choses. On pourrait en d\u00e9duire que le mod\u00e8le r\u00e9ussit \u00e0 trouver et \u00e0 synth\u00e9tiser des informations pertinentes sans pour autant devenir un outil de plagiat. Cependant, il est \u00e9galement impr\u00e9cis : il est difficile de savoir quelles informations sont exactes et lesquelles sont erron\u00e9es. Nous avons demand\u00e9 aux \u00e9quipes d\u2019\u00e9valuation de d\u00e9terminer si des phrases compl\u00e8tes \u00e9taient conformes aux faits, et dans de nombreux cas, elles n\u2019\u00e9taient que partiellement v\u00e9rifiables. Ces difficult\u00e9s sont analogues aux d\u00e9fis rencontr\u00e9s par la g\u00e9n\u00e9ration de texte en g\u00e9n\u00e9ral, bien qu\u2019elles soient exacerb\u00e9es dans le cas des groupes marginalis\u00e9s, car il existe tr\u00e8s peu de donn\u00e9es \u00e0 leur sujet. Nous esp\u00e9rons que la diffusion de cet ensemble de donn\u00e9es permettra \u00e0 d\u2019autres sp\u00e9cialistes d\u2019\u00e9tudier ce probl\u00e8me. Nous avons rencontr\u00e9 plusieurs autres obstacles au cours de nos recherches. Tout d\u2019abord, le manque de donn\u00e9es pour entra\u00eener le moteur ou d\u2019articles biographiques existants sur les femmes s\u2019est r\u00e9v\u00e9l\u00e9 un probl\u00e8me de taille. Les articles qui portent sur les femmes, en particulier celles issues de groupes marginalis\u00e9s, sont nettement plus courts que la moyenne des articles sur les hommes, sont moins d\u00e9taill\u00e9s et utilisent un langage diff\u00e9rent. Par exemple, on lira \u00ab femme scientifique \u00bb au lieu de simplement \u00ab scientifique \u00bb. Ce biais dans les donn\u00e9es d\u2019entra\u00eenement a \u00e9t\u00e9 int\u00e9rioris\u00e9 par les mod\u00e8les. De plus, les articles de Wikip\u00e9dia doivent \u00eatre r\u00e9dig\u00e9s \u00e0 partir de sources factuelles, souvent issues du web. Cependant, le parti pris de Wikipedia vaut aussi pour Internet : il existe tr\u00e8s peu de sites web pouvant faire office de sources v\u00e9rifi\u00e9es. Les probl\u00e8mes bien ancr\u00e9s ne se r\u00e9solvent pas du jour au lendemain, mais c\u2019est exactement le type de probl\u00e9matique o\u00f9 la technologie peut \u00eatre utilis\u00e9e afin de faire \u00e9voluer les choses. Et apr\u00e8s ? Accro\u00eetre la visibilit\u00e9 des personnes sous-repr\u00e9sent\u00e9es sur Wikip\u00e9dia Nous nous r\u00e9jouissons de partager ce travail avec la communaut\u00e9 afin de stimuler les \u00e9changes, les exp\u00e9rimentations et les avanc\u00e9es qui permettront d\u2019am\u00e9liorer l\u2019\u00e9quit\u00e9 dans l\u2019offre de contenu sur Wikip\u00e9dia. Notre mod\u00e8le ne r\u00e9sout que partiellement un probl\u00e8me multidimensionnel. Il reste donc d\u2019autres domaines o\u00f9 de nouvelles technologies devraient \u00eatre \u00e9tudi\u00e9es. Lorsqu\u2019une personne contribuant \u00e0 Wikip\u00e9dia ou notre mod\u00e8le d\u2019IA compose une biographie, des informations sont tir\u00e9es du web, puis cit\u00e9es. Cependant, malgr\u00e9 toute la richesse du savoir disponible sur Internet, certaines sources pr\u00e9sentent un parti pris dont il faut tenir compte. Par exemple, lorsque les femmes sont repr\u00e9sent\u00e9es, leur biographie est plus susceptible de comporter des informations suppl\u00e9mentaires sur leur vie personnelle. Une \u00e9tude de 2015 a r\u00e9v\u00e9l\u00e9 que le mot \u00ab divorc\u00e9 \u00bb appara\u00eet quatre fois plus souvent dans les biographies des femmes que dans celles des hommes. Les raisons sont multiples, comme le fait que les tablo\u00efds ont tendance \u00e0 se concentrer davantage sur la vie des femmes c\u00e9l\u00e8bres que sur celle des hommes. Il en r\u00e9sulte que les d\u00e9tails personnels sont plus susceptibles d\u2019\u00eatre mentionn\u00e9s dans les articles sur celles-ci, ce qui a pour effet de faire oublier des r\u00e9alisations qui devraient \u00eatre mises en avant et valoris\u00e9es. La technologie a d\u00e9j\u00e0 permis de corriger certains d\u00e9s\u00e9quilibres, ce qui prouve que la communaut\u00e9 a encore une marge de man\u0153uvre pour faire bouger les lignes. Par exemple, l\u2019ancien directeur g\u00e9n\u00e9ral du site a expliqu\u00e9 comment un algorithme a d\u00e9cel\u00e9 une faille majeure. En effet, alors que les articles de Wikip\u00e9dia portant sur la sant\u00e9 sont pass\u00e9s au crible par des personnes sp\u00e9cialis\u00e9es en r\u00e9daction m\u00e9dicale, pendant des ann\u00e9es, certains articles traitant de sujets cruciaux pour la sant\u00e9 des femmes, comme l\u2019allaitement, ont \u00e9t\u00e9 class\u00e9s comme \u00e9tant de \u00ab faible importance \u00bb. Il reste encore du chemin \u00e0 parcourir pour d\u2019autres groupes marginalis\u00e9s et intersectionnels dans le monde entier et dans toutes les langues. Notre \u00e9valuation et notre ensemble de donn\u00e9es se concentrent sur les femmes, excluant ainsi de nombreux autres groupes, dont les personnes non binaires. Les articles sur les personnes transgenres et non binaires sont g\u00e9n\u00e9ralement plus longs, mais une large partie du surplus de texte est consacr\u00e9e \u00e0 leur vie personnelle au lieu de s\u2019\u00e9tendre sur leurs r\u00e9alisations, selon une \u00e9tude de 2021 qui a examin\u00e9 les biais sociaux dans les articles de Wikip\u00e9dia. Il est important de reconna\u00eetre que la partialit\u00e9 existe sous diverses formes, notamment dans les sources d\u2019information en ligne propos\u00e9es par d\u00e9faut. Nous sommes anim\u00e9s par le d\u00e9sir de faire partager ce domaine de recherche important \u00e0 l\u2019ensemble de la communaut\u00e9 des chercheurs et chercheuses dans le domaine de la g\u00e9n\u00e9ration par l\u2019IA. Nous esp\u00e9rons que nos techniques pourront \u00eatre utilis\u00e9es comme point de d\u00e9part pour les personnes qui enrichissent le contenu Wikip\u00e9dia de leurs articles, et qu\u2019elles permettront d\u2019am\u00e9liorer l\u2019\u00e9quit\u00e9 des informations en ligne accessibles aux \u00e9tudiants qui r\u00e9digent des biographies, et \u00e0 bien d\u2019autres.\u00a0","protected":false},"author":164097090,"featured_media":22988,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[243897990,243897945,243897944],"tags":[243898231,243898230,243898105,134004,243898192,243898121,243898232],"class_list":["post-22978","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualites","category-communautes","category-intelligence-artificielle","tag-biographies","tag-communautes","tag-egalite-femmes-hommes","tag-intelligence-artificielle","tag-meta-ai","tag-recherche","tag-representation"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.2 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia | \u00c0 propos de Meta<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia | \u00c0 propos de Meta\" \/>\n<meta property=\"og:description\" content=\"Wikipedia est r\u00e9guli\u00e8rement class\u00e9 parmi les 10 sites web les plus consult\u00e9s dans le monde. C\u2019est bien souvent notre premier recours lorsque nous recherchons des informations sur des personnages historiques ou des acteurs du changement. Mais tout le monde n\u2019y est pas repr\u00e9sent\u00e9 de mani\u00e8re \u00e9gale. Environ 20 % seulement des biographies sur le site en anglais concernent des femmes, selon la Fondation Wikimedia. Cette proportion est sans doute encore plus faible pour celles \u00e0 l\u2019intersection de plusieurs minorit\u00e9s, comme les scientifiques, les africaines et les asiatiques. Dans le cadre de mon projet de doctorat en informatique \u00e0 l\u2019Universit\u00e9 de Lorraine, en France, au sein de l\u2019Institut national de recherche en sciences et technologies du num\u00e9rique (INRIA), j\u2019ai travaill\u00e9 aux c\u00f4t\u00e9s de Claire Gardent, ma directrice de th\u00e8se, au d\u00e9veloppement d\u2019une nouvelle solution qui permettrait de rem\u00e9dier \u00e0 ce d\u00e9s\u00e9quilibre gr\u00e2ce \u00e0 l\u2019intelligence artificielle (IA). Nous avons cr\u00e9\u00e9 un syst\u00e8me d\u2019IA capable d\u2019effectuer des recherches et de r\u00e9diger les premi\u00e8res \u00e9bauches des articles biographiques dans le style propre \u00e0 Wikip\u00e9dia. Il reste encore du travail, mais nous esp\u00e9rons qu&rsquo;\u00e0 terme ce nouveau syst\u00e8me aidera les \u00e9diteurs et \u00e9ditrices de Wikip\u00e9dia \u00e0 cr\u00e9er des milliers d\u2019articles biographiques fiables et int\u00e9ressants sur des personnalit\u00e9s de premier plan qui ne figurent pas encore sur le site. Le sujet me tenait personnellement \u00e0 c\u0153ur : j\u2019avais observ\u00e9 le manque de repr\u00e9sentation dans les collections des biblioth\u00e8ques durant mes ann\u00e9es d\u2019\u00e9cole primaire. Quand j\u2019\u00e9tais en CE2, on m\u2019a demand\u00e9 de faire une r\u00e9daction sur un personnage historique, avec une seule contrainte : que la biblioth\u00e8que dispose de sa biographie. Je voulais \u00e9crire sur Eleanor Roosevelt, mais j\u2019ai d\u00fb me contenter de Teddy Roosevelt. Et si j\u2019avais voulu parler d\u2019une personne qui me ressemble ? Aurais-je seulement pu le faire ? Si nous imaginions le m\u00eame exercice aujourd\u2019hui, les \u00e9l\u00e8ves utiliseraient s\u00fbrement Internet, et plus probablement Wikip\u00e9dia. Alors que Wikip\u00e9dia compte des millions d\u2019articles en anglais (dont un excellent article sur Eleanor Roosevelt), nous savons qu\u2019il existe encore de nombreuses femmes dont les histoires et les accomplissements n\u2019atteignent pas la post\u00e9rit\u00e9. Alors que les femmes sont plus susceptibles d\u2019\u00e9crire des biographies \u00e0 propos d\u2019autres femmes, le Community Insights 2021 Report de Wikimedia qui porte sur l\u2019ann\u00e9e \u00e9coul\u00e9e, a r\u00e9v\u00e9l\u00e9 que seules 15 % des personnes contribuant \u00e0 Wikip\u00e9dia s&rsquo;identifient comme appartenant \u00e0 la gent f\u00e9minine. Ces derni\u00e8res sont donc oubli\u00e9es et sous-repr\u00e9sent\u00e9es, malgr\u00e9 l\u2019impact consid\u00e9rable qu\u2019elles ont eu au cours de l\u2019histoire dans les sciences, les affaires, la politique et tous les autres domaines de notre soci\u00e9t\u00e9. La physicienne canadienne Donna Strickland a remport\u00e9 le prix Nobel de physique en 2018. Cependant, les internautes cherchant des informations \u00e0 son sujet sur Wikip\u00e9dia ne les auraient pas trouv\u00e9es. Ce n\u2019est que quelques jours apr\u00e8s qu\u2019elle a remport\u00e9 le prix le plus prestigieux dans son domaine d\u2019\u00e9tude qu\u2019une biographie Wikip\u00e9dia est publi\u00e9e \u00e0 propos de ses pr\u00e9cieux travaux. Diverses \u00e9tudes, \u00e9manant notamment de la Wikimedia Foundation elle-m\u00eame, ont \u00e9galement d\u00e9nonc\u00e9 le d\u00e9s\u00e9quilibre entre les genres sur la plateforme. M\u00eame avec ce manque de repr\u00e9sentation, les biographies de femmes \u00e9taient toujours propos\u00e9es \u00e0 la suppression de fa\u00e7on disproportionn\u00e9e. En effet, une \u00e9tude a r\u00e9v\u00e9l\u00e9 qu\u2019en 2017, 41 % des biographies propos\u00e9es \u00e0 la suppression concernaient des femmes. Nous pensons qu\u2019une m\u00e9thode ouverte et reproductible peut constituer un premier pas vers la r\u00e9solution de ce probl\u00e8me. Aujourd\u2019hui, nous mettons en libre acc\u00e8s un mod\u00e8le d\u2019IA de bout en bout qui cr\u00e9e automatiquement des articles biographiques d\u2019excellente qualit\u00e9 sur des personnalit\u00e9s publiques de premier plan. Notre mod\u00e8le explore les sites web \u00e0 la recherche d\u2019informations pertinentes et r\u00e9dige un article type Wikip\u00e9dia sur cette personne, accompagn\u00e9 de r\u00e9f\u00e9rences. Nous publions \u00e9galement un nouvel ensemble de donn\u00e9es cr\u00e9\u00e9 pour \u00e9valuer les performances du mod\u00e8le sur 1 527 biographies de femmes issues de groupes marginalis\u00e9s. Cet ensemble de donn\u00e9es peut servir \u00e0 entra\u00eener des nouveaux mod\u00e8les, ainsi qu\u2019\u00e9valuer les performances du mod\u00e8le existant et le faire progresser. Nous pensons que ces entr\u00e9es g\u00e9n\u00e9r\u00e9es par l\u2019IA peuvent \u00eatre utilis\u00e9es comme point de d\u00e9part par les personnes qui r\u00e9digent le contenu de Wikip\u00e9dia et celles qui v\u00e9rifient les informations, afin de publier davantage de biographies de groupes sous-repr\u00e9sent\u00e9s sur le site. Nous avons encore tant \u00e0 faire pour diversifier la repr\u00e9sentation des personnalit\u00e9s issues de tous horizons sur Wikip\u00e9dia. Fondamentalement, les syst\u00e8mes d\u2019IA tels que celui que nous avons cr\u00e9\u00e9 devront relever des d\u00e9fis soci\u00e9taux et techniques plus vastes afin de r\u00e9soudre pleinement le probl\u00e8me. \u00c0 commencer par les contenus web utilis\u00e9s pour cr\u00e9er les articles Wikip\u00e9dia, qui sont parfois erron\u00e9s ou refl\u00e8tent nos biais culturels. D\u2019un point de vue technique, le syst\u00e8me de g\u00e9n\u00e9ration de texte peut avoir tendance \u00e0 faire appara\u00eetre des contenus non factuels. M\u00eame les meilleurs moteurs de traitement du langage peinent encore aujourd\u2019hui \u00e0 produire un texte coh\u00e9rent sur plusieurs paragraphes. Nous esp\u00e9rons les am\u00e9liorer en perfectionnant les architectures neuronales qui alimentent ces mod\u00e8les et en innovant en mati\u00e8re de d\u00e9veloppement responsable de l\u2019intelligence artificielle. \u00c0 terme, nous esp\u00e9rons que cette approche aidera des non-sp\u00e9cialistes \u00e0 produire des articles fiables pour enrichir la documentation disponible sur le web, et ce, sans n\u00e9cessiter de corrections majeures. Comment l\u2019IA peut-elle contribuer \u00e0 la lutte contre les pr\u00e9jug\u00e9s ? Notre mod\u00e8le est un grand pas en avant pour appuyer et renforcer les autres initiatives existantes qui visent \u00e0 am\u00e9liorer l\u2019\u00e9quilibre des genres sur Wikip\u00e9dia. Les \u00e9ditrices b\u00e9n\u00e9voles Jessica Wade et Penny Richards ont collabor\u00e9 en toute ind\u00e9pendance pour \u00e9crire et publier sur Wikip\u00e9dia des milliers de biographies de femmes qui m\u00e9ritent d\u2019\u00eatre mises en lumi\u00e8re. Nous pouvons \u00e9galement mentionner une autre initiative collective remarquable, le Women in Red Wiki Project, qui mobilise des \u00e9ditrices et \u00e9diteurs d\u00e9sireux de r\u00e9diger des biographies et de compl\u00e9ter celles qui existent d\u00e9j\u00e0 sur des femmes remarquables d\u2019hier et d\u2019aujourd\u2019hui. Nous avons donc opt\u00e9 pour une solution compl\u00e9mentaire. La recherche, la cr\u00e9ation d\u2019une bibliographie et la r\u00e9daction sont des t\u00e2ches complexes, mais il existe une multitude d\u2019informations disponibles sur le web pour raconter l\u2019histoire de femmes dont les accomplissements, les voix et les h\u00e9ritages ont \u00e9t\u00e9 oubli\u00e9s ou rel\u00e9gu\u00e9s au second plan. Par exemple, nous avons utilis\u00e9 notre mod\u00e8le pour g\u00e9n\u00e9rer une courte biographie de Libbie Hyman, une pionni\u00e8re dans le domaine de la zoologie des invert\u00e9br\u00e9s. Le texte vert est tir\u00e9 de l\u2019article de r\u00e9f\u00e9rence qui a servi de point de d\u00e9part, le texte violet est tir\u00e9 des informations du web, et le texte orange signale la pr\u00e9sence d\u2019\u00e9l\u00e9ments non factuels, ce qui signifie que le mod\u00e8le a invent\u00e9 des informations non v\u00e9rifiables. Le mod\u00e8le a r\u00e9cup\u00e9r\u00e9 des informations biographiques pertinentes sur Libbie Hyman, dont son int\u00e9r\u00eat pour les invert\u00e9br\u00e9s, ses publications importantes et l\u2019impact de son travail, qui peuvent ensuite \u00eatre utilis\u00e9es comme point de d\u00e9part par les \u00e9diteurs et \u00e9ditrices pour v\u00e9rifier les faits (un domaine o\u00f9 le mod\u00e8le pr\u00e9sente encore des lacunes), ainsi qu\u2019\u00e9toffer sa biographie et ses accomplissements. Utilisation du pr\u00e9-entra\u00eenement et d\u2019un mod\u00e8le de recherche pour g\u00e9n\u00e9rer des biographies sur Wikip\u00e9dia Nous commen\u00e7ons le processus de g\u00e9n\u00e9ration d\u2019une biographie en utilisant une matrice de g\u00e9n\u00e9ration augment\u00e9e par la recherche, qui repose sur un pr\u00e9-entra\u00eenement \u00e0 grande \u00e9chelle, et qui apprend au mod\u00e8le \u00e0 identifier uniquement les informations utiles, telles que le lieu de naissance ou le lieu o\u00f9 la personne a fait ses \u00e9tudes, \u00e0 mesure qu\u2019il \u00e9labore la biographie. Le mod\u00e8le extrait d\u2019abord des informations pertinentes sur Internet pour pr\u00e9senter le sujet. Ensuite, le module de g\u00e9n\u00e9ration cr\u00e9e le texte, et la troisi\u00e8me phase, le module de citation, \u00e9tablit la bibliographie qui renvoie aux sources utilis\u00e9es. Le processus se r\u00e9p\u00e8te alors, chaque partie pr\u00e9disant celle qui suit, pour couvrir tous les aspects constitutifs d\u2019une bonne biographie Wikip\u00e9dia, notamment son enfance, sa formation et son parcours professionnel. La g\u00e9n\u00e9ration d\u2019informations se fait section par section, \u00e0 l\u2019aide d\u2019un m\u00e9canisme de mise en cache semblable \u00e0 celui de Transformer-XL, afin de renvoyer aux sections existantes et d\u2019atteindre un degr\u00e9 de contextualisation plus \u00e9lev\u00e9 au niveau du document. La mise en cache est essentielle, car elle permet au mod\u00e8le de mieux retracer ce qu\u2019il a d\u00e9j\u00e0 produit. Les \u00e9valuations automatiques et humaines montrent que le mod\u00e8le est capable de trouver des informations pertinentes et de les utiliser pour g\u00e9n\u00e9rer des biographies, mais beaucoup reste \u00e0 faire. Ces \u00e9valuations ont r\u00e9v\u00e9l\u00e9 que 68 % du texte g\u00e9n\u00e9r\u00e9 dans les biographies que nous avons cr\u00e9\u00e9es ne se trouvait pas dans le corpus de r\u00e9f\u00e9rence. Cela peut signifier plusieurs choses. On pourrait en d\u00e9duire que le mod\u00e8le r\u00e9ussit \u00e0 trouver et \u00e0 synth\u00e9tiser des informations pertinentes sans pour autant devenir un outil de plagiat. Cependant, il est \u00e9galement impr\u00e9cis : il est difficile de savoir quelles informations sont exactes et lesquelles sont erron\u00e9es. Nous avons demand\u00e9 aux \u00e9quipes d\u2019\u00e9valuation de d\u00e9terminer si des phrases compl\u00e8tes \u00e9taient conformes aux faits, et dans de nombreux cas, elles n\u2019\u00e9taient que partiellement v\u00e9rifiables. Ces difficult\u00e9s sont analogues aux d\u00e9fis rencontr\u00e9s par la g\u00e9n\u00e9ration de texte en g\u00e9n\u00e9ral, bien qu\u2019elles soient exacerb\u00e9es dans le cas des groupes marginalis\u00e9s, car il existe tr\u00e8s peu de donn\u00e9es \u00e0 leur sujet. Nous esp\u00e9rons que la diffusion de cet ensemble de donn\u00e9es permettra \u00e0 d\u2019autres sp\u00e9cialistes d\u2019\u00e9tudier ce probl\u00e8me. Nous avons rencontr\u00e9 plusieurs autres obstacles au cours de nos recherches. Tout d\u2019abord, le manque de donn\u00e9es pour entra\u00eener le moteur ou d\u2019articles biographiques existants sur les femmes s\u2019est r\u00e9v\u00e9l\u00e9 un probl\u00e8me de taille. Les articles qui portent sur les femmes, en particulier celles issues de groupes marginalis\u00e9s, sont nettement plus courts que la moyenne des articles sur les hommes, sont moins d\u00e9taill\u00e9s et utilisent un langage diff\u00e9rent. Par exemple, on lira \u00ab femme scientifique \u00bb au lieu de simplement \u00ab scientifique \u00bb. Ce biais dans les donn\u00e9es d\u2019entra\u00eenement a \u00e9t\u00e9 int\u00e9rioris\u00e9 par les mod\u00e8les. De plus, les articles de Wikip\u00e9dia doivent \u00eatre r\u00e9dig\u00e9s \u00e0 partir de sources factuelles, souvent issues du web. Cependant, le parti pris de Wikipedia vaut aussi pour Internet : il existe tr\u00e8s peu de sites web pouvant faire office de sources v\u00e9rifi\u00e9es. Les probl\u00e8mes bien ancr\u00e9s ne se r\u00e9solvent pas du jour au lendemain, mais c\u2019est exactement le type de probl\u00e9matique o\u00f9 la technologie peut \u00eatre utilis\u00e9e afin de faire \u00e9voluer les choses. Et apr\u00e8s ? Accro\u00eetre la visibilit\u00e9 des personnes sous-repr\u00e9sent\u00e9es sur Wikip\u00e9dia Nous nous r\u00e9jouissons de partager ce travail avec la communaut\u00e9 afin de stimuler les \u00e9changes, les exp\u00e9rimentations et les avanc\u00e9es qui permettront d\u2019am\u00e9liorer l\u2019\u00e9quit\u00e9 dans l\u2019offre de contenu sur Wikip\u00e9dia. Notre mod\u00e8le ne r\u00e9sout que partiellement un probl\u00e8me multidimensionnel. Il reste donc d\u2019autres domaines o\u00f9 de nouvelles technologies devraient \u00eatre \u00e9tudi\u00e9es. Lorsqu\u2019une personne contribuant \u00e0 Wikip\u00e9dia ou notre mod\u00e8le d\u2019IA compose une biographie, des informations sont tir\u00e9es du web, puis cit\u00e9es. Cependant, malgr\u00e9 toute la richesse du savoir disponible sur Internet, certaines sources pr\u00e9sentent un parti pris dont il faut tenir compte. Par exemple, lorsque les femmes sont repr\u00e9sent\u00e9es, leur biographie est plus susceptible de comporter des informations suppl\u00e9mentaires sur leur vie personnelle. Une \u00e9tude de 2015 a r\u00e9v\u00e9l\u00e9 que le mot \u00ab divorc\u00e9 \u00bb appara\u00eet quatre fois plus souvent dans les biographies des femmes que dans celles des hommes. Les raisons sont multiples, comme le fait que les tablo\u00efds ont tendance \u00e0 se concentrer davantage sur la vie des femmes c\u00e9l\u00e8bres que sur celle des hommes. Il en r\u00e9sulte que les d\u00e9tails personnels sont plus susceptibles d\u2019\u00eatre mentionn\u00e9s dans les articles sur celles-ci, ce qui a pour effet de faire oublier des r\u00e9alisations qui devraient \u00eatre mises en avant et valoris\u00e9es. La technologie a d\u00e9j\u00e0 permis de corriger certains d\u00e9s\u00e9quilibres, ce qui prouve que la communaut\u00e9 a encore une marge de man\u0153uvre pour faire bouger les lignes. Par exemple, l\u2019ancien directeur g\u00e9n\u00e9ral du site a expliqu\u00e9 comment un algorithme a d\u00e9cel\u00e9 une faille majeure. En effet, alors que les articles de Wikip\u00e9dia portant sur la sant\u00e9 sont pass\u00e9s au crible par des personnes sp\u00e9cialis\u00e9es en r\u00e9daction m\u00e9dicale, pendant des ann\u00e9es, certains articles traitant de sujets cruciaux pour la sant\u00e9 des femmes, comme l\u2019allaitement, ont \u00e9t\u00e9 class\u00e9s comme \u00e9tant de \u00ab faible importance \u00bb. Il reste encore du chemin \u00e0 parcourir pour d\u2019autres groupes marginalis\u00e9s et intersectionnels dans le monde entier et dans toutes les langues. Notre \u00e9valuation et notre ensemble de donn\u00e9es se concentrent sur les femmes, excluant ainsi de nombreux autres groupes, dont les personnes non binaires. Les articles sur les personnes transgenres et non binaires sont g\u00e9n\u00e9ralement plus longs, mais une large partie du surplus de texte est consacr\u00e9e \u00e0 leur vie personnelle au lieu de s\u2019\u00e9tendre sur leurs r\u00e9alisations, selon une \u00e9tude de 2021 qui a examin\u00e9 les biais sociaux dans les articles de Wikip\u00e9dia. Il est important de reconna\u00eetre que la partialit\u00e9 existe sous diverses formes, notamment dans les sources d\u2019information en ligne propos\u00e9es par d\u00e9faut. Nous sommes anim\u00e9s par le d\u00e9sir de faire partager ce domaine de recherche important \u00e0 l\u2019ensemble de la communaut\u00e9 des chercheurs et chercheuses dans le domaine de la g\u00e9n\u00e9ration par l\u2019IA. Nous esp\u00e9rons que nos techniques pourront \u00eatre utilis\u00e9es comme point de d\u00e9part pour les personnes qui enrichissent le contenu Wikip\u00e9dia de leurs articles, et qu\u2019elles permettront d\u2019am\u00e9liorer l\u2019\u00e9quit\u00e9 des informations en ligne accessibles aux \u00e9tudiants qui r\u00e9digent des biographies, et \u00e0 bien d\u2019autres.\u00a0\" \/>\n<meta property=\"og:url\" content=\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/\" \/>\n<meta property=\"og:site_name\" content=\"\u00c0 propos de Meta\" \/>\n<meta property=\"article:published_time\" content=\"2022-03-30T13:30:02+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-03-30T13:42:08+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=960%2C542\" \/>\n\t<meta property=\"og:image:width\" content=\"960\" \/>\n\t<meta property=\"og:image:height\" content=\"542\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"hopscotch\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@METAfrance\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Meta\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"11 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/\"},\"author\":\"Facebook company\",\"headline\":\"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia\",\"datePublished\":\"2022-03-30T13:30:02+00:00\",\"dateModified\":\"2022-03-30T13:42:08+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/\"},\"wordCount\":2558,\"publisher\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#organization\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=1004%2C567\",\"keywords\":[\"Biographies\",\"Communaut\u00e9s\",\"Egalit\u00e9 femmes hommes\",\"intelligence artificielle\",\"Meta AI\",\"recherche\",\"Repr\u00e9sentation\"],\"articleSection\":[\"Actualit\u00e9s\",\"Communaut\u00e9s\",\"Intelligence Artificielle\"],\"inLanguage\":\"fr-FR\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/\",\"url\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/\",\"name\":\"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia | \u00c0 propos de Meta\",\"isPartOf\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=1004%2C567\",\"datePublished\":\"2022-03-30T13:30:02+00:00\",\"dateModified\":\"2022-03-30T13:42:08+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/\"]}],\"author\":\"\u00c0 propos de Meta\"},{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#primaryimage\",\"url\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=1004%2C567\",\"contentUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=1004%2C567\",\"width\":1004,\"height\":567},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/about.fb.com\/fr\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/about.fb.com\/fr\/#website\",\"url\":\"https:\/\/about.fb.com\/news\/\",\"name\":\"\u00c0 propos de Meta\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/about.fb.com\/fr\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\",\"alternateName\":[\"Meta Newsroom\",\"Meta\"]},{\"@type\":\"Organization\",\"@id\":\"https:\/\/about.fb.com\/fr\/#organization\",\"name\":\"Meta\",\"url\":\"https:\/\/about.fb.com\/fr\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500\",\"contentUrl\":\"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500\",\"width\":8000,\"height\":4500,\"caption\":\"Meta\"},\"image\":{\"@id\":\"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/\"}}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia | \u00c0 propos de Meta","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/","og_locale":"fr_FR","og_type":"article","og_title":"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia | \u00c0 propos de Meta","og_description":"Wikipedia est r\u00e9guli\u00e8rement class\u00e9 parmi les 10 sites web les plus consult\u00e9s dans le monde. C\u2019est bien souvent notre premier recours lorsque nous recherchons des informations sur des personnages historiques ou des acteurs du changement. Mais tout le monde n\u2019y est pas repr\u00e9sent\u00e9 de mani\u00e8re \u00e9gale. Environ 20 % seulement des biographies sur le site en anglais concernent des femmes, selon la Fondation Wikimedia. Cette proportion est sans doute encore plus faible pour celles \u00e0 l\u2019intersection de plusieurs minorit\u00e9s, comme les scientifiques, les africaines et les asiatiques. Dans le cadre de mon projet de doctorat en informatique \u00e0 l\u2019Universit\u00e9 de Lorraine, en France, au sein de l\u2019Institut national de recherche en sciences et technologies du num\u00e9rique (INRIA), j\u2019ai travaill\u00e9 aux c\u00f4t\u00e9s de Claire Gardent, ma directrice de th\u00e8se, au d\u00e9veloppement d\u2019une nouvelle solution qui permettrait de rem\u00e9dier \u00e0 ce d\u00e9s\u00e9quilibre gr\u00e2ce \u00e0 l\u2019intelligence artificielle (IA). Nous avons cr\u00e9\u00e9 un syst\u00e8me d\u2019IA capable d\u2019effectuer des recherches et de r\u00e9diger les premi\u00e8res \u00e9bauches des articles biographiques dans le style propre \u00e0 Wikip\u00e9dia. Il reste encore du travail, mais nous esp\u00e9rons qu&rsquo;\u00e0 terme ce nouveau syst\u00e8me aidera les \u00e9diteurs et \u00e9ditrices de Wikip\u00e9dia \u00e0 cr\u00e9er des milliers d\u2019articles biographiques fiables et int\u00e9ressants sur des personnalit\u00e9s de premier plan qui ne figurent pas encore sur le site. Le sujet me tenait personnellement \u00e0 c\u0153ur : j\u2019avais observ\u00e9 le manque de repr\u00e9sentation dans les collections des biblioth\u00e8ques durant mes ann\u00e9es d\u2019\u00e9cole primaire. Quand j\u2019\u00e9tais en CE2, on m\u2019a demand\u00e9 de faire une r\u00e9daction sur un personnage historique, avec une seule contrainte : que la biblioth\u00e8que dispose de sa biographie. Je voulais \u00e9crire sur Eleanor Roosevelt, mais j\u2019ai d\u00fb me contenter de Teddy Roosevelt. Et si j\u2019avais voulu parler d\u2019une personne qui me ressemble ? Aurais-je seulement pu le faire ? Si nous imaginions le m\u00eame exercice aujourd\u2019hui, les \u00e9l\u00e8ves utiliseraient s\u00fbrement Internet, et plus probablement Wikip\u00e9dia. Alors que Wikip\u00e9dia compte des millions d\u2019articles en anglais (dont un excellent article sur Eleanor Roosevelt), nous savons qu\u2019il existe encore de nombreuses femmes dont les histoires et les accomplissements n\u2019atteignent pas la post\u00e9rit\u00e9. Alors que les femmes sont plus susceptibles d\u2019\u00e9crire des biographies \u00e0 propos d\u2019autres femmes, le Community Insights 2021 Report de Wikimedia qui porte sur l\u2019ann\u00e9e \u00e9coul\u00e9e, a r\u00e9v\u00e9l\u00e9 que seules 15 % des personnes contribuant \u00e0 Wikip\u00e9dia s&rsquo;identifient comme appartenant \u00e0 la gent f\u00e9minine. Ces derni\u00e8res sont donc oubli\u00e9es et sous-repr\u00e9sent\u00e9es, malgr\u00e9 l\u2019impact consid\u00e9rable qu\u2019elles ont eu au cours de l\u2019histoire dans les sciences, les affaires, la politique et tous les autres domaines de notre soci\u00e9t\u00e9. La physicienne canadienne Donna Strickland a remport\u00e9 le prix Nobel de physique en 2018. Cependant, les internautes cherchant des informations \u00e0 son sujet sur Wikip\u00e9dia ne les auraient pas trouv\u00e9es. Ce n\u2019est que quelques jours apr\u00e8s qu\u2019elle a remport\u00e9 le prix le plus prestigieux dans son domaine d\u2019\u00e9tude qu\u2019une biographie Wikip\u00e9dia est publi\u00e9e \u00e0 propos de ses pr\u00e9cieux travaux. Diverses \u00e9tudes, \u00e9manant notamment de la Wikimedia Foundation elle-m\u00eame, ont \u00e9galement d\u00e9nonc\u00e9 le d\u00e9s\u00e9quilibre entre les genres sur la plateforme. M\u00eame avec ce manque de repr\u00e9sentation, les biographies de femmes \u00e9taient toujours propos\u00e9es \u00e0 la suppression de fa\u00e7on disproportionn\u00e9e. En effet, une \u00e9tude a r\u00e9v\u00e9l\u00e9 qu\u2019en 2017, 41 % des biographies propos\u00e9es \u00e0 la suppression concernaient des femmes. Nous pensons qu\u2019une m\u00e9thode ouverte et reproductible peut constituer un premier pas vers la r\u00e9solution de ce probl\u00e8me. Aujourd\u2019hui, nous mettons en libre acc\u00e8s un mod\u00e8le d\u2019IA de bout en bout qui cr\u00e9e automatiquement des articles biographiques d\u2019excellente qualit\u00e9 sur des personnalit\u00e9s publiques de premier plan. Notre mod\u00e8le explore les sites web \u00e0 la recherche d\u2019informations pertinentes et r\u00e9dige un article type Wikip\u00e9dia sur cette personne, accompagn\u00e9 de r\u00e9f\u00e9rences. Nous publions \u00e9galement un nouvel ensemble de donn\u00e9es cr\u00e9\u00e9 pour \u00e9valuer les performances du mod\u00e8le sur 1 527 biographies de femmes issues de groupes marginalis\u00e9s. Cet ensemble de donn\u00e9es peut servir \u00e0 entra\u00eener des nouveaux mod\u00e8les, ainsi qu\u2019\u00e9valuer les performances du mod\u00e8le existant et le faire progresser. Nous pensons que ces entr\u00e9es g\u00e9n\u00e9r\u00e9es par l\u2019IA peuvent \u00eatre utilis\u00e9es comme point de d\u00e9part par les personnes qui r\u00e9digent le contenu de Wikip\u00e9dia et celles qui v\u00e9rifient les informations, afin de publier davantage de biographies de groupes sous-repr\u00e9sent\u00e9s sur le site. Nous avons encore tant \u00e0 faire pour diversifier la repr\u00e9sentation des personnalit\u00e9s issues de tous horizons sur Wikip\u00e9dia. Fondamentalement, les syst\u00e8mes d\u2019IA tels que celui que nous avons cr\u00e9\u00e9 devront relever des d\u00e9fis soci\u00e9taux et techniques plus vastes afin de r\u00e9soudre pleinement le probl\u00e8me. \u00c0 commencer par les contenus web utilis\u00e9s pour cr\u00e9er les articles Wikip\u00e9dia, qui sont parfois erron\u00e9s ou refl\u00e8tent nos biais culturels. D\u2019un point de vue technique, le syst\u00e8me de g\u00e9n\u00e9ration de texte peut avoir tendance \u00e0 faire appara\u00eetre des contenus non factuels. M\u00eame les meilleurs moteurs de traitement du langage peinent encore aujourd\u2019hui \u00e0 produire un texte coh\u00e9rent sur plusieurs paragraphes. Nous esp\u00e9rons les am\u00e9liorer en perfectionnant les architectures neuronales qui alimentent ces mod\u00e8les et en innovant en mati\u00e8re de d\u00e9veloppement responsable de l\u2019intelligence artificielle. \u00c0 terme, nous esp\u00e9rons que cette approche aidera des non-sp\u00e9cialistes \u00e0 produire des articles fiables pour enrichir la documentation disponible sur le web, et ce, sans n\u00e9cessiter de corrections majeures. Comment l\u2019IA peut-elle contribuer \u00e0 la lutte contre les pr\u00e9jug\u00e9s ? Notre mod\u00e8le est un grand pas en avant pour appuyer et renforcer les autres initiatives existantes qui visent \u00e0 am\u00e9liorer l\u2019\u00e9quilibre des genres sur Wikip\u00e9dia. Les \u00e9ditrices b\u00e9n\u00e9voles Jessica Wade et Penny Richards ont collabor\u00e9 en toute ind\u00e9pendance pour \u00e9crire et publier sur Wikip\u00e9dia des milliers de biographies de femmes qui m\u00e9ritent d\u2019\u00eatre mises en lumi\u00e8re. Nous pouvons \u00e9galement mentionner une autre initiative collective remarquable, le Women in Red Wiki Project, qui mobilise des \u00e9ditrices et \u00e9diteurs d\u00e9sireux de r\u00e9diger des biographies et de compl\u00e9ter celles qui existent d\u00e9j\u00e0 sur des femmes remarquables d\u2019hier et d\u2019aujourd\u2019hui. Nous avons donc opt\u00e9 pour une solution compl\u00e9mentaire. La recherche, la cr\u00e9ation d\u2019une bibliographie et la r\u00e9daction sont des t\u00e2ches complexes, mais il existe une multitude d\u2019informations disponibles sur le web pour raconter l\u2019histoire de femmes dont les accomplissements, les voix et les h\u00e9ritages ont \u00e9t\u00e9 oubli\u00e9s ou rel\u00e9gu\u00e9s au second plan. Par exemple, nous avons utilis\u00e9 notre mod\u00e8le pour g\u00e9n\u00e9rer une courte biographie de Libbie Hyman, une pionni\u00e8re dans le domaine de la zoologie des invert\u00e9br\u00e9s. Le texte vert est tir\u00e9 de l\u2019article de r\u00e9f\u00e9rence qui a servi de point de d\u00e9part, le texte violet est tir\u00e9 des informations du web, et le texte orange signale la pr\u00e9sence d\u2019\u00e9l\u00e9ments non factuels, ce qui signifie que le mod\u00e8le a invent\u00e9 des informations non v\u00e9rifiables. Le mod\u00e8le a r\u00e9cup\u00e9r\u00e9 des informations biographiques pertinentes sur Libbie Hyman, dont son int\u00e9r\u00eat pour les invert\u00e9br\u00e9s, ses publications importantes et l\u2019impact de son travail, qui peuvent ensuite \u00eatre utilis\u00e9es comme point de d\u00e9part par les \u00e9diteurs et \u00e9ditrices pour v\u00e9rifier les faits (un domaine o\u00f9 le mod\u00e8le pr\u00e9sente encore des lacunes), ainsi qu\u2019\u00e9toffer sa biographie et ses accomplissements. Utilisation du pr\u00e9-entra\u00eenement et d\u2019un mod\u00e8le de recherche pour g\u00e9n\u00e9rer des biographies sur Wikip\u00e9dia Nous commen\u00e7ons le processus de g\u00e9n\u00e9ration d\u2019une biographie en utilisant une matrice de g\u00e9n\u00e9ration augment\u00e9e par la recherche, qui repose sur un pr\u00e9-entra\u00eenement \u00e0 grande \u00e9chelle, et qui apprend au mod\u00e8le \u00e0 identifier uniquement les informations utiles, telles que le lieu de naissance ou le lieu o\u00f9 la personne a fait ses \u00e9tudes, \u00e0 mesure qu\u2019il \u00e9labore la biographie. Le mod\u00e8le extrait d\u2019abord des informations pertinentes sur Internet pour pr\u00e9senter le sujet. Ensuite, le module de g\u00e9n\u00e9ration cr\u00e9e le texte, et la troisi\u00e8me phase, le module de citation, \u00e9tablit la bibliographie qui renvoie aux sources utilis\u00e9es. Le processus se r\u00e9p\u00e8te alors, chaque partie pr\u00e9disant celle qui suit, pour couvrir tous les aspects constitutifs d\u2019une bonne biographie Wikip\u00e9dia, notamment son enfance, sa formation et son parcours professionnel. La g\u00e9n\u00e9ration d\u2019informations se fait section par section, \u00e0 l\u2019aide d\u2019un m\u00e9canisme de mise en cache semblable \u00e0 celui de Transformer-XL, afin de renvoyer aux sections existantes et d\u2019atteindre un degr\u00e9 de contextualisation plus \u00e9lev\u00e9 au niveau du document. La mise en cache est essentielle, car elle permet au mod\u00e8le de mieux retracer ce qu\u2019il a d\u00e9j\u00e0 produit. Les \u00e9valuations automatiques et humaines montrent que le mod\u00e8le est capable de trouver des informations pertinentes et de les utiliser pour g\u00e9n\u00e9rer des biographies, mais beaucoup reste \u00e0 faire. Ces \u00e9valuations ont r\u00e9v\u00e9l\u00e9 que 68 % du texte g\u00e9n\u00e9r\u00e9 dans les biographies que nous avons cr\u00e9\u00e9es ne se trouvait pas dans le corpus de r\u00e9f\u00e9rence. Cela peut signifier plusieurs choses. On pourrait en d\u00e9duire que le mod\u00e8le r\u00e9ussit \u00e0 trouver et \u00e0 synth\u00e9tiser des informations pertinentes sans pour autant devenir un outil de plagiat. Cependant, il est \u00e9galement impr\u00e9cis : il est difficile de savoir quelles informations sont exactes et lesquelles sont erron\u00e9es. Nous avons demand\u00e9 aux \u00e9quipes d\u2019\u00e9valuation de d\u00e9terminer si des phrases compl\u00e8tes \u00e9taient conformes aux faits, et dans de nombreux cas, elles n\u2019\u00e9taient que partiellement v\u00e9rifiables. Ces difficult\u00e9s sont analogues aux d\u00e9fis rencontr\u00e9s par la g\u00e9n\u00e9ration de texte en g\u00e9n\u00e9ral, bien qu\u2019elles soient exacerb\u00e9es dans le cas des groupes marginalis\u00e9s, car il existe tr\u00e8s peu de donn\u00e9es \u00e0 leur sujet. Nous esp\u00e9rons que la diffusion de cet ensemble de donn\u00e9es permettra \u00e0 d\u2019autres sp\u00e9cialistes d\u2019\u00e9tudier ce probl\u00e8me. Nous avons rencontr\u00e9 plusieurs autres obstacles au cours de nos recherches. Tout d\u2019abord, le manque de donn\u00e9es pour entra\u00eener le moteur ou d\u2019articles biographiques existants sur les femmes s\u2019est r\u00e9v\u00e9l\u00e9 un probl\u00e8me de taille. Les articles qui portent sur les femmes, en particulier celles issues de groupes marginalis\u00e9s, sont nettement plus courts que la moyenne des articles sur les hommes, sont moins d\u00e9taill\u00e9s et utilisent un langage diff\u00e9rent. Par exemple, on lira \u00ab femme scientifique \u00bb au lieu de simplement \u00ab scientifique \u00bb. Ce biais dans les donn\u00e9es d\u2019entra\u00eenement a \u00e9t\u00e9 int\u00e9rioris\u00e9 par les mod\u00e8les. De plus, les articles de Wikip\u00e9dia doivent \u00eatre r\u00e9dig\u00e9s \u00e0 partir de sources factuelles, souvent issues du web. Cependant, le parti pris de Wikipedia vaut aussi pour Internet : il existe tr\u00e8s peu de sites web pouvant faire office de sources v\u00e9rifi\u00e9es. Les probl\u00e8mes bien ancr\u00e9s ne se r\u00e9solvent pas du jour au lendemain, mais c\u2019est exactement le type de probl\u00e9matique o\u00f9 la technologie peut \u00eatre utilis\u00e9e afin de faire \u00e9voluer les choses. Et apr\u00e8s ? Accro\u00eetre la visibilit\u00e9 des personnes sous-repr\u00e9sent\u00e9es sur Wikip\u00e9dia Nous nous r\u00e9jouissons de partager ce travail avec la communaut\u00e9 afin de stimuler les \u00e9changes, les exp\u00e9rimentations et les avanc\u00e9es qui permettront d\u2019am\u00e9liorer l\u2019\u00e9quit\u00e9 dans l\u2019offre de contenu sur Wikip\u00e9dia. Notre mod\u00e8le ne r\u00e9sout que partiellement un probl\u00e8me multidimensionnel. Il reste donc d\u2019autres domaines o\u00f9 de nouvelles technologies devraient \u00eatre \u00e9tudi\u00e9es. Lorsqu\u2019une personne contribuant \u00e0 Wikip\u00e9dia ou notre mod\u00e8le d\u2019IA compose une biographie, des informations sont tir\u00e9es du web, puis cit\u00e9es. Cependant, malgr\u00e9 toute la richesse du savoir disponible sur Internet, certaines sources pr\u00e9sentent un parti pris dont il faut tenir compte. Par exemple, lorsque les femmes sont repr\u00e9sent\u00e9es, leur biographie est plus susceptible de comporter des informations suppl\u00e9mentaires sur leur vie personnelle. Une \u00e9tude de 2015 a r\u00e9v\u00e9l\u00e9 que le mot \u00ab divorc\u00e9 \u00bb appara\u00eet quatre fois plus souvent dans les biographies des femmes que dans celles des hommes. Les raisons sont multiples, comme le fait que les tablo\u00efds ont tendance \u00e0 se concentrer davantage sur la vie des femmes c\u00e9l\u00e8bres que sur celle des hommes. Il en r\u00e9sulte que les d\u00e9tails personnels sont plus susceptibles d\u2019\u00eatre mentionn\u00e9s dans les articles sur celles-ci, ce qui a pour effet de faire oublier des r\u00e9alisations qui devraient \u00eatre mises en avant et valoris\u00e9es. La technologie a d\u00e9j\u00e0 permis de corriger certains d\u00e9s\u00e9quilibres, ce qui prouve que la communaut\u00e9 a encore une marge de man\u0153uvre pour faire bouger les lignes. Par exemple, l\u2019ancien directeur g\u00e9n\u00e9ral du site a expliqu\u00e9 comment un algorithme a d\u00e9cel\u00e9 une faille majeure. En effet, alors que les articles de Wikip\u00e9dia portant sur la sant\u00e9 sont pass\u00e9s au crible par des personnes sp\u00e9cialis\u00e9es en r\u00e9daction m\u00e9dicale, pendant des ann\u00e9es, certains articles traitant de sujets cruciaux pour la sant\u00e9 des femmes, comme l\u2019allaitement, ont \u00e9t\u00e9 class\u00e9s comme \u00e9tant de \u00ab faible importance \u00bb. Il reste encore du chemin \u00e0 parcourir pour d\u2019autres groupes marginalis\u00e9s et intersectionnels dans le monde entier et dans toutes les langues. Notre \u00e9valuation et notre ensemble de donn\u00e9es se concentrent sur les femmes, excluant ainsi de nombreux autres groupes, dont les personnes non binaires. Les articles sur les personnes transgenres et non binaires sont g\u00e9n\u00e9ralement plus longs, mais une large partie du surplus de texte est consacr\u00e9e \u00e0 leur vie personnelle au lieu de s\u2019\u00e9tendre sur leurs r\u00e9alisations, selon une \u00e9tude de 2021 qui a examin\u00e9 les biais sociaux dans les articles de Wikip\u00e9dia. Il est important de reconna\u00eetre que la partialit\u00e9 existe sous diverses formes, notamment dans les sources d\u2019information en ligne propos\u00e9es par d\u00e9faut. Nous sommes anim\u00e9s par le d\u00e9sir de faire partager ce domaine de recherche important \u00e0 l\u2019ensemble de la communaut\u00e9 des chercheurs et chercheuses dans le domaine de la g\u00e9n\u00e9ration par l\u2019IA. Nous esp\u00e9rons que nos techniques pourront \u00eatre utilis\u00e9es comme point de d\u00e9part pour les personnes qui enrichissent le contenu Wikip\u00e9dia de leurs articles, et qu\u2019elles permettront d\u2019am\u00e9liorer l\u2019\u00e9quit\u00e9 des informations en ligne accessibles aux \u00e9tudiants qui r\u00e9digent des biographies, et \u00e0 bien d\u2019autres.\u00a0","og_url":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/","og_site_name":"\u00c0 propos de Meta","article_published_time":"2022-03-30T13:30:02+00:00","article_modified_time":"2022-03-30T13:42:08+00:00","og_image":[{"url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=960%2C542","width":960,"height":542,"type":"image\/png"}],"author":"hopscotch","twitter_card":"summary_large_image","twitter_creator":"@METAfrance","twitter_misc":{"Written by":"Meta","Est. reading time":"11 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#article","isPartOf":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/"},"author":"Facebook company","headline":"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia","datePublished":"2022-03-30T13:30:02+00:00","dateModified":"2022-03-30T13:42:08+00:00","mainEntityOfPage":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/"},"wordCount":2558,"publisher":{"@id":"https:\/\/about.fb.com\/fr\/#organization"},"image":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#primaryimage"},"thumbnailUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=1004%2C567","keywords":["Biographies","Communaut\u00e9s","Egalit\u00e9 femmes hommes","intelligence artificielle","Meta AI","recherche","Repr\u00e9sentation"],"articleSection":["Actualit\u00e9s","Communaut\u00e9s","Intelligence Artificielle"],"inLanguage":"fr-FR"},{"@type":"WebPage","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/","url":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/","name":"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia | \u00c0 propos de Meta","isPartOf":{"@id":"https:\/\/about.fb.com\/fr\/#website"},"primaryImageOfPage":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#primaryimage"},"image":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#primaryimage"},"thumbnailUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=1004%2C567","datePublished":"2022-03-30T13:30:02+00:00","dateModified":"2022-03-30T13:42:08+00:00","breadcrumb":{"@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/"]}],"author":"\u00c0 propos de Meta"},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#primaryimage","url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=1004%2C567","contentUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=1004%2C567","width":1004,"height":567},{"@type":"BreadcrumbList","@id":"https:\/\/about.fb.com\/fr\/news\/2022\/03\/noublions-pas-leurs-histoires-lintelligence-artificielle-au-service-dun-contenu-biographique-plus-inclusif-sur-wikipedia\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/about.fb.com\/fr\/"},{"@type":"ListItem","position":2,"name":"N\u2019oublions pas leurs histoires : l\u2019intelligence artificielle au service d\u2019un contenu biographique plus inclusif sur Wikip\u00e9dia"}]},{"@type":"WebSite","@id":"https:\/\/about.fb.com\/fr\/#website","url":"https:\/\/about.fb.com\/news\/","name":"\u00c0 propos de Meta","description":"","publisher":{"@id":"https:\/\/about.fb.com\/fr\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/about.fb.com\/fr\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR","alternateName":["Meta Newsroom","Meta"]},{"@type":"Organization","@id":"https:\/\/about.fb.com\/fr\/#organization","name":"Meta","url":"https:\/\/about.fb.com\/fr\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/","url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500","contentUrl":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2021\/10\/meta-social-16x9-1.jpg?fit=8000%2C4500","width":8000,"height":4500,"caption":"Meta"},"image":{"@id":"https:\/\/about.fb.com\/fr\/#\/schema\/logo\/image\/"}}]}},"jetpack_featured_media_url":"https:\/\/about.fb.com\/fr\/wp-content\/uploads\/sites\/12\/2022\/03\/wiki-1.png?fit=1004%2C567","jetpack-related-posts":[],"jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts\/22978","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/users\/164097090"}],"replies":[{"embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/comments?post=22978"}],"version-history":[{"count":4,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts\/22978\/revisions"}],"predecessor-version":[{"id":22993,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/posts\/22978\/revisions\/22993"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/media\/22988"}],"wp:attachment":[{"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/media?parent=22978"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/categories?post=22978"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/about.fb.com\/fr\/wp-json\/wp\/v2\/tags?post=22978"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}