

{"id":582,"date":"2019-04-07T16:42:09","date_gmt":"2019-04-07T14:42:09","guid":{"rendered":"https:\/\/project.inria.fr\/emergences\/?p=582"},"modified":"2021-03-03T16:42:30","modified_gmt":"2021-03-03T15:42:30","slug":"plus-de-transparence-pour-les-algorithmes-de-recommandation","status":"publish","type":"post","link":"https:\/\/project.inria.fr\/emergences\/plus-de-transparence-pour-les-algorithmes-de-recommandation\/","title":{"rendered":"Plus de transparence pour les algorithmes de recommandation"},"content":{"rendered":"<p><strong><span style=\"font-size: 12pt;\">Les internautes surfent de liens en liens au fil de recommandations de plus en plus personnalis\u00e9es. Mais les crit\u00e8res qui r\u00e9gissent ces suggestions sont opaques et inaccessibles. Apr\u00e8s neuf ans pass\u00e9s chez Technicolor, le chercheur Erwan Le Merrer rejoint l&rsquo;\u00e9quipe Wide* au centre Inria de Rennes avec un projet dans ses cartons : cr\u00e9er un instrument pour mesurer, de l&rsquo;ext\u00e9rieur, les crit\u00e8res de recommandation employ\u00e9s par les \u00e9diteurs Internet et donner aux utilisateurs une meilleure compr\u00e9hension des m\u00e9canismes \u00e0 l&rsquo;\u0153uvre.<\/span><\/strong><\/p>\n<hr \/>\n<p>&nbsp;<\/p>\n<div id=\"attachment_583\" style=\"width: 5194px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/nordwood-themes-8LfE0Lywyak-unsplash.jpg\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-583\" class=\"size-full wp-image-583\" src=\"https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/nordwood-themes-8LfE0Lywyak-unsplash.jpg\" alt=\"\" width=\"5184\" height=\"3456\" srcset=\"https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/nordwood-themes-8LfE0Lywyak-unsplash.jpg 5184w, https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/nordwood-themes-8LfE0Lywyak-unsplash-300x200.jpg 300w, https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/nordwood-themes-8LfE0Lywyak-unsplash-768x512.jpg 768w, https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/nordwood-themes-8LfE0Lywyak-unsplash-1024x683.jpg 1024w, https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/nordwood-themes-8LfE0Lywyak-unsplash-600x400.jpg 600w, https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/nordwood-themes-8LfE0Lywyak-unsplash-150x100.jpg 150w, https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/nordwood-themes-8LfE0Lywyak-unsplash-1320x880.jpg 1320w\" sizes=\"auto, (max-width: 5184px) 100vw, 5184px\" \/><\/a><p id=\"caption-attachment-583\" class=\"wp-caption-text\">Photo by NordWood Themes<\/p><\/div>\n<p>En grec ancien, Panopt\u00e8s signifie <em>\u201ccelui qui voit tout\u201d<\/em>. Dans la mythologie antique, c&rsquo;\u00e9tait le surnom d&rsquo;Argos, le dieu aux cent yeux. C&rsquo;est aussi le nom du projet port\u00e9 par <strong><a href=\"https:\/\/erwanlemerrer.github.io\/\" target=\"_blank\" rel=\"noopener\">Erwan Le Merrer<\/a>.<\/strong> L&rsquo;objectif : y voir plus clair dans les recommandations propos\u00e9es par les sites Internet.<\/p>\n<p>Constat de d\u00e9part : <em>\u201cle web \u00e9tait initialement d\u00e9centralis\u00e9. Il y avait beaucoup de services r\u00e9partis dans le monde entier. La tendance est maintenant \u00e0 la concentration au sein d&rsquo;un tout petit groupe d&rsquo;op\u00e9rateurs : les fameux Gafam. Auparavant, quand il cliquait sur un hyperlien, l&rsquo;internaute surfait d&rsquo;une page \u00e0 l&rsquo;autre, passant d&rsquo;un op\u00e9rateur \u00e0 un autre. Mais ce n&rsquo;est plus cas. Aujourd&rsquo;hui, les g\u00e9ants de l&rsquo;Internet s&rsquo;efforcent de conserver les utilisateurs le plus longtemps possible sur leur plate-forme. Et ils y parviennent via leurs algorithmes de recommandation.\u201d<\/em> Cons\u00e9quence : <em>\u201cles crit\u00e8res qui alimentent ces algorithmes exercent une influence pr\u00e9pond\u00e9rante sur ce que les gens voient, lisent ou consomment.\u201d<\/em><\/p>\n<p>Probl\u00e8me : <em>\u201cces crit\u00e8res se trouvent de facto plac\u00e9s dans une bo\u00eete noire.\u201d<\/em> Les op\u00e9rateurs connaissent les ingr\u00e9dients de la recette, mais pas les utilisateurs. <em>\u201cEn cons\u00e9quence, on peut les influencer subrepticement en leur soumettant certains liens\u2026 plut\u00f4t que d&rsquo;autres. D\u2019o\u00f9 les questions croissantes de la soci\u00e9t\u00e9 civile sur de possibles tentatives de manipulation de l&rsquo;opinion. On en a eu une illustration frappante lors de la derni\u00e8re \u00e9lection pr\u00e9sidentielle aux \u00c9tats-Unis, avec les pol\u00e9miques autour de l\u2019impact des algorithmes employ\u00e9s par les r\u00e9seaux sociaux pour classer ou trier l\u2019information.\u201d<\/em>\u00a0 Sans aller jusque l\u00e0, <em>\u201cdans la vie quotidienne, les recommandations contribuent aussi \u00e0 cr\u00e9er un effet de bulle. Elles nous confortent dans nos habitudes de consommation, dans nos pr\u00e9jug\u00e9s, etc. Nous sommes de moins en moins confront\u00e9s \u00e0 l\u2019alt\u00e9rit\u00e9, et \u00e0 des produits, contenus ou opinions diff\u00e9rents. Au bout du compte, ce tri a donc un impact fondamental sur nos interactions num\u00e9riques.\u201d<\/em><\/p>\n<p><span style=\"font-size: 18pt; color: #ff0000;\">Transparence algorithmique<\/span><\/p>\n<p>Une prise de conscience s&rsquo;amorce. <em>\u201cInria contribue d&rsquo;ailleurs \u00e0 ce d\u00e9bat via TransAlgo (1). Articul\u00e9e autour du concept de transparence algorithmique, cette plate-forme cherche \u00e0 d\u00e9finir ce qu&rsquo;est un algorithme \u00e9quitable et non biais\u00e9 pour faire des pr\u00e9conisations de bonnes pratiques aux op\u00e9rateurs.\u201d<\/em>\u00a0 Le travail d&rsquo;Erwan Le Merrer s&rsquo;inscrit dans une optique un peu diff\u00e9rente. <em>\u201cAu lieu de tenter de d\u00e9finir un p\u00e9rim\u00e8tre de bonnes pratiques, je veux plut\u00f4t exposer les cas particuliers, afin de permettre aux utilisateurs de d\u00e9cider eux-m\u00eames s&rsquo;ils trouvent ces recommandations l\u00e9gitimes ou pas. Ainsi, une fois d\u00fbment inform\u00e9s, ils d\u00e9cideront de la pertinence de continuer \u00e0 utiliser cet op\u00e9rateur, voire m\u00eame de faire pression sur lui.\u201d<\/em><\/p>\n<div id=\"attachment_584\" style=\"width: 321px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/les-graphs-de-recommandation.jpeg\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-584\" class=\"size-full wp-image-584\" src=\"https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/les-graphs-de-recommandation.jpeg\" alt=\"\" width=\"311\" height=\"172\" srcset=\"https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/les-graphs-de-recommandation.jpeg 311w, https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/les-graphs-de-recommandation-300x166.jpeg 300w, https:\/\/project.inria.fr\/emergences\/files\/2021\/03\/les-graphs-de-recommandation-150x83.jpeg 150w\" sizes=\"auto, (max-width: 311px) 100vw, 311px\" \/><\/a><p id=\"caption-attachment-584\" class=\"wp-caption-text\">Les graphes de vid\u00e9os recommand\u00e9s par Youtube \u00e0 un nouvel utilisateur (gauche), et \u00e0 un utilisateur connu (droite)<\/p><\/div>\n<p>Mais pour cela, il faut cr\u00e9er des algorithmes qui font \u2018parler\u2019 la bo\u00eete noire.<em>\u201c\u00c9videmment, aucun op\u00e9rateur ne veut divulguer les d\u00e9tails sur ses algorithmes. Ceux-ci constituent le c\u0153ur de sa technologie et rel\u00e8vent du secret industriel. Il faut donc des outils pour observer ces algorithmes de l&rsquo;ext\u00e9rieur. Et c&rsquo;est ce que nous avons commenc\u00e9 \u00e0 d\u00e9velopper dans un premier travail avec Gilles Tr\u00e9dan, du CNRS (2). En l&rsquo;occurrence, nous avons choisi de nous int\u00e9resser \u00e0 la plateforme \u00e0 succ\u00e8s qu\u2019est Youtube. Avec une question : en observant les recommandations qui y sont faites, peut-on dire si elles semblent l\u00e9gitimes par rapport aux vid\u00e9os que l&rsquo;utilisateur est en train de visionner ?\u201d<\/em><\/p>\n<p><span style=\"font-size: 18pt; color: #ff0000;\">Le graphe, un outil prometteur<\/span><\/p>\n<p>Pour commencer, les scientifiques avaient besoin d&rsquo;une structure de donn\u00e9es permettant de repr\u00e9senter les recommandations qui s&rsquo;affichent \u00e0 raison d&rsquo;environ 20 par page quand l&rsquo;internaute clique de lien en lien. <em>\u201cNous avons propos\u00e9 d&rsquo;utiliser une structuration en graphe. Gr\u00e2ce \u00e0 celui-ci, on voit appara\u00eetre des s\u00e9ries de liens plus ou moins en rapport avec la vid\u00e9o en cours de visionnage. On peut raisonner topologiquement. Nous avons ainsi pu montrer que si l&rsquo;utilisateur est inconnu de la plate-forme, lui est propos\u00e9 une grande vari\u00e9t\u00e9 de communaut\u00e9s de vid\u00e9os. En revanche, si l&rsquo;utilisateur est connu, parce qu&rsquo;il s&rsquo;est connect\u00e9 avec son compte ou qu&rsquo;il y a un cookie dans son navigateur, alors la plate-forme propose des recommandations cibl\u00e9es sur son profil, ce que l\u2019on peut mesurer au regard du nombre restreint de communaut\u00e9s. Ce qui entra\u00eene ce fameux effet de bulle. Et on peut le montrer factuellement. \u00c0 l&rsquo;aide d&rsquo;un algorithme, le graphe va aussi nous servir \u00e0 pr\u00e9dire quels sont, sur la plateforme Youtube, les liens estampill\u00e9s \u2018recommand\u00e9s pour vous\u2019.<\/em><\/p>\n<p><em>On peut aussi chercher s&rsquo;il existe des recommandations personnalis\u00e9es mais qui, sur le site, ne sont pas indiqu\u00e9es comme telles. Nous avons montr\u00e9 que la structure de donn\u00e9es graphe permet d&rsquo;inf\u00e9rer ce type de propri\u00e9t\u00e9s. Donc c&rsquo;est un outil prometteur.\u201d<\/em><\/p>\n<p>Le graphe permet de mat\u00e9rialiser ce que l&rsquo;on appelle des liens courts, c&rsquo;est-\u00e0-dire amenant dans le m\u00eame th\u00e8me que la vid\u00e9o regard\u00e9e, ainsi que les liens longs qui, eux, sortent de ce champ th\u00e9matique. <em>\u201cQuand l&rsquo;utilisateur est connu, il y a moins de liens longs envoyant vers d&rsquo;autres centres d&rsquo;int\u00e9r\u00eat. C&rsquo;est logique. La longueur des liens dans le graphe donne une probabilit\u00e9 sur le fait que le lien recommand\u00e9 ne soit pas en relation directe avec ce qui est visualis\u00e9. La longueur du lien donne aussi une information sur la probabilit\u00e9 que le lien ne soit pas l\u00e9gitime \u00e0 l&rsquo;instant o\u00f9 l&rsquo;utilisateur regarde quelque chose.\u201d<\/em>\u00a0 Et l\u00e0, les choses s\u00e9rieuses commencent. <em>\u201cCe n&rsquo;est pas \u00e0 nous de dire si c&rsquo;est bien ou mal. En revanche, nous souhaitons faire en sorte que l&rsquo;utilisateur puisse disposer de cette information, prendre conscience du m\u00e9canisme \u00e0 l&rsquo;\u0153uvre et, \u00e0 partir de l\u00e0, effectuer un choix \u00e9clair\u00e9.\u201d<\/em><\/p>\n<p>L&rsquo;id\u00e9e va m\u00eame \u00eatre pouss\u00e9e plus loin. <em>\u201cNous souhaitons faire collaborer les utilisateurs et partager \u00e0 grande \u00e9chelle l&rsquo;information sur ces recommandations.\u201d<\/em> Comment ? <em>\u201cEn proposant par exemple un plugin pour navigateur. Gr\u00e2ce \u00e0 lui, l&rsquo;utilisateur aura une vision plus g\u00e9n\u00e9rale de ce qui se passe. On pourra par exemple souligner un lien en rouge pour lui signaler qu&rsquo;il pose question. Il y aura aussi probablement des variations dans le temps, au gr\u00e9 des \u00e9v\u00e9nements tels que les \u00e9lections par exemple. On se dirigerait donc vers une sorte de m\u00e9t\u00e9o de la recommandation.\u201d<\/em><\/p>\n<p>&nbsp;<\/p>\n<table style=\"border-collapse: collapse; width: 100%;\" border=\"1\">\n<tbody>\n<tr>\n<td style=\"width: 800px; background-color: #384257; border-color: #384257;\">\n<ul>\n<li><span style=\"font-size: 10pt; color: #ffffff;\"><em>* Wide est une \u00e9quipe-projet Inria et Universit\u00e9 Rennes 1, commune \u00e0 l&rsquo;Irisa (UMR6074).<br \/>\n(1) Premi\u00e8re initiative de ce genre en Europe, TransAlgo est une plateforme pour le d\u00e9veloppement de la transparence et de la responsabilit\u00e9 des syst\u00e8mes algorithmiques. Mise en place par le gouvernement, son pilotage a \u00e9t\u00e9 confi\u00e9 \u00e0 Inria. Elle agr\u00e8ge des contributions de nombreux acteurs de la recherche acad\u00e9mique en France.<br \/>\n(2) Lire : . Par Erwan Le Merrer et Gilles Tr\u00e9dan. Dans : Complex Networks conference, 2017.<br \/>\n<\/em><\/span><\/li>\n<\/ul>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Les internautes surfent de liens en liens au fil de recommandations de plus en plus personnalis\u00e9es. Mais les crit\u00e8res qui r\u00e9gissent ces suggestions sont opaques et inaccessibles. Apr\u00e8s neuf ans pass\u00e9s chez Technicolor, le chercheur Erwan Le Merrer rejoint l&rsquo;\u00e9quipe Wide* au centre Inria de Rennes avec un projet dans\u2026<\/p>\n<p> <a class=\"continue-reading-link\" href=\"https:\/\/project.inria.fr\/emergences\/plus-de-transparence-pour-les-algorithmes-de-recommandation\/\"><span>En savoir plus<\/span><i class=\"crycon-right-dir\"><\/i><\/a> <\/p>\n","protected":false},"author":1891,"featured_media":583,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7],"tags":[29],"class_list":["post-582","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-recherche","tag-29"],"_links":{"self":[{"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/posts\/582","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/users\/1891"}],"replies":[{"embeddable":true,"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/comments?post=582"}],"version-history":[{"count":1,"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/posts\/582\/revisions"}],"predecessor-version":[{"id":585,"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/posts\/582\/revisions\/585"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/media\/583"}],"wp:attachment":[{"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/media?parent=582"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/categories?post=582"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/project.inria.fr\/emergences\/wp-json\/wp\/v2\/tags?post=582"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}