

{"id":4,"date":"2011-12-08T11:55:34","date_gmt":"2011-12-08T11:55:34","guid":{"rendered":"http:\/\/project.inria.fr\/template1\/?page_id=4"},"modified":"2020-10-06T16:09:32","modified_gmt":"2020-10-06T14:09:32","slug":"home","status":"publish","type":"page","link":"https:\/\/project.inria.fr\/deepprivacy\/fr\/","title":{"rendered":"Accueil"},"content":{"rendered":"<p>La reconnaissance vocale est maintenant utilis\u00e9e dans de nombreuses applications, dont les assistants virtuels qui collectent, traitent et stockent des donn\u00e9es vocales personnelles sur des serveurs centralis\u00e9s, ce qui soul\u00e8ve de s\u00e9rieuses pr\u00e9occupations concernant la privacit\u00e9. Des approches \u00e0 base de reconnaissance vocale embarqu\u00e9e ont r\u00e9cemment \u00e9t\u00e9 propos\u00e9es pour traiter ces aspects de privacit\u00e9, mais seulement pendant la phase de reconnaissance de la parole. Dans ce cas, comme tous les traitements sont effectu\u00e9s sur le terminal de l&rsquo;utilisateur, les donn\u00e9es vocales restent priv\u00e9es. Cependant, il y a encore besoin d&rsquo;am\u00e9liorer davantage la technologie de reconnaissance vocale car ses performances restent limit\u00e9es dans des conditions d\u00e9favorables (e.g., environnements bruyants, parole r\u00e9verb\u00e9r\u00e9e, accents forts, etc). Cela ne peut \u00eatre obtenu qu\u2019\u00e0 partir de grands corpus de parole repr\u00e9sentatifs de conditions d&rsquo;utilisation r\u00e9elles et vari\u00e9es. Pour cela, il est n\u00e9cessaire de partager des donn\u00e9es vocales tout en gardant l&rsquo;identit\u00e9 du locuteur priv\u00e9e. Les am\u00e9liorations sont alors b\u00e9n\u00e9fiques pour tous les utilisateurs. Il est \u00e9galement \u00e9vident que l&rsquo;utilisateur doit avoir le contr\u00f4le sur ses donn\u00e9es, afin de ne pas transmettre de donn\u00e9es dont les contenus linguistiques sont critiques.<\/p>\n<p>Dans ce contexte, le <a href=\"https:\/\/anr.fr\/Projet-ANR-18-CE23-0018\">projet ANR DEEP-PRIVACY<\/a> propose un nouveau paradigme bas\u00e9 sur une approche distribu\u00e9e, personnalis\u00e9e et pr\u00e9servant la privacit\u00e9 pour le traitement de la parole, en mettant l&rsquo;accent sur les algorithmes d&rsquo;apprentissage pour la reconnaissance de la parole. Pour ce faire, nous proposons une approche hybride: le terminal de chaque utilisateur ne partage pas ses donn\u00e9es vocales brutes et ex\u00e9cute des calculs priv\u00e9s localement, alors que certains calculs inter-utilisateurs sont r\u00e9alis\u00e9s sur un serveur (ou un r\u00e9seau peer-to-peer). Pour satisfaire aux exigences de privacit\u00e9, les informations communiqu\u00e9es au serveur ne doivent pas exposer d&rsquo;informations sensibles. Le projet aborde les d\u00e9fis ci-dessus d&rsquo;un point de vue th\u00e9orique, m\u00e9thodologique et empirique \u00e0 travers deux objectifs scientifiques majeurs.<\/p>\n<p>Le premier objectif concerne l&rsquo;apprentissage de repr\u00e9sentations du signal vocal pr\u00e9servant la privacit\u00e9, c\u2019est-\u00e0-dire qui d\u00e9m\u00ealent les caract\u00e9ristiques susceptibles d&rsquo;exposer des informations priv\u00e9es (\u00e0 conserver sur le terminal) de celles g\u00e9n\u00e9riques utiles \u00e0 la t\u00e2che concern\u00e9e (qui satisfont des aspects de privacit\u00e9, et peuvent \u00eatre partag\u00e9es). Pour la reconnaissance de la parole, cela correspond respectivement \u00e0 des informations de locuteur (\u00e0 prot\u00e9ger) et \u00e0 des informations linguistiques (\u00e0 partager) port\u00e9es par la parole. Pour atteindre cet objectif, nous explorerons plusieurs directions, toutes bas\u00e9es sur des approches d&rsquo;apprentissage profond ; et, outre les mesures classiques de reconnaissance de parole et du locuteur, nous utiliserons \u00e9galement des notions formelles de privacit\u00e9 pour \u00e9valuer leur performance.<\/p>\n<p>Le deuxi\u00e8me objectif concerne les algorithmes distribu\u00e9s et la personnalisation, gr\u00e2ce \u00e0 la conception d&rsquo;algorithmes distribu\u00e9s efficaces fonctionnant dans un environnement o\u00f9 les donn\u00e9es utilisateur sensibles sont conserv\u00e9es sur le terminal, avec des composants globaux fonctionnant sur des serveurs et des composants personnalis\u00e9s fonctionnant sur des terminaux personnels. Les donn\u00e9es transf\u00e9r\u00e9es aux serveurs devraient contenir des informations utiles pour l&rsquo;apprentissage et la mise \u00e0 jour des composants globaux (mod\u00e8les acoustiques), tout en pr\u00e9servant la privacit\u00e9. Nous \u00e9tudierons le type de donn\u00e9es \u00e0 \u00e9changer (e.g., gradients, mod\u00e8les partiels, &#8230;) et \u00e9tudierons les informations de locuteur restant pr\u00e9sentes dans ces donn\u00e9es. De plus, les composants personnalis\u00e9s permettent d&rsquo;introduire des transformations sp\u00e9cifiques aux locuteurs et d&rsquo;adapter certains param\u00e8tres du mod\u00e8le au locuteur. Enfin, nous consid\u00e9rerons un contexte peer-to-peer, comme une alternative aux serveurs, pour le partage de donn\u00e9es et l\u2019apprentissage de mod\u00e8les.<\/p>","protected":false},"excerpt":{"rendered":"<p>La reconnaissance vocale est maintenant utilis\u00e9e dans de nombreuses applications, dont les assistants virtuels qui collectent, traitent et stockent des donn\u00e9es vocales personnelles sur des serveurs centralis\u00e9s, ce qui soul\u00e8ve de s\u00e9rieuses pr\u00e9occupations concernant la privacit\u00e9. Des approches \u00e0 base de reconnaissance vocale embarqu\u00e9e ont r\u00e9cemment \u00e9t\u00e9 propos\u00e9es pour traiter\u2026<\/p>\n<p> <a class=\"continue-reading-link\" href=\"https:\/\/project.inria.fr\/deepprivacy\/fr\/\"><span>Continue reading<\/span><i class=\"crycon-right-dir\"><\/i><\/a> <\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":1,"comment_status":"closed","ping_status":"open","template":"","meta":{"footnotes":""},"class_list":["post-4","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/project.inria.fr\/deepprivacy\/fr\/wp-json\/wp\/v2\/pages\/4","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/project.inria.fr\/deepprivacy\/fr\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/project.inria.fr\/deepprivacy\/fr\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/project.inria.fr\/deepprivacy\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/project.inria.fr\/deepprivacy\/fr\/wp-json\/wp\/v2\/comments?post=4"}],"version-history":[{"count":9,"href":"https:\/\/project.inria.fr\/deepprivacy\/fr\/wp-json\/wp\/v2\/pages\/4\/revisions"}],"predecessor-version":[{"id":96,"href":"https:\/\/project.inria.fr\/deepprivacy\/fr\/wp-json\/wp\/v2\/pages\/4\/revisions\/96"}],"wp:attachment":[{"href":"https:\/\/project.inria.fr\/deepprivacy\/fr\/wp-json\/wp\/v2\/media?parent=4"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}