Pour remplir des stades ou bâtir des armées, les logiciels de création de foules se répandent dans le cinéma. Problème : dans ces attroupements, les personnages virtuels effectuent des mouvements trop uniformes. Ce manque de variété nuit au réalisme de l’ensemble. D’où l’idée d’automatiser la création de variations dans les mouvements. Tel est l’objectif d’un projet porté par le chercheur Ludovic Hoyet au centre Inria Rennes – Bretagne Atlantique. Comme il l’explique, ces travaux passent par des expérimentations à grande échelle non seulement pour capturer les mouvements réels de beaucoup de gens, mais aussi pour mieux comprendre jusqu’à quel point la variation dans le mouvement est vraiment perçue… ou pas.
1970 : tournage du film Waterloo. La plus grande production de son temps. Dans la morne plaine : pas moins de… 17 000 figurants ! Pour répéter la chorégraphie de la bataille, il leur faudra plusieurs mois. Depuis, le monde a changé. En 2016, pour son épopée napoléonienne Guerre et Paix, la BBC réalise les mêmes scènes de combat grâce à un logiciel de simulation de foules. Et cela pour une fraction du prix.
BlueBolt – War and Peace VFX Breakdown from BlueBolt on Vimeo.
Si le peuplement de films par personnages virtuels est en passe de devenir monnaie courante, les figurants numériques, eux, semblent encore un peu tous sortir du même moule. En particulier, leurs mouvements demeurent bien moins variés que ceux des êtres humains. Membre de l’équipe MimeTiC (1) au centre Inria de Rennes, Ludovic Hoyet, débute un projet de recherche pour apporter justement de la variété à ces mouvements. Baptisé PER², ce projet court sur 42 mois. Il est financé par l’Agence nationale de la recherche dans le cadre du programme Jeunes Chercheuses et Jeunes Chercheurs (2).
“En fait, il serait partiellement faux de prétendre que la variété dans le mouvement n’existe pas. Mais elle repose sur le travail effectué à la main par les artistes, ce qui prend beaucoup de temps et coûte très cher. Seules les grosses productions possèdent le budget pour cela. Nous voudrions donc automatiser le processus et permettre ainsi aux artistes de se décharger de ces tâches peu intéressantes pour se consacrer à d’autres aspects de leurs travaux qui requièrent plus de créativité artistique.”
La première phase du projet prévoit de capturer les déambulations d’environ 200 personnes d’âge, de morphologie et de sexe différents. “Cela ne prétend certainement pas représenter toute la diversité de l’humanité, mais c’est déjà un échantillon assez grand. À titre de comparaison, durant mon post-doctorat au Trinity College, à Dublin, la plus grande capture que nous avons réalisée portait sur 40 personnes, et c’était déjà beaucoup.” Alors que les précédentes expériences à Inria utilisaient le système de caméras Vicon, les nouveaux travaux vont exploiter des capteurs inertiels Xsens. “Ils sont faciles à utiliser. Les calculs s’effectuent directement dans le capteur. Plus largement, ils vont nous permettre d’augmenter la masse de données capturées.”
Identifier les caractéristiques discriminantes du mouvement
Une fois cette base de données unique constituée, la seconde étape enchaînera des expériences de perception. Des panels de spectateurs vont regarder des personnages virtuels reproduisant la démarche réelle des 200 personnes. “Nous allons leur poser des questions comme : Parmi ces différents mouvements, lesquels vous semblent appartenir à une personne ayant une morphologie plutôt lourde ou plutôt légère ? Cela va nous permettre de créer une carte qui nous indiquera quelles caractéristiques dans le mouvement sont perçues comme correspondant à certaines particularités d’un individu.” En s’appuyant sur cette connaissance de la perception, les scientifiques s’emploieront ensuite à synthétiser ces variations du mouvement.
Une des questions clé consiste à “déterminer quelles caractéristiques dans le mouvement sont perçues ou non. Car si une caractéristique existe, mais n’est pas remarquée par le spectateur, alors pas besoin de la modéliser. Notre but, en effet, est de nous focaliser uniquement sur ce qui va être perçu. Ceci afin de simplifier nos modèles et minimiser le coût de calcul.”
Beaucoup d’inconnues
Peu de travaux ont porté sur la perception du mouvement pour l’animation de personnages. Les scientifiques se trouvent donc face à beaucoup d’inconnues. “Certaines caractéristiques pourraient s’avérer discriminantes… ou pas. Nous l’ignorons complètement. Par exemple, on pourrait penser qu’il n’y a pas de différence perceptible entre quelqu’un de petite taille et quelqu’un de grande taille marchant à même vitesse. Mais si la fréquence et la longueur des pas rentre en compte, alors on va peut-être s’apercevoir qu’une fréquence plus élevée correspond généralement à une personne plus petite. Ou qu’une personne plus lourde va peut-être avoir plus d’inertie, ce qui change la dynamique du mouvement du point de vue de la perception.”
Complication supplémentaire : “le mouvement et la forme du corps sont probablement intrinsèquement corrélés en termes de perception. Nous allons donc devoir étudier les effets croisés. Que se passe-t-il dans le cas où l’on applique un mouvement de lourd sur quelqu’un de léger ou un mouvement de léger sur quelqu’un de lourd ? Nos expériences vont nous permettre de tester de tels scénarios, ce qui promet d’être intéressant.”
D’autres obstacles pourraient encore surgir car la perception du mouvement est un cocktail complexe dans lequel s’invitent beaucoup d’ingrédients. “Il y a énormément de variabilité. Autant le poids, la taille et le sexe sont des éléments quantifiables, autant d’autres particularités s’avèrent difficiles à prendre en compte. Deux personnes ayant la même morphologie peuvent avoir une démarche différente pour quantité de raisons liées à leur passé ou à des problèmes de santé par exemple.” Les chercheurs craignent aussi de “se heurter au mur de la perception qu’on a de soi-même, un concept que l’on appelle l’image de soi en psychologie. Si nos mouvements sont influencés par notre personnalité, nous aurons du mal à identifier et quantifier ce facteur. Mais nous avons l’intention d’aller dans cette direction.”
Compromis entre réalisme et temps de calcul
Dans la phase trois, les chercheurs vont s’intéresser à l’intégration de leurs nouveaux personnages dans les foules. “Si nous en avons 10 000 qui effectuent des mouvements personnalisés, l’animation ne va pas passer à l’échelle. Donc, nous devons chercher un compromis et formuler certaines hypothèses de simplification. D’où le besoin de comprendre où et quand ces variations du mouvement s’avèrent vraiment nécessaires en termes de perception. A-t-on réellement besoin de personnaliser 100 % des personnages ? Peut-être que 15 % suffirait pour créer cette petite variété qui va donner à la foule un aspect plus naturel et plus vivant.” Les ressources de calcul allouées à la variété du mouvement dépendront aussi des scènes. “Certaines exigeront la plus grande qualité visuelle et un réalisme maximal. Pour d’autres, peut-être qu’une petite augmentation du temps de calcul suffira pour obtenir ce petit gain en réalisme qui fera cependant la différence. Nous devons donc identifier les meilleures stratégies. Nous souhaitons les comparer et, si possible, les quantifier.”
À ce stade, le projet n’associe pas d’industriels, mais Ludovic Hoyet est “en contact avec plusieurs entreprises qui pourraient être intéressées par des collaborations ultérieures. Je pense en particulier à Technicolor et Golaem.” Issue d’Inria et récemment récompensée par un Emmy Award, cette dernière fournit des solutions de simulation pour la télévision et le cinéma dans le monde entier.
|