Finis les balbutiements de Siri, vers une révolution des assistants numériques ?<!-- --> | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
High-tech
Les techniques d’apprentissage machine ont permis de faire de grands progrès dans la reconnaissance vocale.
Les techniques d’apprentissage machine ont permis de faire de grands progrès dans la reconnaissance vocale.
©Reuters

A bon entendeur

Les logiciels de reconnaissance vocale installés sur nos smartphones ou nos tablettes avaient montré leurs limites. Avec Hound, c'est une nouvelle ère qui s'ouvre : la machine se met à comprendre l'Homme. Jusqu'à quel point ?

Jean-Gabriel Ganascia

Jean-Gabriel Ganascia

Jean-Gabriel Ganascia est professeur à l'université Pierre et Marie Curie (Paris VI) où il enseigne principalement l'informatique, l'intelligence artificielle et les sciences cognitives. Il poursuit des recherches au sein du LIP6, dans le thème APA du pôle IA où il anime l'équipe ACASA .
 

Voir la bio »

Atlantico : Concrètement, en quoi le logiciel Hound est sur le point de révolutionner notre rapport à nos assistants personnels ?

Jean-Gabriel Ganascia : Précisons les choses : il n’est pas certain que le logiciel Hound révolutionne effectivement notre rapport aux assistants personnels et, plus généralement, les échanges que nous avons avec les machines. Ce type de constat ne peut être établi qu’après coup, une fois que l’innovation s’est effectivement imposée. Aujourd’hui, nous ne disposons pas du recul suffisant pour tirer de telles conclusions. Il est néanmoins intéressant de comprendre les arguments de ceux qui pensent que ce logiciel va profondément transformer nos habitudes et la façon dont nous nous approprions les machines. Pour eux, les modalités d’interactions avec les ordinateurs reposaient, depuis l’apparition du Macintosh d’Apple, sur deux points : l’utilisation de la souris, qui étendait le bras de l’homme depuis monde physique jusqu’à l’univers virtuel de la machine, et la métaphore du bureau qui dressait un parallèle entre cet univers virtuel et une table sur laquelle se trouvaient empilés des dossiers, avec des documents à l’intérieur, et une poubelle, avec des menus qui aidait à sélectionner les actions à exécuter. Or, avec les interfaces vocales, ces deux dimensions, prolongation du geste et table, se trouvent modifiées. D’un côté, au mouvement du bras, on substitue l’échange verbal et les interactions vocales avec la machine. D’un autre côté, aux menus et à la métaphore du bureau, on oppose un dialogue au cours duquel la machine cherche elle-même et nous aide, itérativement, à partir des informations que nous lui avons données, à préciser l’action que nous souhaitons effectuer. Ces évolutions paraissent d’autant plus appréciables aujourd’hui, qu’avec les logiciels de plus en plus complexes que nous utilisons quotidiennement comme Word ou Excel, les menus deviennent si riches qu’on éprouve souvent des difficultés à les maîtriser et à retrouver les manipulations à effectuer pour exécuter telle ou telle opération.

En quoi consistent précisément les nouveautés qu'il apporte par rapport à ces prédécesseurs ou à ses concurrents du monde de la reconnaissance vocale ?

Depuis un certain nombre d’années, les techniques d’apprentissage machine ont permis de faire de grands progrès dans la reconnaissance vocale. Les machines à dicter fonctionnent parfaitement aujourd’hui. Siri est un excellent exemple de ce que l’on sait faire, mais il en existe beaucoup d’autres. Les dispositifs comme Hound ou comme le système Echo proposé il y a un an environ par Amazon vont bien au-delà de la simple reconnaissance de la parole. Ils accompagnent l’individu en permanence. Ils apprennent ses habitudes, déterminent le contexte où il se trouve pour désambiguïser ses requêtes, dialoguent en demandant des précisions s’il le jugent nécessaire, raisonnent, et font des recherches sur d’immenses bases de données, voire sur l’intégralité du web. Ceci signifie que l’on ne se contente pas de transcrire la parole en un texte. On cherche à comprendre ce qui est dit, c’est-à-dire à l’exprimer en logique formelle, puis à y répondre, en détectant les éventuelles ambiguïtés et en les levant si possible, ou en dialoguant pour acquérir des informations complémentaires afin de les éliminer.

Quelles sont les prochaines étapes à franchir dans le domaine de la recherche en matière de reconnaissance vocale et que vont-elles changer dans nos vies au quotidien ?

Tout ces étapes, compréhension et synthèse du langage naturel, dialogue, raisonnement recherche d’information dans des bases de connaissances, etc., font appel à un grand nombre de techniques d’intelligence artificielle. Autrement dit, la reconnaissance vocale n’est qu’un des aspects de ces nouveaux dispositifs. Celle-ci est assez bien maîtrisée aujourd’hui. C’est ce qui ouvre ces nouvelles perspectives. Il reste toutefois beaucoup d’autres étapes à franchir. En particulier, il faut apprendre les habitudes des individus, raisonner, dialoguer, etc. Un certain nombre de résultats récents montre que tout cela est faisable. C’est en particulier le cas du système Watson d’IBM qui comprend les questions qu’on lui pose, lorsqu’elle sont formulées en langage naturel, puis y répond en faisant des recherches sur de grandes bases de données. Il reste néanmoins à intégrer tous ces dispositifs et à s’assurer que les hommes seront en mesure de se les approprier en s’y adaptant. En effet, il n’est pas vraiment naturel de parler à une machine ! Qui plus est, certains craindront peut-être que ces micros qui enregistreront continument tous nos échanges et qui sauront tout sur nous, ne correspondront avec l’extérieur pour tout raconter... Comment ne pas imaginer que ces serviteurs zélés pourront se mettre au service d’autres que nous ? Voici de beaux sujets d’inquiétude et de réflexion pour les années qui viennent...

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !