James Bond dans vos oreilles : voilà ce que permettront bientôt les nouveaux écouteurs dopés à l’IA<!-- --> | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
High-tech
L'acteur anglais Daniel Craig marche sur le tapis rouge après son arrivée pour assister à la première mondiale du film James Bond 007 « Mourir peut attendre » au Royal Albert Hall à l'ouest de Londres le 28 septembre 2021.
L'acteur anglais Daniel Craig marche sur le tapis rouge après son arrivée pour assister à la première mondiale du film James Bond 007 « Mourir peut attendre » au Royal Albert Hall à l'ouest de Londres le 28 septembre 2021.
©TOLGA AKMEN / AFP

Minute Tech

Des chercheurs de l'université de Washington ont présenté "Target Speech Hearing", un système d'écouteurs équipé de l’intelligence artificielle qui améliore la perception auditive en isolant la voix d'un seul orateur dans un environnement complexe et bruyant.

Gilles Dounès

Gilles Dounès

Gilles Dounès a été directeur de la rédaction du site MacPlus.net  jusqu’en mars 2015. Il intervient à présent régulièrement sur iWeek, l'émission consacrée à l’écosystème Apple sur OUATCH.tv, la chaîne TV dédiée à la High-Tech et aux loisirs.

Il est le co-auteur, avec Marc Geoffroy, de l'ouvrage iPod Backstage, les coulisses d’un succès mondial, paru en 2005 aux Editions Dunod.

Vous pouvez suivre Gilles Dounès sur Twitter : @gdounes

 

Voir la bio »
Atlantico : Quelles sont les spécificités de ces nouveaux écouteurs dopés à l’IA ? Sont-ils dignes des films d’espionnage ? 
Gilles Dounès : C'est une petite équipe de jeunes chercheurs, d’origine étrangère, de l'Université de l'État de Washington à Seattle qui a réussi à mettre au point un dispositif couplé à un casque auditif supra oral, basé sur l'intelligence artificielle, et qui permet d'isoler une conversation particulière dans un environnement bruyant.

Dans ce dispositif, deux micros sont embarqués dans le casque, et lorsque le porteur regarde vers telle ou telle personne en train de parler, l’algorithme d'intelligence artificielle isole en quelque sorte l'empreinte vocale de la personne ainsi « visée », au bout de quatre à cinq secondes. À partir de là, il n'est plus nécessaire de regarder la personne que l'on souhaite écouter, et l'on peut continuer la conversation côte à côte. Il y a cependant une marge d'erreur de 16° dans la sélection de la source pertinente.

Il s'agit davantage d'un démonstrateur, qui a d'ailleurs fait l'objet d'une communication, que d'un gadget sortie des laboratoires de Q, prêt à accompagner James Bond sur le terrain. Le dispositif a été présenté donc le 14 mai dernier à Honolulu, lors de la ACM CHI Conference on Human Factors in Computing Systems (Conférence sur les facteurs humains dans les systèmes informatiques). Le code source a d'ailleurs été mise à la disposition de la communauté scientifique à cette occasion : il n'est pas impossible que l'on voit apparaître d'autres projets reposant sur ce même concept… À moins que ce soit un service spécial étatique ou une société privée du secteur MILIPOL qui décide de s'en emparer…

"Target Speech Hearing" a été testé sur 21 personnes, et son efficacité augmente au fur et à mesure où on l'utilise, une fois la « cible » choisie et étalonnée.

Il est d'ailleurs déjà tout à fait possible d'obtenir ce type de résultats avec un microphone de type « canon », éventuellement avec une parabole, mais cela implique de suivre bénévolement la « cible » en permanence au fur et à mesure de ses déplacements éventuels. Là, c'est l'intelligence artificielle qui se « fixe » elle-même sur sa cible, en isolant les fréquences pertinentes du bruit environnant, embarquée en « local » sur un simple dispositif électronique, 

Il s'agit vraisemblablement d'une intelligence artificielle dite « étroite », entraînée à isoler un certain nombre d'éléments pertinents dans un ensemble « flou », de la même manière que des chercheurs chinois avaient réussi à entraîner une intelligence artificielle à détecter un cancer du poumon à un stade très précoce sur les clichés d’ imagerie médicale, il y a déjà plusieurs années. Ici, il intelligence artificielle, ou plutôt l'algorithme, est entraîné à isoler tout simplement ce qui lui paraît à la fois différent, et éventuellement porteur de cohérence.


Cette innovation pourrait-elle révolutionner les écouteurs et les casques de demain ? La dernière édition des AirPods Pro d'Apple permet-elle par exemple d’ajuster automatiquement les niveaux sonores pour les utilisateurs en détectant le moment où ils sont en conversation ?
Le concept est extrêmement intéressant, et devrait vraisemblablement donner des idées à d'autres, d'autant que le système d'intelligence artificielle utilisé est suffisamment léger pour pouvoir fonctionner localement, dans un dispositif électronique. Le prochain défi sera de développer une puce spécifique, de le miniaturiser suffisamment pour tenir dans des écouteurs suffisamment discrets parce que intra auriculaire. Deux solutions s'offrent à la petite équipe qui a d'ailleurs monté une start-up : soit tenter un jour ou l'autre un lancement sur le marché, lorsque le concept sera plus mature, ou se faire racheter par un poids lourd du secteur (ou qui aspire à le devenir). Il est vraisemblable que les 5 chercheurs ont d'ores et déjà reçu des émissaires envoyés par Cupertino… mais pas seulement !

Le projet "Target Speech Hearing" fonctionne d'ailleurs de manière inverse, et donc complémentaire par rapport aux AirPods actuels, lesquels isolent l'utilisateur à l'intérieur d'une bulle active de réduction du bruit. Mais il s'agit du même principe : le contrôle de l'environnement de l'utilisateur, afin d'améliorer son expérience. 

Soit on présente davantage d'informations, comme dans les lunettes de réalité augmentée par exemple. 

Soit on isole les informations pertinentes et on les présente de façon magnifiée, en les isolant en quelque sorte du contexte.  

Dans le cas présent, on peut parler de réalité augmentée même si il y a une bonne part  d’isolation par rapport au reste de l’environnement : on peut parler de zoom auditif. 

Dans le cas des AirPod on a une sorte de « disjoncteur » qui, de façon proactive, va en quelque sorte « couper » l'arrivée du son violent avant qu’il ne rentre dans le circuit, et qui repose sur la puce H1 ou H2, spécialement développées par Apple pour cela. Le système conçu par le Paul G. Allen School of Computer Science & Engineering est beaucoup plus artisanal, il s'agit d'un projet de recherche mené par une poignée de doctorants, mais, comme Apple, l'équipe travaille à miniaturiser son dispositif, en passant au format d’écouteurs intra auriculaire et avec en perspective le marché des aides auditives.

L’IA via une telle technologie de sélection sonore pourrait-elle modifier la perception auditive de toute personne portant des écouteurs, en fonction de ses préférences ? Cela pourrait-il même contribuer à améliorer les aides auditives ?
C'est bien cette double perspective, de la réalité augmentée de l'aide auditive, qui est très intéressante dans cette avancée de recherche. D'ailleurs, l'équipe a travaillé au départ sur les chants d’oiseaux. Mais c'est au niveau des aides auditives que les perspectives paraissent potentiellement les plus intéressantes, avec cette capacité des systèmes à se concentrer sur au moins un interlocuteur.

On retrouve en effet cette perte de la discrimination de l’émetteur principal en environnement bruyant, à la fois dans la perte progressive de l'acuité auditive liée à l'âge par exemple, ou bien à une infection. Mais c’est également le cas dans la perte totale ou partielle de l'acuité auditive d'une oreille. Cette diminution de la sensation stéréo acoustique est également gênante, en obligeant, lors d'une conversation, à placer son interlocuteur systématiquement du côté de sa « bonne » oreille. Ce type de progrès, a fortiori s'il est intégré à des oreillettes de type intra auriculaire, peut représenter un progrès significatif et une autonomie bienvenue pour une part grandissante de la population.

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !