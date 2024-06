Atlantico : Quelles sont les spécificités de ces nouveaux écouteurs dopés à l’IA ? Sont-ils dignes des films d’espionnage ?

Gilles Dounès : C'est une petite équipe de jeunes chercheurs, d’origine étrangère, de l'Université de l'État de Washington à Seattle qui a réussi à mettre au point un dispositif couplé à un casque auditif supra oral, basé sur l'intelligence artificielle, et qui permet d'isoler une conversation particulière dans un environnement bruyant.

Dans ce dispositif, deux micros sont embarqués dans le casque, et lorsque le porteur regarde vers telle ou telle personne en train de parler, l’algorithme d'intelligence artificielle isole en quelque sorte l'empreinte vocale de la personne ainsi « visée », au bout de quatre à cinq secondes. À partir de là, il n'est plus nécessaire de regarder la personne que l'on souhaite écouter, et l'on peut continuer la conversation côte à côte. Il y a cependant une marge d'erreur de 16° dans la sélection de la source pertinente. Il s'agit davantage d'un démonstrateur, qui a d'ailleurs fait l'objet d'une communication, que d'un gadget sortie des laboratoires de Q, prêt à accompagner James Bond sur le terrain. Le dispositif a été présenté donc le 14 mai dernier à Honolulu, lors de la ACM CHI Conference on Human Factors in Computing Systems (Conférence sur les facteurs humains dans les systèmes informatiques). Le code source a d'ailleurs été mise à la disposition de la communauté scientifique à cette occasion : il n'est pas impossible que l'on voit apparaître d'autres projets reposant sur ce même concept… À moins que ce soit un service spécial étatique ou une société privée du secteur MILIPOL qui décide de s'en emparer… "Target Speech Hearing" a été testé sur 21 personnes, et son efficacité augmente au fur et à mesure où on l'utilise, une fois la « cible » choisie et étalonnée. Il est d'ailleurs déjà tout à fait possible d'obtenir ce type de résultats avec un microphone de type « canon », éventuellement avec une parabole, mais cela implique de suivre bénévolement la « cible » en permanence au fur et à mesure de ses déplacements éventuels. Là, c'est l'intelligence artificielle qui se « fixe » elle-même sur sa cible, en isolant les fréquences pertinentes du bruit environnant, embarquée en « local » sur un simple dispositif électronique, Il s'agit vraisemblablement d'une intelligence artificielle dite « étroite », entraînée à isoler un certain nombre d'éléments pertinents dans un ensemble « flou », de la même manière que des chercheurs chinois avaient réussi à entraîner une intelligence artificielle à détecter un cancer du poumon à un stade très précoce sur les clichés d’ imagerie médicale, il y a déjà plusieurs années. Ici, il intelligence artificielle, ou plutôt l'algorithme, est entraîné à isoler tout simplement ce qui lui paraît à la fois différent, et éventuellement porteur de cohérence.



Cette innovation pourrait-elle révolutionner les écouteurs et les casques de demain ? La dernière édition des AirPods Pro d'Apple permet-elle par exemple d’ajuster automatiquement les niveaux sonores pour les utilisateurs en détectant le moment où ils sont en conversation ?

Le concept est extrêmement intéressant, et devrait vraisemblablement donner des idées à d'autres, d'autant que le système d'intelligence artificielle utilisé est suffisamment léger pour pouvoir fonctionner localement, dans un dispositif électronique. Le prochain défi sera de développer une puce spécifique, de le miniaturiser suffisamment pour tenir dans des écouteurs suffisamment discrets parce que intra auriculaire. Deux solutions s'offrent à la petite équipe qui a d'ailleurs monté une start-up : soit tenter un jour ou l'autre un lancement sur le marché, lorsque le concept sera plus mature, ou se faire racheter par un poids lourd du secteur (ou qui aspire à le devenir). Il est vraisemblable que les 5 chercheurs ont d'ores et déjà reçu des émissaires envoyés par Cupertino… mais pas seulement !

Le projet "Target Speech Hearing" fonctionne d'ailleurs de manière inverse, et donc complémentaire par rapport aux AirPods actuels, lesquels isolent l'utilisateur à l'intérieur d'une bulle active de réduction du bruit. Mais il s'agit du même principe : le contrôle de l'environnement de l'utilisateur, afin d'améliorer son expérience. Soit on présente davantage d'informations, comme dans les lunettes de réalité augmentée par exemple. Soit on isole les informations pertinentes et on les présente de façon magnifiée, en les isolant en quelque sorte du contexte. Dans le cas présent, on peut parler de réalité augmentée même si il y a une bonne part d’isolation par rapport au reste de l’environnement : on peut parler de zoom auditif. Dans le cas des AirPod on a une sorte de « disjoncteur » qui, de façon proactive, va en quelque sorte « couper » l'arrivée du son violent avant qu’il ne rentre dans le circuit, et qui repose sur la puce H1 ou H2, spécialement développées par Apple pour cela. Le système conçu par le Paul G. Allen School of Computer Science & Engineering est beaucoup plus artisanal, il s'agit d'un projet de recherche mené par une poignée de doctorants, mais, comme Apple, l'équipe travaille à miniaturiser son dispositif, en passant au format d’écouteurs intra auriculaire et avec en perspective le marché des aides auditives.

L’IA via une telle technologie de sélection sonore pourrait-elle modifier la perception auditive de toute personne portant des écouteurs, en fonction de ses préférences ? Cela pourrait-il même contribuer à améliorer les aides auditives ?