L'IA pourrait changer la façon dont les aveugles voient le monde<!-- --> | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
Science
Une personne aveugle attend de traverser un passage pour piétons, à Dardilly, dans le centre-est de la France.
Une personne aveugle attend de traverser un passage pour piétons, à Dardilly, dans le centre-est de la France.
©AFP/JEFF PACHOUD

Révolution

Les progrès de l’intelligence artificielle pourraient permettre d'aider les personnes malvoyantes.

Laurent Alexandre

Laurent Alexandre

Chirurgien de formation, également diplômé de Science Po, d'Hec et de l'Ena, Laurent Alexandre a fondé dans les années 1990 le site d’information Doctissimo. Il le revend en 2008 et développe DNA Vision, entreprise spécialisée dans le séquençage ADN. Auteur de La mort de la mort paru en 2011, Laurent Alexandre est un expert des bouleversements que va connaître l'humanité grâce aux progrès de la biotechnologie. 

Vous pouvez suivre Laurent Alexandre sur son compe Twitter : @dr_l_alexandre

 
Voir la bio »

Atlantico : Certaines technologies, en intégrant GPT-4 d'OpenAI, pourraient changer la façon dont les aveugles voient le monde. De quoi s’agit-il vraiment ? Qu’est ce pourraient "voir" les personnes aveugles ? 

Laurent Alexandre : Actuellement, deux technologies sont en développement pour aider les personnes aveugles.

La première concerne la reconnaissance faciale, qui permet de savoir qui se trouve en face de nous. Ces technologies sont destinées aux personnes atteintes d'Alzheimer ou de déficience visuelle, par exemple. Cependant, leur utilisation est réglementée et il est envisagé en Europe de les interdire, sauf dans des cas de prévention du terrorisme ou en cas d'état d'urgence. La reconnaissance faciale est strictement réglementée en Europe afin de préserver la liberté d'aller et venir incognito, car elle pourrait être utilisée à des fins malveillantes grâce aux caméras de surveillance.

Le deuxième type de technologie utilisée est lié aux modèles de langage (LLM). Les modèles de langage, tels que ChatGPT, ont la capacité de comprendre et de décrire le monde réel à travers l'audio ou le texte. Ces technologies peuvent fournir des indications sur l'environnement à partir d'une caméra embarquée, comme les Google Glass, en reconnaissant la présence de voitures, en décrivant les couleurs des arbres et des fleurs, etc.

Quelle est l’étendue de cette technologie ? Une IA peut-elle se tromper dans une description en identifiant mal un médicament, par exemple ? 

La technologie de reconnaissance faciale a connu de fortes avancées ces dernières années. En ce qui concerne les LLM, des progrès restent à faire. Les versions multimodales, telles que la version 4.5 de ChatGPT, qui acceptent l'entrée audio, vidéo et images, sont encore en phase alpha et ne sont pas commercialisées. Bien que certaines entreprises commencent à les utiliser, cette technologie n'a pas encore été déployée à grande échelle.

Cependant, contrairement à ce que l'on pensait, les LLM ont la capacité de comprendre le monde réel et ses interactions. L'exemple de la tasse de café, du dé à coudre et du diamant en est un exemple frappant.

Par exemple, posons la question suivante à ChatGPT 3 : "Je prends une tasse de café, j'y mets un dé à coudre contenant un diamant. Je pose la tasse de café dans la cuisine sur une chaise. Je prends la chaise, monte dans ma chambre et renverse la tasse de café sur mon lit. Je remets la tasse de café sur la chaise et retourne dans la cuisine avant de mettre la tasse de café dans l'évier. Où se trouve le diamant ?" GPT-3 répond que le diamant se trouve dans la tasse de café, dans la cuisine. GPT-4 répond que le diamant est resté sur le lit lorsque la tasse a été renversée.

En résumé, GPT-4 possède un modèle du monde physique, ce qui lui permet de décrire le monde et donc d'aider les personnes aveugles. Il intègre les lois du monde physique dans ses paramètres, contrairement à GPT-3. GPT-4 possède 1 800 milliards de paramètres, contre 175 milliards pour GPT-3.

L'IA peut toujours se tromper, mais elle commet moins d'erreurs que les personnes aveugles, qui sont toujours dans l'erreur puisqu'elles ne peuvent pas voir.

Quelles sont les autres possibilités de cet ordre grâce à l’IA ? Peut-on s’attendre à d’autres innovations majeures dans le secteur de la médecine ?

Les LLM, tels que GPT-4, fournissent d'excellents résultats dans l'analyse des dossiers médicaux complexes, mais uniquement sous forme de texte, car ils n'ont pas encore la capacité d'analyser les images, les sons et les vidéos, comme les radiographies ou les électrocardiogrammes. Dans quelques mois, on pourra leur présenter un dossier médical complet, car il sera bientôt possible de poser des questions d'une longueur de 1 milliard de lettres.

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !