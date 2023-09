Il est indéniable que les LLM (Large Language Models, dont font partie ChatGPT, Med-PaLM ou LLaMA) présentent un grand potentiel en médecine.

Chirurgien de formation, également diplômé de Science Po, d'Hec et de l'Ena, Laurent Alexandre a fondé dans les années 1990 le site d’information Doctissimo . Il le revend en 2008 et développe DNA Vision , entreprise spécialisée dans le séquençage ADN. Auteur de La mort de la mort paru en 2011, Laurent Alexandre est un expert des bouleversements que va connaître l'humanité grâce aux progrès de la biotechnologie.

Atlantico : En France comme ailleurs, de nombreux malades se tournent vers Google et consultent des forums ou les réseaux sociaux pour trouver des réponses à leurs questions. Dans quelle mesure est-ce une approche fiable ? Quelles sont ses faiblesses éventuelles ?

Jean-Emmanuel Bibault : L’utilisation de moteurs de recherche est très répandue pour l’auto diagnostic ou le traitement. Mais de plus en plus de patients évitent en réalité de le faire car ils savent que la qualité de l’information médicale qu’ils vont trouver n’est pas garantie. Même dans le cas où l’information est fiable, elle n’est pas forcément applicable à la situation personnelle du patient. Enfin, obtenir une information générale, sans explications personnalisées, tout seul devant son ordinateur, peut se révéler plus anxiogène qu’autre chose. Au total, même si tout ce qu’on trouve sur internet n’est pas forcément de mauvaise qualité, il y a plus de raisons de ne pas consulter ces sites seuls.

Laurent Alexandre : On change d’époque en matière de web grand public : on passe de la génération Doctissimo/Google à la génération Chat GPT. La supériorité des réseaux de neurones avec Chat GPT en médecine est très forte, même si des faiblesses, telles que des hallucinations (erreurs commises par Chat GPT) existent.

Les patients vont vouloir des diagnostics et dialoguer à propos de leur maladie, ce que ne permet pas Google ou Doctissimo.

Chat GPT représente la médecine 2.0. Nous sommes dans une phase de dépassement des médecins par Chat GPT. Il y a quelques jours, on a appris qu’aux Etats-Unis, une maman avait vu 17 spécialistes de la douleur qui n’avaient pas trouvé l’origine de celle-ci chez son enfant, alors que Chat GPT avait trouvé l’origine en quelques secondes. Ces anecdotes vont se multiplier et traduire le fait que les médecins, sans l’IA, vont être dépassés.

Un rapport publié dans Nature début juillet par un groupe dirigé par des informaticiens de Google indiquait que les réponses générées par Med-PaLM, un chatbot IA que la société a construit spécifiquement pour un usage médical, « se comparent favorablement aux réponses données par les cliniciens ». L’IA ou des plateformes comme ChatGPT sont-elles un tournant dans l’histoire de la médecine ?

Jean-Emmanuel Bibault : Il est indéniable que les LLM (Large Language Models, dont font partie ChatGPT, Med-PaLM ou LLaMA) présentent un grand potentiel en médecine. Quelques exemples : GPT4 passe l’USMLE (la portion écrite de l’examen pour devenir médecin aux Etats-Unis) avec 85% de bonnes réponses (Kung et al, PLoS Dig. Health, 2023). Ce même modèle parvient à retrouver le bon diagnostic simplement à partir d’une liste de symptômes dans 87% des cas contre 65% des cas pour les médecins humains (Hailu et al, STAT, 2023). Ces modèles ont donc au moins un intérêt pour la démarche diagnostic, même s’ils ne sont pas capables de raisonnement. Bien sûr, la pratique de la médecine dépasse largement le diagnostic, mais c’est déjà un début très significatif.

Laurent Alexandre : Les médecins ne vont pas pouvoir travailler dans l’IA car la médecine est devenue trop complexe. Chat GPT connaît lui toute la connaissance mondiale. Nous avons vu cette évolution dans d’autres domaines. Dans avion, l’ordinateur de bord est indispensable aujourd’hui.

Un robot chirurgien autonome n’est cependant pas crédible à court terme. La robotique n’ets pas pour demain. La révolution des robots va arriver dans un second temps. Aujourd’hui, on ne parle que de diagnostics avec l’IA. Chat GPT présentera d'ailleurs très prochainement son premier robot appelé Neon.

In fine, qui du Docteur Google ou du Professeur ChatGPT est le plus fiable ? Quelles sont leurs différences fondamentales ?

Jean-Emmanuel Bibault : Les applications des modèles LLMs me semblent bien plus intéressantes que les résultats d’une recherche Google. Il semble que les LLM parviennent à « capturer » une forme de savoir qui échappe aux algorithmes de Google. Pour autant, les LLMs posent également le problème de ce que l’ont appelle les « hallucinations" : ils sont enclins à inventer des faits, comme des études scientifiques ou médicales qui n’ont jamais existé, pour justifier ce qu’ils affirment. C’est particulièrement problématique en médecine. Dans l’état actuel de leur développement, il est donc impératif qu’un expert contrôle leur résultat.

À l’avenir, l’Intelligence Artificielle sera-t-elle bientôt incontournable dans le monde de la santé ? Pour autant, une intervention humaine sera-t-elle toujours nécessaire pour soigner les malades ?

Jean-Emmanuel Bibault : En réalité, l’IA est déjà incontournable dans le monde de la santé. Du dépistage, au traitement, en passant par le diagnostic et le suivi des patients, l’IA est déjà entrée dans la prise en charge de nombreuses pathologies. L’IA permet de faire aussi bien, parfois mieux, plus rapidement, notamment dans les tâches de perception (analyse d’examens d’imagerie ou de biopsies). Pour autant, l’IA n’est pas magique et il est absolument nécessaire que les algorithmes soient évalués et validés avant d’être utilisée en routine clinique. Ces étapes sont loins d’être triviales et sont parfois encore négligées. Il existe donc un enjeux majeur sur la régulation de l’IA en santé : comment ne pas brider l’innovation tout en imposant un cadre législatif stricte et protecteur pour les patients ? C’est un des grands défis des années à venir.