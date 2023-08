Le siège social de Netflix, à Los Angeles.

Fabrice Epelboin est enseignant à Sciences Po et cofondateur de Yogosha, une startup à la croisée de la sécurité informatique et de l'économie collaborative.

Atlantico : Ellie House, journaliste de la BBC, rapporte que la plateforme de streaming Netflix aurait deviné sa bi-sexualité avant même qu’elle ne s’en rende compte personnellement. Comment est-ce possible ?

Fabrice Epelboin : Ce phénomène est en réalité bien plus vaste et complexe qu'il n'y paraît. Il s'inscrit dans le cadre de la dernière génération d'intelligence artificielle, notamment le Deep Learning, qui implique le traitement de grandes quantités de données personnelles suivies d'observations de corrélations. Pour donner un exemple historique, dans les années 60 et 70, il était possible, en fonction de la marque d'alcool consommée, de déterminer si quelqu'un était plutôt républicain ou démocrate. Ce processus est une extension mathématique poussée de ce type d'observations. Cela va bien au-delà de l'orientation politique, incluant des aspects beaucoup plus sophistiqués. Prenons l'exemple de Cambridge Analytica, une technologie développée par Facebook dans les années 2010. Même à cette époque, avec seulement quelques « likes » sur Facebook, ils pouvaient extrapoler des orientations psychologiques, y compris politiques et potentiellement sexuelles. L'analyse est bien plus subtile, prenant en compte des signaux discrets. Par exemple, si un homme apprécie à la fois Mylène Farmer et Étienne Daho, cela pourrait permettre de tirer certaines conclusions. Cependant, ces signaux peuvent être bien moins évidents et difficiles à percevoir pour un être humain, mais aisément identifiés par un algorithme. Ainsi, des occurrences spécifiques aboutissent à des catégorisations.

Ce qui intrigue, voire inquiète, c'est que l'intelligence artificielle puisse déduire des informations sur une personne avant même qu'elle ne les partage, comme son orientation sexuelle. Comment cela peut-il être réalisé ?

Dans certains cas, des signaux faibles se développent chez une personne sans qu'elle en ait conscience. Ces signaux agissent comme des indicateurs ou précurseurs. On peut citer le système de fidélisation de Walmart, qui a réussi à anticiper une grossesse avant même que la personne ne le sache. Cela s'applique à de nombreux systèmes, et même si certains détails sont encore flous, ils sont déjà opérationnels. Par exemple, la jeune femme enceinte que je viens d’évoquer a reçu des promotions pour des couches pour bébés puisque le système avait identifié des indices de grossesse.

Est-ce que cette situation devrait susciter des inquiétudes ?

Bien entendu. Ce phénomène a même contribué à des manipulations politiques, comme l'ingérence dans l'élection présidentielle américaine de 2016. Il est très probable que d'autres élections aient été influencées de la même manière. L'impact de l'intelligence artificielle est immense et transforme profondément nos sociétés depuis un certain temps. Ces algorithmes qui polarisent l'opinion publique sont propulsés par l'intelligence artificielle, et ce, depuis plus de 15 ans. Alors que ce sujet était auparavant peu discuté, il suscite maintenant des préoccupations majeures. Malheureusement, il est probablement trop tard pour prendre des mesures significatives. Peut-être que l'Europe parviendra à mettre en place des réglementations, mais cela reste incertain.

Ce qui rend la situation particulièrement insidieuse, c'est que, bien qu'il soit illégal de constituer un fichier en fonction de la religion d'une personne, il est tout à fait possible de le deviner. Ainsi, les lois visant à empêcher la création de tels fichiers deviennent pratiquement inefficaces face à ces outils sophistiqués et de nombreux concepts juridiques perdent leur pertinence. Par exemple, des ciblages ethniques étaient possibles sur Facebook il y a à peine quelques années.

Comment évaluer la fiabilité des prédictions probabilistes de ces algorithmes ?

La fiabilité dépend des modèles, mais dans l'ensemble, ils sont très efficaces. Si l'objectif est de mener des campagnes marketing et de tolérer une marge d'erreur d'environ 5 %, alors ils sont parfaitement adaptés. Actuellement, ces systèmes sont principalement orientés vers le marketing, ce qui était à l'origine le but des réseaux sociaux.

Est-il possible de tromper ce type d'algorithme ? Si oui, comment ?

En introduisant délibérément de fausses informations ou en adoptant des comportements borders. Par exemple, sur YouTube, regarder une grosse quantité de chaînes qui sont aussi bien d'extrême-gauche que d'extrême-droite. Cela laisse penser que l'algorithme de YouTube a du mal à définir quel bord privilégier. Il est possible que l'algorithme vous relie à des profils similaires au vôtre en termes de consommation de contenu, mais avec des caractéristiques spécifiques. Néanmoins, cela reste complexe. Avec plus de 2 milliards d'utilisateurs, même si vous partagez certaines habitudes, l'algorithme s'appuie sur un modèle statistique qui peut être difficile à contourner. L'humain est en quelque sorte dépassé par cette forme d'intelligence, car nous ne pouvons pas assimiler 25 milliards d'informations, contrairement à une machine. Cette notion d'intelligence dépasse notre capacité de compréhension et de traitement.

Nous pouvons facilement anticiper les problèmes dans les pays où l'homosexualité est criminalisée.

Imaginez un scénario où de nombreux pays demandent à Twitter ou Facebook de fournir une liste de personnes ayant un profil homosexuel. Cela pourrait avoir des conséquences graves. Si un algorithme de ce genre était appliqué aux logs de connexion des fournisseurs d'accès à Internet, des entreprises d'État pourraient être contraintes de divulguer ces informations. Nous sommes pas loin de scénarios de science-fiction, bien que certains événements de ce genre se soient déjà produits.

Netflix a-t-il des particularités dans sa manière de fonctionner par rapport à d'autres entreprises ?

Absolument. Netflix exploite les données de manière bien plus poussée que l'industrie cinématographique traditionnelle à Hollywood. Ils peuvent comprendre ce qui fonctionne ou non dans une série en fonction des habitudes de visionnage. Ils ne se contentent pas seulement de recommander du contenu pertinent, mais ils influencent aussi la manière d'écrire les scénarios. En effet, plutôt que de suivre des conventions créatives préétablies, ils s'appuient sur les données pour identifier les éléments qui plaisent au public et peuvent adapter la manière d'écrire les épisodes en fonction de ces données.

Au-delà de cela, du point de vue du marketing, Netflix peut également avoir une idée du pourcentage d'audience appartenant à la communauté LGBT. Cela leur permet de suggérer du contenu pertinent pour cette communauté ou d'ajuster leur stratégie si cette part de marché est moins significative que prévu. En somme, les données influencent profondément leurs décisions marketing.

