Biologie moléculaire : pourquoi les scientifiques transforment les molécules en musique<!-- --> | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
Science
Une séquence d'ADN.
Une séquence d'ADN.
©AFP - KTSDESIGN / SCIENCE PHOTO LIBRARY / KTS

Recherche

Selon un article publié dans la revue Smithsonian, la conversion des séquences d'ADN et des vibrations des particules en notes permet aux chercheurs de reconnaître des modèles invisibles et de créer de la musique dans le cadre de la recherche scientifique.

Mark Temple

Mark Temple est Maître de conférences en biologie moléculaire à l’Université de Western Sydney.

Voir la bio »

Atlantico : Selon un article publié dans la revue Smithsonian, les scientifiques transforment les données biologiques en sons depuis les années 1980. Vous travaillez vous-même sur ces questions. Comment cela est-il possible ? L'utilisez-vous pour vos propres découvertes ?

Mark Temple : Je pense que dans les années 1980, les gens composaient de la musique inspirée par la séquence de l'ADN. C'est une chose intéressante à faire, mais qui n'entre pas vraiment dans la même catégorie que ce que je cherche à réaliser. J'essaie d'utiliser l'audio comme un outil pour mettre en évidence les caractéristiques des séquences d'ADN écrites. J'ai réfléchi à la façon dont les cellules de notre corps utilisent l'ADN dans le cadre de la vie normale de la cellule. L'ADN est une longue molécule en forme de chaîne, composée de milliards de substances chimiques A, C, T et G liées entre elles. D'autres éléments (les protéines) se lient à ces chaînes de lettres et se déplacent le long de celles-ci comme un train sur une voie ferrée. Lorsque ces protéines se déplacent sur l'ADN, elles lisent les lettres et, à l'occasion, elles commencent à fabriquer des protéines ou une autre molécule d'ADN. Ainsi, lorsque je travaille avec ces séquences d'ADN, je lis la séquence d'ADN à l'aide d'un ordinateur et je convertis l'ADN en longues chaînes de notes de musique. 

Il est important de noter que les règles que j'utilise pour transformer la séquence en notes de musique sont basées sur le "code génétique" découvert dans les années 1960. Le "code génétique" biologique stipule que chaque fois que vous voyez une séquence de A suivi de T suivi de G (c'est-à-dire ATG), cela peut être le début d'un gène. Ainsi, lorsque je vois ATG, je l'utilise comme un interrupteur pour commencer à fabriquer du son. De même, lorsque je vois une séquence telle que TAA, je sais qu'elle pourrait être la fin d'un gène. J'utilise donc TAA pour arrêter de produire du son. Il y a 64 interrupteurs simples dans la séquence d'ADN et je les utilise pour modifier le son de l'audio. 

À Lire Aussi

Quand des scientifiques piratent leur propre ADN pour accélérer la recherche

Lorsque mon ordinateur lit une séquence d'ADN particulière, il produit toujours exactement la même sortie audio. Ainsi, en écoutant le son, j'ai une bonne idée des caractéristiques de la séquence d'ADN. Je pense que lorsque les gens composent de la musique inspirée par une séquence d'ADN, il n'y a pas de véritable lien entre les deux. Je pense que certains des problèmes qu'ils rencontraient il y a 40 ans existent encore aujourd'hui. Par exemple, il est difficile de jouer une mélodie musicale composée de 64 notes, car les instruments ne sont tout simplement pas assez grands. Il n'est pas non plus très musical de passer de la 3e note à la 52e note, par exemple, car il s'agit d'un grand intervalle et cela ne sonne pas du tout musical. 

Comment la conversion des données en sons améliore-t-elle la recherche et la communication scientifique ?

Un domaine de recherche important est le développement d'outils pour nous aider à étiqueter les séquences d'ADN brutes afin de pouvoir commencer à comprendre le rôle de la séquence d'ADN dans la croissance, le développement et la maladie. Sans ces outils, nous ne faisons que regarder de longues chaînes de lettres. Avec ces outils, nous sommes en présence de gènes, de régions régulatrices, etc. Actuellement, ces outils produisent des affichages visuels utiles. J'ai pensé que ce serait une amélioration d'utiliser de nouveaux outils qui créent un affichage audio. Je pense que la combinaison d'un affichage visuel et d'un affichage audio est une approche puissante. 

En termes de communication scientifique, je pense que l'audio brut produit est intéressant à écouter. Je pense que la première question que les gens se posent est : comment est-ce possible ? Comment pouvons-nous écouter une séquence d'ADN ? De toute évidence, l'ADN ne produit pas de son que nous pouvons entendre. Une fois que les gens commencent à y réfléchir, nous pouvons avoir des discussions sur le rôle de la fonction et du processus de l'ADN. Nous pouvons à nouveau penser aux protéines qui parcourent les pistes de l'ADN et fabriquent de nouvelles molécules. C'est comme si le son était la bande sonore des processus cellulaires d'expression des gènes.

À Lire Aussi

Une découverte fait émerger une nouvelle théorie sur les secrets de l’apparition de la vie sur Terre

Je trouve parfois difficile d'écouter le son généré par les données d'autres personnes. Souvent, il peut être robotique et répétitif, ou atonal et agité. Je trouve qu'il peut être difficile de faire le lien entre ce que l'on entend et les données originales qui ont été générées. J'ai donc pensé que pour la communication scientifique, il serait bon d'essayer de créer un son systématique qui sonne musical. Je pense que cela rend la communication scientifique beaucoup plus intéressante et moins fatigante pour les oreilles. 

Y a-t-il des domaines de recherche où la "musification" donne des résultats particulièrement remarquables ?

J'ai vu quelques articles intéressants dans lesquels des personnes utilisent une approche plus musicale pour représenter des données scientifiques, comme l'utilisation de séquences d'ADN microbien pour composer de la musique (Peter Larsen), l'utilisation de l'épigénomique comparative pour créer des motifs musicaux (David Brocks) et l'utilisation de motifs musicaux pour interpréter des données d'expression génétique (Martin Staege). J'ai également écouté le podcast "Loud Numbers", qui présente des exemples très intéressants de personnes faisant de la musique à partir de diverses sources de données.

J'ai à nouveau adopté ma propre approche pour rendre l'audio scientifique plus musical. J'utilise l'audio comme s'il s'agissait de la musique d'un musicien imaginaire dans une salle de répétition. D'autres musiciens et moi-même jouons ensuite sur l'audio. L'audio lui-même reste inchangé mais nous le rendons plus intéressant à écouter pour un public. Nous ajoutons des éléments de composition tels que des introductions et des fins musicales pour correspondre au début et à la fin des gènes ainsi que d'autres éléments de composition musicale.

En tant que musiciens, nous sommes également contraints par l'audio et nous jouons d'une manière très différente car l'audio est le joueur dominant. Étonnamment, cela nous a incités à jouer dans des tonalités inhabituelles, à des tempos qui ne nous sont pas familiers ou à jouer des structures de chansons inhabituelles. L'élément clé que je voulais atteindre en faisant de la musique à partir de l'audio est que je voulais que la musique sonne bien en soi. Sans savoir que la musique contient de l'audio scientifique, je voulais simplement qu'elle sonne bien en tant que morceau de musique.

Ces deux approches sont complémentaires, dans l'une les données créent le son, dans l'autre le son sert d'étincelle créative pour écrire une nouvelle musique. Je pense que la transition de l'une à l'autre est intéressante et cela m'a fait penser à des choses en dehors de la science, comme l'audio génératif et d'autres choses.

Est-ce efficace pour la vulgarisation ? Le grand public pourrait-il avoir un meilleur accès à la recherche scientifique ou aux publications qui ne sont souvent pas faciles à comprendre par le grand public ?

Je pense effectivement que c'est un excellent moyen de vulgariser l'idée d'interpréter des données complexes comme les séquences biologiques. Mes vidéos montrant des animations de séquences d'ADN avec le son de la science ont été vues plus de 50 000 fois sur YouTube et je reçois un tas de commentaires complémentaires à leur sujet. Je sais que les chats jouant du piano obtiennent plus de vues, mais pour le travail d'intello que je fais, cet engagement public est vraiment bon.

J'ai également publié des publications de recherche décrivant ce travail et il est vrai que celles-ci ne sont parfois pas faciles à comprendre par le public. Personnellement, je m'efforce d'utiliser un anglais simple dans ces publications et je pense que cela permet aux personnes qui n'ont pas une formation technique poussée de lire les articles. Je pense qu'en général, les scientifiques doivent faire plus d'efforts pour écrire avec moins de jargon technique.

Normalement, lorsque nous rédigeons des articles scientifiques, ils ne sont souvent lus que par un petit groupe de réviseurs et d'experts, et c'est donc à eux que nous nous adressons. Lorsque j'ai commencé à parler à des blogs scientifiques et à des organes d'information, j'ai eu beaucoup de mal à décrire ce que je faisais en utilisant des termes courants, et c'était un vrai problème. Mais comme l'audio était si captivant, j'ai fini par parler aux gens à plusieurs reprises de la façon dont il était généré et je pense que je suis devenu un peu meilleur pour en parler. Cela m'a également aidé, en tant que scientifique, à réfléchir à la manière dont j'aborde mes recherches.

Pourrait-il devenir un jour un langage pour la transmission d'informations entre chercheurs du monde entier ? En connaissez-vous des exemples ?

Je suppose que l'Internet rend très facile de nos jours la transmission d'informations dans le monde entier. Toute personne disposant d'une connexion Internet peut se connecter à un outil web, tel que celui que j'ai construit pour écouter la sonification du génome du coronavirus. La séquence génétique est lue en temps réel pour toute personne qui se connecte.

Considérer l'audio comme un langage qui décrit les données est une proposition intéressante et très perspicace. Dans le cas de mon travail, je pense que ce langage est trop difficile pour que quiconque puisse le maîtriser, car il faudrait une oreille parfaite et des années d'apprentissage. Lorsque j'entends des notes ou des motifs musicaux distincts ou une variation de la signature temporelle dans l'audio, je sais que l'ADN contient quelque chose d'intéressant. Mais le langage audio n'est pas assez clair pour que je puisse savoir exactement ce qu'est la séquence d'ADN. Pour cette raison, je pense que l'audio fonctionne mieux comme une bande sonore d'un affichage visuel. Lorsque les deux affichent les mêmes données, je pense que la combinaison est plus puissante que chacune d'elles prise isolément.

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !