Notre mémoire numérique collective est-elle en train de disparaître ?<!-- --> | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
Société
Skyblog, plus grand site de blogging français, va fermer ses portes en août prochain.
Skyblog, plus grand site de blogging français, va fermer ses portes en août prochain.
©Skyblog

Fin d'une ère

Skyblog, plus grand site de blogging français, va fermer ses portes en août prochain. Mais pour le professeur Michael Nelson, la question des contenus numériques qui s’envolent est beaucoup plus vaste.

Michael Nelson

Michael Nelson

Michael Nelson est professeur au département d'informatique de l'Université Old Dominion.

Voir la bio »

Atlantico : Skyblog, qui était autrefois le leader des blogs en France, va fermer à la mi-août. En quoi cela illustre-t-il le risque de perdre notre mémoire Internet ?

Michael Nelson : C'est en effet très préoccupant. Ce site revêt une importance culturelle et technologique considérable depuis son lancement, même si les blogs ont depuis été éclipsés par les plateformes de médias sociaux comme Facebook, Twitter, Instagram et d'autres. Je comprends que le site n'est plus le même que lorsqu'il a été créé en 2002 ou à une autre date.

Mais il y a un précédent. Vous souvenez-vous du site Geocities aux États-Unis ? Il était très populaire dans les années 90 et permettait aux utilisateurs de créer leurs propres sites web, même s'il ne s'agissait pas exactement d'une plateforme de blog. Il a joui d'une grande popularité jusqu'à ce qu'il soit vendu à Yahoo, qui a eu du mal à lui trouver une orientation claire et a fini par le fermer. Par conséquent, cette capsule temporelle du milieu et de la fin des années 90 a pratiquement disparu. Bien que quelques sites aient recréé Geocities et que l'Internet Archive en ait archivé une grande partie, sa disparition a marqué une perte importante dans le développement du web. Je crains que le même sort n'attende Skype Blogs.

Bien que je ne l'aie pas encore exploré, je crois qu'une partie substantielle de Skyblog est déjà archivée à l'Internet Archive. Cela vaudrait la peine de l'explorer davantage. Dans le communiqué de presse, j'ai remarqué qu'il était fait mention d'une collaboration avec l'INA et la BNF pour l'archivage des documents. Cependant, je ne suis pas certain des détails de leur plan, en particulier en ce qui concerne l'anonymisation des blogs et le transfert des archives. Néanmoins, je sais que l'INA est une organisation réputée et je connais son travail. J'espère qu'elle gérera cette situation de manière appropriée. Il est encourageant de voir que Skyblog est en contact avec eux et avec la BNF, ce qui indique leur intention d'accorder une attention appropriée à cette question au lieu de la fermer brusquement.

Quelles sont les raisons qui motivent ces décisions ?

On croit souvent à tort que la maintenance d'un site web est gratuite ou peu coûteuse, mais ce n'est pas tout à fait vrai, n'est-ce pas ? Le coût de l'hébergement a en effet considérablement diminué au fil des ans. Il est sans aucun doute beaucoup moins cher qu'il y a 10 ou 20 ans. Cependant, le prix réel du maintien en état de marche d'un site web, de la prévention des tentatives de piratage et de la garantie d'une transition en douceur vers la plateforme la plus récente nécessite une quantité considérable de travail humain. Bien qu'il existe des économies d'échelle, je suppose que les responsables de Sky Blog, ou plutôt de Skyrock, se sont rendu compte qu'ils ne pouvaient plus générer de revenus, que ce soit par le biais de la publicité ou par d'autres moyens. L'argent de la publicité s'est largement déplacé vers des plateformes plus importantes comme Instagram, Facebook et Twitter. Par conséquent, les fonds se sont taris, ce qui en fait un fardeau non rentable pour la société mère. Malheureusement, les entreprises donnent généralement la priorité à leurs résultats financiers plutôt qu'à la préservation de l'histoire culturelle. Ce sont les bibliothécaires, les journalistes et les universitaires qui se préoccupent réellement de ces questions. Bien que les entreprises puissent se montrer réceptives à ces sentiments, elles perdent tout intérêt lorsqu'il s'agit d'engager des ressources financières chaque année et pour une durée indéterminée. Si l'on considère que Skyblog existe depuis 21 ans, c'est honnêtement un parcours assez impressionnant pour une société Internet.

Comment la disparition de Skyblog pourrait-elle avoir des conséquences, en termes de culture, de mémoire ?

L'histoire culturelle française, ou du moins l'histoire de la pop en ligne, est certainement en danger. Les sites de fans, les blogs sportifs, les discussions musicales, les critiques d'émissions télévisées contribuent tous à l'esprit culturel de la France d'il y a 20 ans, et l'accès à Skyblog est essentiel à l'étude de cette époque. Cependant, d'autres aspects doivent également être pris en compte. Si Sky Blog peut disparaître, le contenu sur le web trouve souvent de nouveaux emplacements plutôt que de s'évanouir complètement. Il est probable qu'une grande partie du contenu ait déjà été archivée par Internet Archive, d'autant plus qu'ils collaborent avec I et A&B&F. Le contenu existera donc toujours sous une forme ou une autre.

Le défi consiste à le trouver. Il peut être dissimulé dans une ou plusieurs archives web, ce qui le rend difficile à localiser et à explorer pour le commun des mortels. Les universitaires et les chercheurs trouveront probablement des moyens d'y accéder, mais nous sommes préoccupés par la perte d'accessibilité pour le citoyen moyen qui souhaite naviguer et s'intéresser à ce contenu historique. Cette situation me rappelle celle de Geocities, que j'ai mentionnée précédemment. Un autre exemple est Tumblr, qui existe toujours mais qui a subi des changements significatifs, perdant sans doute son essence originale.

Cela fait partie de l'évolution naturelle ou du cycle de ces systèmes. Les sites sociaux tels que Myspace, qui a été l'un des premiers à innover, existent toujours techniquement, mais leur public s'est déplacé vers d'autres plateformes. Sky Blog capture un moment spécifique dans le temps où les gens ont adopté le blogging avant l'avènement des médias sociaux. Il a de la valeur et continuera d'exister, même s'il est difficile de le localiser.

Vous avez mené une étude en 2012 intitulée "Losing My Revolution: How Many Resources Shared on Social Media Have Been Lost?". Combien de ressources partagées sur les médias sociaux ont été perdues ? Qu'avez-vous découvert à l'époque ? 

C'était une préoccupation particulière, notamment parce que je collaborais avec mon doctorant de l'époque, qui se trouvait être égyptien. Il se trouvait aux États-Unis alors que la révolution se déroulait en Égypte. Naturellement, il s'est appuyé sur les médias sociaux pour s'informer, car il n'y avait pas de source fiable de nouvelles en provenance du pays. Les médias sociaux sont devenus une plateforme vitale pour le partage d'informations, d'autant plus que les gouvernements n'avaient pas encore appris à les contrôler ou à les influencer efficacement. Ils ont agi comme une force subversive pendant cette période.

Cependant, le paysage a changé depuis lors. Les gouvernements et les individus sont aujourd'hui pleinement conscients du pouvoir des médias sociaux et s'engagent dans des batailles idéologiques, en utilisant des robots et d'autres tactiques pour influencer l'opinion publique. À l'époque, les images, les vidéos et les informations étaient partagées sur les plateformes de médias sociaux. Par exemple, Twitter ne disposait pas de ses propres services d'hébergement d'images, si bien que les gens se fiaient à des sites d'hébergement d'images externes comme LiveDog et d'autres. Malheureusement, nombre de ces sites ont disparu, entraînant la perte d'une quantité importante de données. Cela s'est produit il y a seulement 11 ou 12 ans, à peu près au moment où la révolution a commencé.

Si l'on voulait reconstituer la chronologie des événements et comprendre l'évolution de la révolution, il faudrait déployer des efforts considérables pour retrouver les tweets originaux, localiser les images associées et les assembler pour former un récit cohérent. Le web est souvent considéré comme la première ébauche de l'histoire, et ces moments étaient véritablement historiques. Les historiens, les universitaires, les journalistes et tous ceux qui s'intéressent à l'histoire voudraient sans aucun doute avoir accès à ce matériel. Cependant, une grande partie de ce matériel a disparu ou est devenu difficile à localiser.

Outre les médias sociaux, il peut y avoir des raisons morales ou éthiques de se souvenir et de préserver ces informations, en particulier dans des situations à fort enjeu comme une révolution. Supposons que le régime qui arrive au pouvoir cherche à punir ceux qui se sont opposés à lui pendant la révolution. Dans ce cas, les archives web doivent veiller à ne pas devenir des outils d'oppression, permettant à des individus de déterrer un soutien passé à des groupes d'opposition et de l'utiliser comme moyen de rétribution. La protection de la vie privée et de la sécurité des personnes doit être prise en compte dans ces contextes.

Car c'est là tout le paradoxe. En même temps, les choses disparaissent, mais quelque chose ne disparaît jamais complètement de l'internet...

Oui, il disparaît et ne disparaît jamais en même temps. Ainsi, si vous avez tweeté pendant la révolution égyptienne et que je voulais vraiment obtenir des informations sur vous et que je pouvais dépenser les ressources nécessaires, je pourrais probablement faire remonter à la surface au moins une partie du contenu aujourd'hui. En 2012, les archives web étaient auparavant caractérisées par des ressources limitées et des progrès lents. Cependant, la situation a considérablement changé. Prenons l'exemple d'Internet Archive. Même si elle ne possède pas le même niveau de ressources que Google ou Amazon, elle a considérablement amélioré ses capacités. L'organisation fonctionne désormais avec une efficacité et une rapidité accrues. Il est très improbable qu'un événement important se produise sans qu'Internet n'en capte une partie substantielle. Cette situation peut être perçue à la fois positivement et négativement, selon la nature du contenu et le point de vue de chacun.

Dans notre étude initiale, nous avons observé un taux de disparition annuel d'environ 10 % pour les ressources en ligne. Cette tendance persiste jusqu'à ce qu'elle atteigne un niveau de référence, où certains contenus continuent d'exister tandis que la majorité disparaît. Au travers de différentes études, nous avons remarqué un déclin linéaire des ressources sur le web, en particulier en ce qui concerne les plateformes ou les sites impliquant une activité humaine. La suppression d'une seule image ou d'un seul tweet n'est pas un scénario typique. Au contraire, les utilisateurs choisissent souvent de supprimer l'intégralité de leur compte ou de s'exposer à une suspension de leur compte, ce qui entraîne la suppression de tout le contenu associé. Par conséquent, plutôt que des suppressions individuelles sporadiques, ce sont des suppressions en masse qui ont tendance à se produire. Ce schéma est illustré par des exemples tels que la chute de Sky Blog, où un site entier a cessé d'exister.

Qui sont les archivistes de l'Internet ? S'agit-il d'un sujet de préoccupation ?

Il existe en effet de nombreuses initiatives d'archivage du web, dont beaucoup sont basées en Europe et soutenues par des bibliothèques et des archives nationales. Par exemple, Archivo est une initiative publique d'archivage sur le web au Portugal, tandis que la British Library et la Bibliothèque nationale de France (BNF) gèrent leurs propres archives sur le web. Bien que l'accès aux archives web de la BNF nécessite une visite dans une salle spéciale à Paris, elles contiennent une mine de contenus précieux. Aux États-Unis, l'initiative la plus importante et la plus fiable est l'Internet Archive, une organisation à but non lucratif fondée par Brewster Kahle. Contrairement aux entreprises commerciales, Internet Archive n'est pas impliqué dans la vente de données à des fins telles que la reconnaissance faciale. Cependant, il est important de reconnaître que les acteurs bienveillants et malveillants ont connaissance de la vaste collection de l'Internet Archive. Bien que l'Internet Archive ne s'engage pas dans des activités douteuses, ses ressources peuvent être consultées et utilisées à la fois par des acteurs bienveillants et malveillants.

Outre l'Internet Archive, il existe d'autres archives web aux États-Unis. L'une de ces initiatives est Perma CC, basée à l'Université de Harvard, qui se concentre sur la préservation des documents juridiques et de la littérature académique pour la communauté académique juridique. Une autre organisation, Archive.today, est basée en Europe de l'Est. Ces archives Web fonctionnent généralement page par page, permettant aux utilisateurs de demander l'archivage d'URL spécifiques. La popularité de l'URL demandé détermine souvent le nombre de copies archivées. Cependant, l'Internet Archive est la seule organisation connue aux États-Unis qui effectue des recherches sur le web à grande échelle, dans le but de capturer autant de contenu que possible sans connaissance préalable de son importance future. Cette approche est particulièrement précieuse si l'on considère que des personnes susceptibles de devenir des personnages influents à l'avenir, comme le prochain Premier ministre français, peuvent avoir tenu des blogs personnels au cours de leurs années de formation. La possibilité d'explorer les perspectives de leur jeunesse et de leur éducation précoce peut offrir des perspectives uniques.

Au sein de l'Internet Archive, il existe un sous-groupe appelé Archive Team, qui agit comme une équipe d'intervention d'urgence lorsqu'un site important annonce sa fermeture. Par exemple, lorsque Yahoo a fermé Yahoo Answers, Archive Team a mobilisé son logiciel décentralisé, permettant aux individus d'extraire et d'archiver le contenu de manière distribuée. Ces efforts garantissent la préservation de bases de connaissances précieuses, telles que le vaste référentiel de questions-réponses de Yahoo Answers. Il est fort probable que l'équipe d'archivage serait également activée dans un scénario impliquant la fermeture de Sky Blog, compte tenu de son importance et de sa longue histoire.

J'ai vu une comparaison selon laquelle la perte de données sur l'internet pourrait être comparable à la perte de la grande bibliothèque d'Alexandrie. Est-ce cela qui est en jeu ?

Cette métaphore est en effet très prisée des bibliothécaires, des universitaires, des philosophes et autres. La perte historique de la bibliothèque d'Alexandrie est un rappel poignant de l'importance de la préservation des connaissances. Toutefois, l'enjeu actuel est bien plus vaste. Il est vrai qu'une partie considérable du contenu menacé peut ne pas être considérée comme importante, comme une abondance de photos de chatons. Cependant, le défi réside dans le fait que nous ne pouvons pas prédire à l'avance ce qui deviendra important à l'avenir. C'est précisément la raison pour laquelle nous nous efforçons de collecter et de préserver autant de contenu que possible. Si la métaphore met l'accent sur l'ampleur de la production culturelle menacée, il est essentiel de reconnaître qu'une partie de cette production peut effectivement être perdue à jamais plutôt que d'être simplement déplacée vers un autre espace numérique.

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !