La grande histoire des familles, racontée par le big data | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
Société
Deux jeunes fermiers à Helsinki (Finlande), dans les années 1930.
Deux jeunes fermiers à Helsinki (Finlande), dans les années 1930.
©STRINGER / AFP

Il était une fois la vie

La grande histoire des familles, racontée par le big data

Les archives racontent le déclin du patriarcat, l'essor et le déclin des mariages précoces et les conséquences des pandémies ; la numérisation des données pourrait révéler des histoires encore plus riches.

Eryn Brown

Eryn Brown

Eryn Brown est une écrivaine et rédactrice indépendante dont les travaux ont été publiés dans le Los Angeles Times, le New York Times, Nature et d'autres publications.

Voir la bio »

Cet article a été publié initialement sur le site de la revue Knowable Magazine from Annual Reviews et traduit avec leur aimable autorisation.

Ils n'ont peut-être pas la portée d'un roman, le pathos d'une pièce de théâtre ou la beauté d'un poème, mais les faits et les chiffres recueillis par le biais du recensement nous en disent long sur nous-mêmes et sur les générations qui nous ont précédés.

Il suffit de demander à Steven Ruggles, démographe historique à l'université du Minnesota, qui a construit sa carrière en décryptant les données du recensement pour retracer l'histoire de la famille dans le monde occidental. En exploitant les archives publiques, Ruggles peut apprendre comment les structures familiales ont évolué au fil du temps : qui et quand les gens se marient, quand ils ont des enfants, où et comment les gens vivent, comment ils gagnent leur vie.

Ces dernières années, l'accès facile aux archives numérisées a accéléré son travail. En tant que directeur de l'Institute for Social Research and Data Innovation de son université, Steven Ruggles a lancé en 1993 la plus grande base de données au monde reliant les dossiers de recensement et d'autres données historiques. Connue sous le nom d'IPUMS, cette collection suit les données du recensement américain de 1790 à nos jours, ainsi que les données de plus de 100 agences statistiques nationales dans le monde, et de diverses autres archives.

L'IPUMS est l'une des premières bases de données à suivre les individus dans le temps et à travers les lieux - une mine d'or pour les démographes et de nombreuses autres sortes de chercheurs, dit Ruggles, qui a évalué l'avenir de la démographie historique dans l'Annual Review of Sociology de 2012 et, avec des coauteurs dans la même revue, a détaillé en 2018 comment les démographes tentent de relier les registres de recensement. "C'est ce qui est vraiment en train de devenir une affaire énorme dans le monde de la démographie historique", dit-il.

À Lire Aussi

"Les fantômes familiaux" : ce que révèle notre arbre généalogique

Rien qu'en 2021, les universitaires du monde entier utilisant l'IPUMS ont publié des articles sur la santé maternelle, la lutte contre le tabagisme, l'accessibilité au loyer et la méthodologie de la démographie. M. Ruggles a expliqué à Knowable pourquoi la recherche de ce type de données est si attrayante pour les démographes. Cette conversation a été modifiée pour des raisons de longueur et de clarté.

Pourquoi avoir rassemblé cette énorme quantité de données démographiques ?

Dans les années 1970, je me suis intéressé à l'impact des changements démographiques sur la composition des familles. Il y a eu cette énorme transition démographique à partir du XIXe siècle, où la mortalité a chuté, puis la fécondité. Le monde en a été transformé.

Je voulais étudier ce que ce changement signifiait pour les modes de vie des familles. Auparavant, au 16e ou 17e siècle, les gens avaient beaucoup d'enfants mais se mariaient très tard. La plupart des gens mouraient avant la naissance de leurs petits-enfants, de sorte que le potentiel des familles multigénérationnelles était fortement limité. Il a explosé plus tard, lorsque les "familles d'entreprise" - systèmes familiaux patriarcaux fondés sur la propriété foncière ou commerciale - sont devenus la norme.

Bien sûr, on ne pouvait pas vraiment mesurer ce phénomène avec les données existantes, qui étaient fragmentées - des rapports sur des documents de recensement, compilés par des démographes travaillant seuls, pour des villes individuelles et des années isolées. J'ai donc commencé à travailler avec des microsimulations : des modèles démographiques qui vous permettent de construire et de bâtir des populations virtuelles dont le comportement est connu dans le temps, en gardant la trace de toutes les relations.

À Lire Aussi

Psychogénéalogie : comment les générations familiales qui nous précèdent laissent leur empreinte sur notre identité

C'est par là que j'ai commencé, mais j'ai été déçu par la modélisation démographique. On ne peut pas aller très loin. Dans les années 80, j'ai donc commencé à travailler sur la collecte de données historiques, et c'est ce que je fais depuis.

Quels types de données recueillez-vous et diffusez-vous ?

Il s'agit de données de recensement américaines au niveau individuel, qui comprennent, à un niveau de base, les réponses que chaque famille américaine soumet aux enquêtes de recensement tous les 10 ans. Les données individuelles à partir des années 1950 sont toutes gardées au sein du Census Bureau en raison des règles de confidentialité, mais les rapports antérieurs sont accessibles au public. Nous avons récupéré et organisé l'accès à des données similaires pour un grand nombre d'autres pays - en tout, 109 agences statistiques nationales. Les seuls grands pays qui nous manquent sont le Japon et l'Australie, que nous essayons encore de persuader de partager.

Quelles informations sont incluses dans les données de recensement au niveau individuel ?

Elles varient. Le recensement type recueille des informations sur la taille et la composition du ménage, ainsi que sur le travail, la profession, les heures travaillées, les semaines travaillées l'année précédente et le niveau d'instruction. On y trouve aussi souvent des informations sur le logement - le type de plomberie dont dispose une famille, la composition des murs et du toit de la maison, le combustible utilisé pour la cuisson, etc. 

Ce qui est intéressant, c'est que tous les individus recensés dans un recensement sont imbriqués dans des familles, ce qui permet de connaître les relations entre les personnes - qui est marié et qui est divorcé, qui est parent et qui est enfant. Cela vous permet de construire des variables supplémentaires à suivre, telles que la profession du mari ou l'éducation de la mère, qui pourraient vous aider à étudier comment le statut économique est lié à la fertilité, pour citer un exemple.

À Lire Aussi

Psychogénéalogie : l'impact du milieu social et de la culture familiale

Grâce à la numérisation, nous avons maintenant un accès facile à ces données qui couvrent toute l'histoire des États-Unis. Ce que nous essayons de faire maintenant, c'est de relier le tout - de retracer les gens à travers les générations et les vies et de voir ce qui leur est arrivé. C'est un nouveau développement extrêmement intéressant.

Que signifie "relier les données" ?

Il s'agit de suivre des individus, grâce à leurs données de recensement, tout au long de leur vie. Nous les relions à leurs parents, puis à leurs parents tout au long de leur vie - sur plusieurs générations. Nous pouvons également suivre les individus dans d'autres sources, notamment les dossiers administratifs, les dossiers de la sécurité sociale et les dossiers militaires, ainsi que toutes sortes de petits ensembles de données provenant d'autres secteurs de la société, comme une entreprise qui recueille des données extrêmement riches sur ses employés.

Lorsque nous avons tenté pour la première fois de coupler des enregistrements au début des années 2000, nous nous sommes dit que nous ne pouvions pas coupler tout le monde et que nous allions simplement essayer d'obtenir un ensemble représentatif. Mais maintenant, nous allons essayer de relier tout le monde. Cela va me prendre jusqu'à la fin de ma carrière.

Le processus est-il automatisé, ou quelqu'un doit-il tout étiqueter ?

Il faut que ce soit automatisé, parce que nous allons avoir un milliard d'enregistrements. Nous n'avons pas autant d'assistants de recherche !

Quel genre de choses étudiez-vous ?

En ce moment, je travaille sur un article sur les différences raciales dans le mariage depuis 1960. J'ai mis au point une nouvelle méthode pour mesurer les taux de premier mariage en fonction de l'âge, ce qui permet aux chercheurs de jeter un regard neuf sur l'hypothèse de la "nuptialité masculine" - la notion selon laquelle si les couples noirs sont moins nombreux à se marier, c'est parce qu'il y a une pénurie d'hommes noirs mariables.

Les données montrent qu'au XXe siècle, les circonstances économiques expliquent la différence entre les taux de mariage. L'écart se réduit au XXIe siècle, et je pense que c'est le résultat du déclin de l'importance du travail masculin. Maintenant, l'importance relative d'autres facteurs, comme le revenu des femmes, est un facteur beaucoup plus important.

Vous avez étudié le travail des femmes tout au long de votre carrière.

Oui. Je soutiens que l'essor du travail des femmes est l'un des principaux événements de transformation de la structure familiale. Au XIXe siècle, nous avions la famille corporative, dans laquelle le travail était effectué dans des fermes ou d'autres entreprises familiales, avec ou sans esclaves. Toute la famille était impliquée, et l'autorité était confiée à l'homme le plus âgé.

Les données du recensement américain et d'autres documents révèlent des changements spectaculaires dans les économies familiales. La "famille d'entreprise" ("corporate family"), par exemple, c'est-à-dire de grandes unités familiales organisées autour d'une seule entreprise ou d'une seule ferme, a dominé pendant près d'un siècle, avant de céder la place à des ménages dirigés par des hommes salariés ("male breadwinner family), puis à des couples à double revenu ("dual earner family") et à des femmes seules ("female breadwinner family").

La première remise en cause de cet ordre a été l'apparition d'emplois masculins raisonnablement rémunérés. Avec d'autres opportunités, les fils n'étaient pas obligés de rester dans le coin, et les familles multigénérationnelles se sont rapidement érodées. Puis les familles dirigées par un homme ont prédominé, de 1930 à 1970. En 1980, les familles à double revenu ou à revenu féminin ont dépassé les 50 % des ménages de couples mariés. Les familles avec femme soutien de famille constituent désormais une catégorie importante.

Vous avez mentionné que les gens se sont mariés tardivement aux 16e et 17e siècles. J'aurais supposé que les gens se mariaient toujours jeunes avant le 20e siècle.

Roméo et Juliette est l'une des raisons pour lesquelles les gens pensent cela. Sauf que Shakespeare n'écrivait pas sur sa propre période de l'histoire, lorsque l'âge du mariage était le plus élevé. Il écrivait sur un endroit exotique et ancien d'Italie où il imaginait que les gens se mariaient très jeunes.

La vérité, c'est qu'ils ne le faisaient pas. Dans le système familial européen, il fallait avoir des terres et un moyen de subvenir aux besoins de sa famille avant de pouvoir se marier, et le mariage avait donc tendance à être assez tardif. À la fin du XVIIe siècle, l'âge médian du mariage en Angleterre était de 27 ans pour les femmes, et peut-être 29 ou 30 ans pour les hommes.

Quel est l'âge médian du mariage aujourd'hui ?

Historiquement, vous pouvez mesurer l'âge réel du mariage, mais vous ne pouvez pas le faire pour le présent. Nous ne savons pas à quel âge les gens d'aujourd'hui vont se marier parce qu'ils n'ont pas encore fini de se marier. Nous ne le saurons que lorsque tout le monde sera mort et enterré. 

À titre d'estimation, cependant, parmi les femmes blanches, la médiane actuelle est d'environ 29 ans. Pour les hommes, c'est juste un an ou deux de plus. C'est plus tard que jamais auparavant, certainement dans l'histoire américaine, et c'est probablement plus tard qu'en Europe du Nord-Ouest dans les années 1600.

On peut également prévoir la proportion de personnes qui ne se marieront jamais. Elle pourrait approcher les 40 % lorsque les jeunes de 20 à 24 ans d'aujourd'hui atteindront l'âge de 45 à 54 ans.

L'âge auquel les gens se marient a fluctué au cours des siècles. Aux États-Unis, les données du recensement montrent que l'âge du mariage pour les hommes et les femmes a atteint son niveau le plus bas dans les années 1960, puis a augmenté de façon spectaculaire pour atteindre un nouveau sommet aujourd'hui.

S'agit-il d'un changement frappant ?

Beaucoup de démographes disent que les gens retardent simplement le mariage. Mais cela ne s'est jamais produit auparavant, sauf dans une cohorte : les personnes qui ont atteint leur majorité pendant la Seconde Guerre mondiale. Dans toutes les autres cohortes du XXe siècle, le pourcentage de femmes mariées entre 20 et 24 ans est un très bon indicateur de la proportion de femmes qui se marient un jour.

Mais encore une fois, je ne suis pas vraiment chargé de prédire l'avenir, car je suis un historien ! Je peux donc me tromper.

De toute évidence, ces tendances nous disent quelque chose sur l'histoire, et sur nos origines. Y a-t-il aussi des implications politiques ?

L'impact des facteurs économiques sur les familles a d'énormes implications politiques. La démographie a également un énorme potentiel pour améliorer notre compréhension de la santé.

Ces dernières années, en partie parce que nous disposons de toutes ces nouvelles données, de nombreuses recherches ont été menées sur la pandémie de 1918 - son impact et son écho à long terme. Les chercheurs s'intéressent aux bébés conçus pendant cette pandémie et voient ce qui leur est arrivé par rapport aux personnes conçues juste avant et juste après, et suivent ces résultats dans le temps. J'imagine que la pandémie de Covid-19 aura elle aussi des conséquences considérables.

La recherche sur la pandémie de 1918 se poursuit-elle ?

Il s'agit d'un véritable boom, alimenté par les nouvelles données. La plupart des démographes qui étudient la grippe de 1918 dans notre centre de population s'intéressent à son impact sur le travail, la famille et la pauvreté. L'étude des dossiers liés aux personnes qui étaient très jeunes en 1918 - y compris les personnes in utero à l'époque - montre qu'elles ont porté des cicatrices pour le reste de leur vie : des conséquences néfastes sur la santé, un niveau d'éducation inférieur et une moindre réussite économique.

Une autre étude très intéressante sur la santé a associé le recensement de 1930 aux dossiers du service sélectif de la Seconde Guerre mondiale.

Les chercheurs ont examiné les personnes qui étaient des nourrissons ou de très jeunes enfants en 1930 et ont déterminé l'acidité de l'eau dans les quartiers où elles ont grandi. Cela correspond à la quantité de plomb dans leur eau potable. En examinant également les dossiers du service sélectif de chaque individu, qui comprenaient des tests de QI, ils ont découvert que 20 % de la variation des tests d'intelligence en 1945 pouvait être liée à la teneur en plomb de l'eau dans laquelle ils étaient enfants.

Aujourd'hui, le même groupe s'efforce d'établir un lien entre les personnes qui étaient enfants en 1940 et la présence de plomb dans l'eau, d'une part, et les dossiers médicaux, d'autre part, afin de déterminer s'il existe un lien entre les niveaux de plomb et l'apparition précoce de la maladie d'Alzheimer. Je suis sûr que l'utilisation de données comme celles-ci pour étudier Covid-19 sera une source importante de thèses de doctorat pour de nombreuses décennies à venir. À terme, cela deviendra aussi de la démographie historique.

Traduit et publié avec l'aimable autorisation de Knowable Magazine. L'article original est à retrouver ICI.

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !