Ce qu’il faut vraiment retenir des sondages à 4 jours du premier tour de l'élection présidentielle 2017<!-- --> | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
Politique
Ce qu’il faut vraiment retenir des sondages à 4 jours du premier tour de l'élection présidentielle 2017
©Reuters

Instantané

A 4 jours du premier tour, les publications d’intentions de vote se sont multipliées et leurs résultats sont variables. Comment donner du sens à ces multiples variations ? Que faut-il en penser ?

Sylvain Brouard

Sylvain Brouard

Sylvain Brouard est chargé de recherche de la Fondation nationale des sciences politiques au Cevipof.

Voir la bio »

Graphique 1. Intentions de vote pour le 1er tour de  l’élection présidentielle (%)

Volatilité aléatoire et variations significatives

Par définition, les résultats des sondages sont sujets à des variations liées au fait même que l’étude porte sur un échantillon et non la population entière. Lorsque dans un même ensemble de plusieurs millions d’individus, plusieurs échantillons de quelques centaines d’entre eux sont interrogés en même temps, il est logique que les résultats varient. L’inverse serait hautement improbable.  Par conséquent, sur le temps court, des différences entre les intentions de vote produites par différents instituts ou à différents moments sont inévitables et ne sont pas, dans la majorité des cas, significatives. 

Graphique 2. Intentions de vote (%) pour le 1er tour de  l’élection présidentielle intégrant la marge d’erreur à 95% (%)

Bien qu’aucun des sondages pour le premier tour de l’élection présidentielle n’utilise une méthodologie aléatoire d’échantillonnage, nous avons simulé la marge d’erreur (à 95%) associée au résultat de chaque candidat dans chaque enquête. Nos résultats diffèrent légèrement de ceux des instituts de sondage puisque nous les calculons à partir des effectifs pris en compte pour la détermination des intentions de vote publiées et non à partir de la taille de l’échantillon interrogé. En effet, une partie des répondants n’exprime pas d’intentions de vote : 9%, par exemple, des répondants de l’enquête Harris Interactive pour LCP-AN du 11 au 13 avril 2017. En outre, la détermination des intentions de vote s’effectue sur les intentions de vote des répondants inscrits et certains de participer à l’élection présidentielle pour une majeure partie des instituts de sondage (Ipsos, Kantar Sofres, Opinion Way, BVA, Elabe, Odoxa) et certaines enquêtes (Havas Interactive, IFOP (1)). La seule sélection des répondants certains d’aller voter réduit substantiellement la taille de l’échantillon effectivement utilisée pour calculer les intentions de vote. Ainsi, dans l’enquête Kantar Sofres – OnePoint du 5 au 7 avril, la taille de l’échantillon utilisée pour la détermination des intentions de vote publiées est, par exemple, 40 % inférieure à celle de l’échantillon total de répondants inscrits. Par conséquent, la marge d’erreur pour les intentions de vote pour M. Le Pen et E. Macron (24%) n’est plus entre 2 et 2,2 points, valeurs communiquées respectivement pour les proportions de 20% et 25% pour un échantillon de 1515 personnes, mais 2,8 points pour un échantillon de 910 personnes.

Des variations d’une ampleur excédant l’intervalle de confiance sont discernables (Graphique 2) même dans le très court terme. Les variations les plus intéressantes sont celles qui s’observent sur le plus long terme. L’impact du soupçon d’emploi fictif de l’épouse de F. Fillon est manifeste. Après le 25 janvier 2017, les intentions de vote pour F. Fillon n’ont jamais été, jusqu’à mi-avril, dans l’intervalle de confiance de M. Le Pen. Toutefois, sans être systématique, dans les deux semaines précédant le premier tour de l’élection présidentielle, une telle configuration réapparaît dans certaines enquêtes, témoignant d’une compétitivité et d’une incertitude accrue pour l’accès au 2nd tour. A l’inverse, l’impact positif du ralliement, le 22 février 2017, de F. Bayrou à la candidature d’E. Macron est clair : depuis lors, le niveau des intentions de vote en sa faveur n’a été qu’à une seule reprise inclus dans l’intervalle de confiance de F. Fillon et s’est positionné, au contraire, quasi-systématiquement dans celui de M. Le Pen. Enfin, la progression de J. L. Mélenchon est avérée depuis le débat du 20 mars sur TF1. A partir de fin mars, les intentions de vote en faveur du candidat du Parti de Gauche ne sont plus comprises dans l’intervalle de confiance des intentions de vote pour B. Hamon et, qui plus est, se positionnent dans l’intervalle de confiance associé à F. Fillon. 

Une approche alternative : méta-analyse et présentation probabiliste

Compte tenu de la faiblesse des écarts constatés, il paraît justifié de recourir à une manière alternative d’étudier les résultats des sondages. Une méta-analyse des sondages d’intentions de vote est de nature à éclairer de manière complémentaire (2), si ce n’est plus appropriée, l’état des rapports de force électoraux compte tenu des incertitudes liées à tout échantillonnage. Elle consiste à appréhender les écarts entre chaque candidat dans chacun des sondages d’intentions de vote comme des cas constitutifs d’un échantillon. Par conséquent, il est ensuite possible d’utiliser les lois de probabilité pour estimer les chances qu’un candidat en précède un autre. 

Il convient d’appréhender le premier tour de l’élection présidentielle comme une permutation. Pour comprendre la logique sous-jacente à la démarche, prenons l’exemple le plus simple possible : une élection fictive où seuls trois candidats (A, B et C) sont en concurrence. Dans ce cas, le nombre de permutations possibles est égal à la factorielle de 3. Il y a donc 6 permutations possibles pour le premier tour : A > B > C ; A > C > B ; B > C > A ; B > A > C ; C > A > B ; C > B > A.

Par conséquent, la probabilité que le candidat A, par exemple, soit en tête correspond à la somme des probabilités que les situations A > B > C et A > C > B  se réalisent. La probabilité que le candidat C soit qualifié pour le second tour de l’élection présidentielle consiste, selon la même logique, en la somme des probabilités que les situations A > C > B, B > C > A,  C > A > B et C > B > A se réalisent.

Le calcul des probabilités de chaque permutation au premier tour se base sur la probabilité de chaque arrangement (pour chaque paire de candidats inclus dans l’analyse). Dans notre exemple, le nombre d’arrangements possibles est aussi égal à la factorielle de 3, soit 6 arrangements (3) : A > B, A > C, B > C, B > A, C > A et C > B. La probabilité de chaque arrangement s’obtient, dans une méta-analyse, à partir des résultats des divers candidats dans un échantillon de 3 sondages. Pour connaître la probabilité de l’arrangement A > B au premier tour, on estime de manière robuste la moyenne des écarts entre A et B à partir de la médiane de la différence entre les intentions de vote pour A et les intentions de vote pour B dans l’échantillon de sondages retenus. Puis on estime l’erreur standard de la moyenne (4). Est ensuite généré un t score qui nous permet d’obtenir une probabilité que A >B.

Nous avons appliqué cette approche à la série de 90 sondages d’intentions de vote publiés entre le 1er janvier 2017 et le 18 avril 2017 dont les résultats ont été présentés dans le graphique 1. Chaque sondage est classé en fonction de sa date médiane de passation. Les probabilités sont calculées, de manière glissante, pour chaque échantillon de 3 enquêtes successives. Les graphiques 3 et 4 présentent l’évolution de la médiane des intentions de vote et de la différence entre les 5 principaux candidats. Les graphiques 4 et 5 présentent les probabilités des 5 principaux candidats d’être respectivement en tête au premier tour et qualifiés  pour le second tour. 

Graphique 3. Évolution de la médiane des intentions de vote pour les 5 principaux candidats

Après avoir été longtemps au minimum à 25%, le niveau médian des intentions de vote exprimées pour M. Le Pen est sous ce niveau depuis début avril, et atteint aujourd’hui 23% des intentions de vote. De la même manière et à la même période, le niveau médian des intentions de vote exprimées pour E. Macron a diminué pour finalement se situer à un niveau très légèrement supérieur (24%). Les deux candidats qui semblent au seuil du second tour, F. Fillon et J. L. Mélenchon, se caractérisent, respectivement, par un niveau médian de 19,5% et 18%, en progression légère, pour le premier, par rapport à son plus bas et en augmentation marquée pour le second.

Ces diverses évolutions ont un impact sur les écarts médians entre candidats. Cependant pour tenir compte adéquatement de l’incertitude induite par l’exclusion de la majorité des intentions de vote des répondants incertains de participer ou n’exprimant pas d’intention de vote, il convient de calculer les différences, non pas à partir du niveau des intentions de vote exprimées, mais de la proportion des intentions de vote parmi les répondants inscrits sur les listes électorales. En effet, si comme dans l’enquête OpinionWay du 17 au 19 mars 2017 où les intentions de vote ont été déterminées sur 50% de l’échantillon, F. Fillon rassemble 18% des intentions de vote exprimées et E. Macron 23%, il ne faut pas calculer la probabilité que F. Fillon soit devant E. Macron compte tenu d’un écart de 5 points dans le sondage. En effet, E. Macron ne devance F. Fillon que de 2,5 points parmi les répondants inscrits. Il est plus probable qu’un écart de 2,5 points soit inversé qu’un écart de 5 points… Se baser sur les écarts parmi les intentions de vote exprimées conduit à surestimer les écarts et à sous-estimer l’incertitude liée aux répondants incertains de participer ou sans intention de vote. Le tableau 4 présente les écarts médians selon ce mode de calcul.

Le tassement des deux leaders et la progression de leurs deux concurrents principaux induit une diminution des écarts médians entre les quatre principaux candidats, respectivement 2,7 points et 1,8 points aujourd’hui pour F . Fillon par rapport à E. Macron et M. Le Pen, 4,3 et 3,6 pour J. L. Mélenchon. Après une forte progression, les écarts médians entre B. Hamon et ses principaux concurrents à sa droite et à sa gauche atteignent respectivement 11,2 et 7,3 points. Quelles conclusions peut-on tirer de ses écarts ?

Graphique 4. Évolution de la médiane de la différence entre les intentions de vote pour les 5 principaux candidats

Les évolutions récentes des écarts entre les candidats ont un effet, en premier lieu, sur les probabilités de M. Le Pen et E. Macron d’être en tête au premier tour de l’élection présidentielle (Graphique 5). Dans la dernière semaine, l’ancien ministre de l’économie apparaît avoir pris l’avantage sur la présidente du Front National et est désormais celui qui a le plus de chance (57%) de recueillir le plus de voix au premier tour. La position de leader est cependant loin d’être exclue pour M . Le Pen. Avec une probabilité de 37%, elle devance largement F. Fillon (4%) et J. L. Mélenchon (2%). 

Graphique 5. Évolution des probabilités d’être en tête au premier tour pour les 5 principaux candidats

Graphique 6. Évolution des probabilités d’être qualifié pour le second tour pour les 5 principaux candidats

La seconde conséquence des évolutions des écarts entre candidats est le relatif déclin, depuis début avril, des probabilités de qualification, de M. Le Pen et E. Macron, pour le second tour. E. Macron est celui qui a le plus de chances (86 %) d’être dans les deux premiers le 23 avril au soir devant M. Le Pen (77%). Autrement dit, avec ce niveau de probabilité, dans 3 élections sur 4, M. Le Pen serait qualifiée et E. Macron dans 17 élections sur 20. Néanmoins les chances d’accès au second tour pour F. Fillon et J. L. Mélenchon, respectivement 23 % et 14%, ne sont ni nulles ni négligeables. Les intentions de vote actuelles laissent ainsi à l’ancien premier ministre prés d’une chance sur quatre d’être au second tour et au leader du Parti de Gauche autour de 3 chances sur 20. Sans en être les favoris, à 4 jours du scrutin, la route de la présidence ne leur est pas donc totalement fermée.

(1) : Les intentions de vote du Rolling 2017 de l’IFOP ont initialement été calculées sur les intentions de vote des répondants inscrits avant de l’être seulement sur ceux certains de participer.
(2) : Andrew GELMAN, Gary KING and W. John BOSCARDIN, « Estimating the Probability of Events That Have Never Occurred: When Is Your Vote Decisive? », Journal of the American Statistical Association, March 1998, Vol. 93, No. 441.
(3) : Au-delà de trois candidats, le nombre d’arrangements diffère du nombre de permutations. Le nombre d’arrangements A pour le second tour d’une élection présidentielle avec un nombre N (supérieur à 2) de candidats est égal à : A=N!/(N-2)!
(4) : Puisque l’analyse empirique des différences entre résultats des intentions de vote et résultats électoraux a mis en évidence que les écarts (même le jour du vote) excédait la marge d’erreur théorique, nous avons fait le choix d’utiliser un niveau de l’erreur moyenne absolue constatée de 4 points pour estimer l’erreur standard de la moyenne.

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !