Macron Président : Big Data ou Big Brother ?

Rédigé par Thibault Gateclou-Marest, NEOMA Business School, 26 ans.



Le digital et la maîtrise des données transforment le rapport que les élus et les candidats entretiennent avec les électeurs. NationBuilder, Civiteo, LMP, Digital Box, Knockin... Elles sont encore peu connues du grand public mais les start-up du secteur des #TechPol ou encore des #CivicTech arrivent progressivement chez nous et permettent aux candidats de mener des campagnes “Data driven". En 2007, Barack Obama commença la bataille de la primaire démocrate face à Hillary Clinton avec une base militante réduite. Son ascension rapide fascina alors le monde. Quels en furent les principaux leviers ? On en distingue deux aujourd’hui. D’une part sa capacité remarquable à rassembler et s’adresser aux foules. Et d’autre part une utilisation efficace des techniques de ciblage pour les actions de terrain.


big-data-digital


Comme l’ex-sénateur de l’Illinois, Emmanuel Macron était dépourvu de base de militants au lancement de son mouvement En Marche, ce qui l’a forcé à mettre la data au coeur de sa stratégie de campagne. Ainsi, avant même l’annonce de sa candidature il a lancé “la Grande Marche” pour prendre le pouls des français et constituer une base de données. Celle-ci comporte des similitudes avec Catalist, le fichage des électeurs utilisé par les candidats aux Etats-Unis. Si en Europe la CNIL prémunit les citoyens d’un fichage à grande échelle de leur profil, les règles sont loin d’être aussi restrictives outre-Atlantique. Pourtant, les campagnes françaises sont considérées comme les plus avancées technologiquement au monde.

Le porte à porte : le levier le plus efficace



Ceux qui ont déjà participé à une campagne électorale le savent, il faut réussir à rassembler le plus grand nombre autour d’un projet en un minimum de temps. Si certains ont déjà pris leur décision avant même le lancement de la campagne, d’autres sont encore indécis. C’est donc à eux qu’il faut parler en priorité. Pour ce faire, plusieurs outils online et offline sont à la portée des équipes des candidats.

  • Offline : le tractage, le collage d’affiches, le push SMS ou encore le porte-à-porte
  • Online : l’emailing, l’activité sur les réseaux sociaux ou le site internet

big-data-digital



Il faut comprendre qu’il y a eu un changement fondamental dans les campagnes électorales qu’Obama a déployé de la façon la plus avancée possible. C’est d’abord que les campagnes sont devenues beaucoup plus scientifiques : on est capable dès la fin des années 90 de mesurer ce qui marche et ce qui ne marche pas et de mesurer l’impact différentiel des différentes techniques de campagnes. Scientifiquement, toutes les études publiées depuis 98 sur ce sujet montrent qu’il n’y a rien qui marche mieux que le contact direct avec les gens. C’est pourquoi c’est le porte à porte qu’il fallait optimiser.

Le Big Data électoral, késako ?



On aime bien utiliser ce buzzword à toutes les sauces mais les théoriciens du Big Data estiment qu’on peut l’employer lorsque des algorithmes vont devoir traiter un volume de données variées très important en peu de temps (3V : Volume, Variété, Vélocité). C’est donc en cela qu’il est utile aux candidats car faire du porte à porte à grande échelle est très compliqué, il faut être habile et n’aller voir que les gens qui ont le plus de chances de changer d’avis quand on va frapper à leur porte.

Et c’est là que la partie data intervient pour cibler des gens, pour les Etats-Unis en tout cas. En France on ne peut pas cibler des gens mais des quartiers du fait de la législation européenne. Le travail se fait donc à un niveau moins granulaire. L’expérience, cependant, montre que cette différence a un impact limité sur la qualité du travail. On utilise donc les data pour parler aux bonnes personnes à partir des données qu’on peut avoir sur les quartiers dans lesquels ces gens habitent. C’est un exemple un peu basique mais un quartier dans lequel le chômage a énormément augmenté durant le précédent quinquennat sera évidemment plus sensible à des propositions de lutte contre le chômage et il ne faudra donc pas oublier de parler de ce sujet dans un meeting là-bas.


big-data-digital

Aperçu du logiciel développé par LMP, “50+1”


En France, c’est la start-up de stratégie électorale LMP (pour Liegey-Muller-Pons les trois co-fondateurs) qui fût en charge de l’organisation de cette “Grande Marche”, une campagne de porte à porte ciblée. Celle-ci utilise une première brique de données que sont les résultats par bureau de vote, données disponibles gratuitement. La deuxième brique sont des données économiques provenant de l’INSEE (revenu moyen, taille du ménage, niveau d’étude…). C’est ce qui permet d'identifier les quartiers panels en France appelés des iris. Ces iris cumulés sont représentatifs de la France dans son intégralité.

La dernière brique de données qu’LMP a utilisée dans son modèle correspond à celles collectées durant la Grande Marche, la première étape du mouvement En Marche.

La Grande Marche : fonctionnement et objectif



big-data-digital


Etape 1 : Une vaste étude qualitative



L’idée de la Grande Marche était déjà de réaliser une sorte d’étude qualitative à très grande échelle. Ainsi 4000 “marcheurs” sont allés frapper à des centaines de millier de portes pour recueillir 25 000 questionnaires à questions ouvertes. C’était donc pour prendre le pouls des français en récoltant des verbatims sur le quotidien des gens, ce qui leur faisait peur, leur donnait de l’espoir, ce qui marche ou ne marche pas en France.

Cela représente une base d’informations cruciales pour une meilleure connaissance du terrain en complément de l’achat de sondages auprès des instituts classiques. L’avoir fait sur un panel de 25000 personnes c’est 25 fois plus qu’un panel IPSOS ou BVA sur une étude quantitative (leur panel de base étant généralement 1000 personnes) et 1000 fois plus que sur un panel d’étude qualitative, cela permet donc de réduire la marge d’erreur.

Etape 2 : Une approche plus humaine



Tous ces questionnaires étaient renseignés dans une application smartphone, le marcheur qui avait pris le soin d’indiquer dans quel quartier il se trouvait. Le formulaire se terminait par des données sociodémographiques. La technologie d’LMP permettait ensuite de faire du NLP (pour Natural Language Processing ou analyse sémantique) afin de rattacher les verbatims aux thèmes concernés.


big-data-digital



Avoir une telle base de données présente plusieurs avantages compétitifs, dont celui de disposer d’informations plus ancrées dans la réalité des français au-delà des simples indicateurs économiques. Cela permet d’identifier les priorités politiques et de construire un discours politique et un programme avec une approche plus humaine.

Etape 3 : Affiner le ciblage pour les actions de campagne



Ensuite cela vient compléter les deux briques de données d’LMP (historiques de vote par bureaux et données de l’INSEE) pour alimenter le modèle de ciblage pour aller mieux identifier les indécis par quartier et les sujets à aborder en priorité. En d’autres termes, on peut savoir ce qui inquiète les instituteurs en Franche-Comté ou ce qui ne marche pas en France selon les cadres supérieurs habitant à Ranelagh.

Comment mobiliser tant de personnes sur le terrain ?



big-data-digital



Comment fait-on pour allier action de terrain et utilisation des données ? Comment faire pour ne pas juste avoir trois personnes déterminées dans leur coin mais trois millions de personnes comme c’était le cas pour Obama qui vont frapper à 35 millions de portes. C’est là que la technologie intervient. La technologie au sens des logiciels qui vont déjà faciliter le recrutement, donc l’arrivée des volontaires vers la campagne et ensuite le fait de coordonner facilement le travail des volontaires sur le terrain. Si en 2008 à l’époque d’Obama il n’y avait que du papier, aujourd’hui LMP équipe les “marcheurs” d’une application mobile pour faire du porte à porte.

En résumé, ce qui a réellement disrupté les campagnes électorales c’est la combinaison de la technologie, de la data et de l’Humain. Cette combinaison ne tombe pas de nulle part, elle est le fruit de multiples recherches scientifiques qui ont montré que les meilleures campagnes, celles qui avaient le plus d’impact sur le nombre de voix gagnées sont celles qui arrivaient à parler au plus grand nombre de gens. Ces différentes avancées dans l’approche des campagnes aux US ont été ramenées en France par LMP avec une première application dans le cadre de la campagne de François Hollande en 2012. Un site a donc été créé pour faciliter l’accès à la campagne et à grand renfort de communication dans la presse ont permis de faire savoir qu’une campagne innovante allait commencer.



big-data-digital


Dans ce cas particulier, LMP a été en mesure de démontrer que 20% des personnes ayant l’intention de voter FN au premier tour ont finalement voté Hollande. Lorsqu’on mesure le nombre de voix que cela apporte durant la finale contre Sarkozy on voit que 20% des 3 points qui séparaient les deux candidats sont dus au porte à porte.

Et c’est la un gros point commun entre la campagne d’En Marche et les campagnes US parce que c’est une campagne qui, parce qu’elle est innovante, permet d’attirer un public un peu différent du cœur des militants traditionnels.

Pourquoi est-ce plus démocratique ?



Les “data-sceptiques” trouveront toujours inquiétant que nos politiques nous connaissent à ce point et crieront à une manipulation de l’opinion. Je n’approuve cependant pas du tout car le Big Data électoral est bien plus démocratique pour plusieurs raisons.


big-data-digital



La première est que faire du porte à porte en parlant d’abord aux abstentionnistes permet une meilleure représentativité démocratique. En effet, ces personnes n’ont pour certaines pas ou peu de conscience politique ou sont dans la désillusion pour les autres et le fait de leur poser des questions précises en amont de la campagne sur leur opinion les remet en question au delà de la critique systématique. Ils seront peut-être plus attentifs la prochaine fois qu’un candidat s’exprimera au JT. Et, le jour venu, il ne votera peut-être pas Macron, mais au moins il ira voter.

Ensuite c’est parce que pour faire campagne les candidats dépensent énormément dans les sondages et ce n’est pas à la portée des plus petits ou de ceux qui se présentent aux législatives. Les services comme LMP, Digital Box ou NationBuilder sont beaucoup plus abordables et permettent donc aux candidats d’être à armes égales dans leur campagne et donc de porter des projets qui n’auraient pas pu toucher leur cible.

Enfin il faut comprendre qu’en Europe, nous sommes bien protégés par la CNIL et on est loin du ciblage pratiqué aux Etats-Unis. En effet, pour collecter des données à titre individuel on doit avoir le consentement explicite de l’utilisateur et être transparent sur la manière dont ses données seront utilisées. Aux Etats-Unis, c’est la base de données Catalist qui permet un ciblage individuel regroupant des données sur 220 millions de citoyens américains relatives à différentes briques d’informations :

  • Sexe, âge, coordonnées
  • Tendances religieuses, sexuelles ou politiques
  • Historique d’achat en ligne et en magasin
  • Etudes et expériences professionnelles
  • Historique d’inscription dans les partis
  • Données issues des réseaux sociaux

big-data-digital


Une mine d’or d’informations qui grâce à l’évolution du Big Data permettent d’avoir une idée très fine de l’opinion avec une granularité exceptionnelle qui permettait de savoir l’historique de vote des individus, la probabilité qu’ils changent d’avis et l’argumentaire à donner pour convaincre lors du porte à porte.

Dans le cas d’LMP, les règles d’anonymisation des données et traitement à un niveau agrégé est respecté puisqu’ils ne fonctionnent qu’au niveau des bureaux de vote et non pas au niveau individuel.

Open Data for good



En conclusion, c’est grâce à l’utilisation du triptyque Big Data, digital et humain que LMP est capable d’avoir un impact significatif sur les résultats d’une élection lorsqu’ils travaillent avec un candidat. Sans pour autant se targuer d’être responsables de l’élection d’Emmanuel Macron, les trois co-fondateurs peuvent tout de même être fiers de leur travail qui, qu’on le veuille ou non, permettra à plus de candidats de mener de meilleures campagnes. Quand on se plonge un peu dans les pratiques des Etats-Unis en la matière, on peut aisément faire le rapprochement avec le Big Brother d'Orwell mais en Europe, grâce à la CNIL, on se contentera du Big Data. Enfin, l’adoption progressive par les collectivités locales de l’Open Data (mise en ligne des données collectées gratuitement) va permettre de voir émerger de nombreuses start-up ayant la créativité de trouver de nouveaux usages à ces données. Il va donc falloir suivre de près ce secteur émergent.




Rédigé par Thibault Gateclou-Marest
NEOMA Business School & En Marche