05/04/2020 2 Minutes read Data / IA 

Covid 19 : Datavisualisation des mouvements de la population française pendant la crise

Selon une étude de l’Insee et Orange, les mesures annoncées par le gouvernement pour endiguer l’épidémie du Covid 19 ont provoqué de nombreux mouvements de population en France métropolitaine.  Ces déplacements ne concernent pas seulement les Parisiens qui ont pris la fuite pour la province, mais aussi certains départements touristiques comme les Alpes et les Pyrénées.  A partir de ces informations (que l’Insee considère encore comme provisoires), Juliette Bassnagel, Data Scientist chez MFG Labs en a créé une dataviz (ci-dessous). Elle nous explique sa démarche dans cette interview.

Pourquoi avoir voulu créer une dataviz sur ce sujet ?

Cela faisait déjà quelques jours que l’on parlait de la fuite d’une partie des Parisiens en province. Les données sur ce sujet ont été publiées le mercredi 8 avril et le format est intéressant, car les données sont issues d’une collaboration entre l’INSEE et Orange. Cette collaboration permet de fournir une estimation de la population présente(touristes inclus) à partir du nombre de nuitées issu des activations du réseau de téléphonie mobile (recalé sur la population départementale pour les porteurs de mobiles français).

Cela rend la dataviz temporaire aussi. L’INSEE note notamment ceci à propos de ces données : « L’Insee considère ces résultats comme provisoires. Ces derniers seront amenés à être consolidés, puis actualisés à partir d’informations plus récentes, provenant de plusieurs opérateurs et de sources alternatives. »

À noter également, que les données ne donnent qu’une estimation des gain ou perte en population par département, mais on ne connaît pas les flux : on ne peut pas dire par exemple, que ceux qui ont quitté les stations de ski sont surtout des Parisiens.

Quelle a été la méthode ? Quels ont été les outils ?

On peut trouver sur la page de l’INSEE fournissant ces données. Il s’agit d’informations utiles à la décision publique, notamment pour dimensionner l’offre de soins et de services sur le territoire. La source de donnée comprend deux scénarios qui correspondent à deux calculs d’estimations différents. Pour cette dataviz, j’ai utilisé le scénario 1. J’ai d’abord fait cette viz pour moi, car je voulais comprendre la tendance des déplacements. Puis lorsque j’ai vu que l’on pouvait aller à un niveau de détail supérieur, j’ai créé cette infographie.

J’ai commencé l’exploration des données dans l’Excel fourni par l’INSEE, puis j’ai continué avec R pour terminer l’exploration, retraiter les données et créer la viz finale. Le retraitement des données a nécessité les packages {dplyr}, {stringi}, {tidyr} et {forcats}. Pour la création de la viz en elle-même, j’ai utilisé les packages {ggplot2} et {patchwork}. Les cartes ont été créées grâce à une fonction de {ggplot2} permettant d’associer à chaque département ses latitudes et longitudes.

Qu’est-ce qu’on peut déduire de cette dataviz ?

Ce qui est intéressant, c’est de bien différencier 2 types de départements qui ont vu une grande partie de la population présente fuir :

  • Les départements touristiques spécifiquement sur la période : les stations de ski (Alpes & Pyrénées). Fuite des touristes, mais aussi des saisonniers qui sont aussi rentrés chez eux. Les pourcentages sont impressionnants et dépassent ceux de la capitale pour la Savoie et les Hautes Alpes. Je fais partie de ces gens qui ont dû quitter une station de ski à l’annonce du confinement, et c’était clairement le bazar dans les trains de retour 🙂
  • Paris, touristique toute l’année, mais qui est également concerné par une perte de sa population “résidente”.

Vous avez des questions ? Un projet ?

Contactez-nous

Lire plus d’articles

  • 2 Minutes read par ekino paris

    Covid-19 : Le nouveau “normal”

    Lire la suite
  • 2 Minutes read par Nicolas Prud'homme

    Covid-19 : Performance et scalabilité des services numériques à l’heure du télétravail massif

    Lire la suite