Projet de datavisualisation: Arrondissement de Paris

arrondissement de paris

Table des matières

  1. Origine et traitement des données sur la densité de la population par arrondissement
  2. Première datavisualisation avec Line chart race (Flourish)
  3. Deuxième datavisualisation avec une carte (Datawrapper)
  4. Croisement des données
  5. Troisième datavisualisation avec Bar chart race (Flourish)
  6. Quatrième datavisualisation des données croisées
  7. Visualisation de Paris avec Wikidata Query Service

1. Origine et traitement des données sur la densité de population par arrondissement

Les données de l’évolution démographique au fil des années ont été trouvées sur INSEE. Nous avons décidé de garder uniquement la partie des données qui nous intéresse: arrondissement, année, population. Les données d’origine étant bien définies, nous n’avons pas eu à réaliser de travaux préparatoires, ni à utiliser d’outils particuliers. Sur la base de ces trois informations, nous avons décidé de visualiser l’évolution de la population dans les arrondissements de Paris entre 1968 et 2015.

Extrait des données finales:

  2017 2012 2007 1999 1990 1982 1975
Paris 1er Arrondissement 16266 17100 17915 16888 18360 18509 22793
Paris 2e Arrondissement 20900 22390 21745 19585 20738 21203 26328
Paris 3e Arrondissement 34115 35991 34576 34248 35102 36094 41706
Paris 4e Arrondissement 28088 27769 28572 30675 32226 33990 40466
Paris 5e Arrondissement 58850 60179 62664 58849 61222 62173 67668
Paris 6e Arrondissement 41100 43224 45332 44919 47891 48905 56331
Paris 7e Arrondissement 51367 57092 57410 56985 62939 67461 74250

Tableau généré avec Tables Generator

2. Première datavisualisation avec un Line Chart Race (Flourish)

Pour créer le visuel des données récoltées, nous avons décidé d’utiliser le graphique “Line Chart Race” avec trois paramètres que nous avons mentionnés ci-dessus. C’est un graphique en relief qui est souvent utilisé pour visualiser efficacement le classement des données à travers différentes mesures au fil du temps.

Made with Flourish

Comme vous pouvez le voir, certaines arrondissements n’ont pas évolué au fil des années et d’autres ont subi des changements importants. Après avoir revérifié les données et avoir mentionné que la population change au fil des années, nous nous sommes rendus compte qu’il s’agit d’un graphique qui ne permet pas d’illustrer la faible variation des données.

3. Deuxième datavisualisation avec une Carte (Datawrapper)

Ensuite, nous avons décidé d’illustrer la densité de population avec une carte pour voir les arrondissements les plus et les moins peuplés . Cette datavisualisation a été réalisé en choisissant une carte des arrondissements de Paris (peu d’outils l’ont). Puis, nos données ont été légèrement modifiées (la première colonne doit correspondre soit au “code”, “code INSEE” ou “name”), puis importées dans l’outil Datawrapper. Il faut mentionner, nous n’avons pas pu animer nos jeux de données pour voir l’évolution au fil des années, car Datawrapper ne le permet pas. Donc, une chose importante a été rajoutée pour voir l’évolution d’habitants par arrondissement (Tooltips: arrondissement, en 1968: habitants; en 1975: habitants), etc.

Grace à la deuxième visualisation cartographique, nous pouvons visualiser l’emplacement de chaque arrondissement, ainsi qu’étudier la densité de population en 2017 et en cliquant sur chaque arrondissement le nombre d’habitants entre 1968 et 2012.

4. Croisement des données

Puis, nous avons essayé d’expliquer l’évolution de la population dans les arrondissements à travers les prix de l’immobilier. Nous avons récupéré un deuxième jeu de données ici. Ces données représentent un historique des prix au m2 standardisés des appartements anciens à Paris par arrondissement. Les données sont issues des actes authentiques signés dans les offices notariaux français.

Un extrait des données brutes:

Trimestre Centre 1er 2e 3e 4e 5e 6e 7e
T3 2020 12 870 € 13 940 € 12 250 € 12 650 € 13 660 € 12 750 € 14 590 € 14 100 €
T2 2020 12 860 € 13 100 € 12 570 € 12 820 € 13 480 € 12 740 € 14 250 € 14 020 €
T1 2020 12 340 € 12 990 € 11 830 € 12 540 € 12 640 € 12 640 € 14 250 € 13 480 €
T4 2019 12 470 € 13 240 € 11 830 € 12 330 € 13 200 € 12 420 € 13 610 € 13 540 €
T3 2019 12 150 € 12 890 € 11 200 € 12 200 € 12 780 € 12 110 € 14 170 € 13 310 €
T2 2019 12 140 € 12 520 € 11 860 € 11 970 € 12 610 € 11 880 € 13 850 € 12 850 €
T1 2019 11 780 € 12 020 € 11 630 € 11 430 € 12 710 € 11 530 € 13 740 € 12 870 €

Tableau généré avec Tables Generator

Les modifications suivantes ont été réalisées: changement du format (pdf vers csv avec ilovepdf), calcul du prix moyen par année, suppression des années pour lesquelles nous ne possédions pas les informations concernant la population (2020 - 2018), positionnement des lignes et des colonnes modifiés pour pouvoir faire une datavisualisation. Vous pouvez voir ci-dessus un extrait des données finales:

  Prix moyen 2017 Prix moyen 2016 Prix moyen 2015 Prix moyen 2014
1er 11 353 € 10 533 € 10 328 € 10 303 €
2e 10 348 € 9 613 € 9 478 € 9 548 €
3e 10 748 € 9 893 € 9 683 € 9 815 €
4e 11 750 € 11 373 € 10 940 € 11 068 €
5e 11 090 € 10 383 € 9 968 € 10 153 €
6e 12 050 € 11 298 € 11 543 € 11 535 €
7e 11 480 € 11 123 € 10 745 € 11 050 €
8e 9 928 € 9 185 € 9 195 € 9 478 €
9e 9 295 € 8 513 € 8 343 € 8 430 €
10e 8 270 € 7 615 € 7 385 € 7 403 €
11e 8 735 € 8 065 € 7 840 € 7 920 €

Tableau généré avec Tables Generator

5. Troisième datavisualisation avec Bar Chart Race (Flourish)

Pour visualiser le deuxième jeu de données, nous avons décidé d’utiliser Bar Chart Race sur Flourish, ce que nous a permit d’avoir la visualisation dynamique des prix moyens au fil des années (1995 - 2017).

Made with Flourish

6. Quatrième datavisualisation des données croisées

Nous avons regroupé deux fichiers de données, celui de la population et celui avec les prix moyens au m2 pour voir si ces deux mouvements sont liés. En sélectionnant la population, ainsi que le prix moyen qui vous intéresse, vous pouvez comparer ces deux valeurs. Par défaut, vous voyez toutes les années et tous prix. Pour faire une comparaison, il est nécessaire de cliquer sur “Sélectionner les données à comparer”, ensuite choisir l’année qui vous intéresse.

Made with Flourish

Comme vous pouvez le constater, dans cette visualisation, il manque plusieurs années. En effet, il est difficile de trouver l’information concernant les prix au m2 par arrondissement avant 1995. Néanmoins, en analysant les données présentées, nous pouvons supposer qu’il y a eu une hausse importante entre 1999 et 2007. En vérifiant cette hypothèse, nous avons trouvé qu’en effet, la période entre 1998 et 2008 correspond à une longue hausse nationale et que cette période est connue pour ces volumes importants de vente. Les notaires précisent que cette période a été boostée par un “contexte économique bien orienté” et surtout par un “crédit bancaire facile et bon marché”. La période 2007 et 2012 englobe deux choses à la fois: la crise de liquidités entre 2008-2009 (les prix diminuent) et une très forte envolée à Paris entre 2009 et 2011 (explosion des prix). Dans le graphique, nous pouvons observer que les prix ont augmenté, mais pas aussi fortement que nous pouvions l’anticiper. De 2012 et 2017, nous pouvons observer que les prix ont peu varié par rapport aux années précédentes.

Après avoir réalisé ce graphique, nous pouvons conclure qu’il est difficile de voir une corrélation entre les prix des appartements et le nombre d’habitants. Nous pouvons constater, qu’il s’agit plutôt de changements généraux ou sociétaux qui touchent toute la ville et pas un arrondissement en particulier.

7. Visualisation de Paris avec Wikidata Query Service

Dans cette partie, grâce à une requête de Wikidata, nous avons pu afficher les rues de Paris pour le coté esthétique. S’il y a des images qui vous intéresse, vous pouvez voir le titre de lieu, ainsi que ses coordonnées géographiques.

#defaultView:ImageGrid
SELECT
  ?arr
  (SAMPLE (?titleL) AS ?title)
  (SAMPLE (?img) AS ?image)
  (SAMPLE (?coord) AS ?coordinates) {

    {
      SELECT DISTINCT ?arr {
        ?arr  wdt:P131 wd:Q90;}
    }
    # title
    OPTIONAL { ?arr rdfs:label ?titleL filter (lang(?titleL) = "fr") }
   
    # image
    OPTIONAL { ?arr wdt:P18 ?img }
   
    # coordinates
    OPTIONAL { ?arr wdt:P625 ?coord }

} GROUP BY ?arr
LIMIT 1500 

Conclution

Le sujet en question présente pour moi un intérêt particulier. En effet, il était intéressant de se pencher sur l’évolution de population de Paris et d’essayer de l’expliquer à travers les prix de l’immobilier. Grace aux plusieurs types de datavisualisations, nous avons pu mettre en avant différentes problématiques.

Ce projet nous a permis de vivre pleinement le processus qui s’appelle Datawrangling, en partant des données brutes, nous avons réussi à les adapter à nos besoins, en les modifiant et nettoyant, ce qui, par la suite, nous a permis de les visualiser et publier sur cette page github.

Néanmoins, nous avons rencontré certains problèmes pendant la réalisation de ce projet:

Source de l’image: etudiant.aujourdhui.fr