Définir son confort de vie avec la donnée

#datavisualisation
#datascience
#R
#ruby
#cartography

Ce travail de recherche et développement a pour objectif de créer le premier score de bien-être dans la ville en fonction des open-data et private data disponibles ainsi que des facteurs humains au confort de vie s’y rapportant.

Dans le cadre du soutien au transfert de technologie de la Région Aquitaine, 10h11 a eu l’opportunité de travailler avec le CATIE et l’école d’ingénieur ENSC afin de proposer une approche innovante de la notion de confort de vie par la data, en se basant d’une part sur une approche scientifique pour définir ces indicateurs et d’autre part en récoltant automatiquement les informations sur internet pour faire travailler les algorithmes.

Ce travail de recherche et développement a pour objectif de créer le premier score de bien-être dans la ville en fonction des open-data et private data disponibles ainsi que des facteurs humains au confort de vie s’y rapportant.
 

Concrètement le travail s’est découpé en plusieurs phases :

  • Établir la liste des sources de données et attribuer à chacune une note de fiabilité ;
  • Implémenter la logique de récupération de ces informations et les stocker en BigData ;
  • Étudier et définir, en se basant sur des études cognitives, quels sont les critères qui permettent de définir une note de qualité de confort de vie ;
  • Implémenter ces algorithmes d’extraction d’information pour faire apparaitre une note par quartier ;
  • Proposer une visualisation adaptée du prototype.


     
Focus sur la structuration des données


Nous avons mené un travail de consolidation de la base de données, mais aussi de structuration afin de pouvoir pondérer l’ensemble des typologies de données en fonction de la définition du confort de vie exprimé par le panel.

Considérons un critère A, par exemple « Commerces et restaurants » : nous pouvons le voir comme un sur-ensemble de A.1 et A.2, par exemple « Bars et restaurants » et « Commerces de proximité ».

 

 

Nous avons donc imaginé déployer l’ensemble de nos critères sous cette forme d’arbre, avec plusieurs niveaux, où les sous-critères seraient les feuilles.

Cette structuration nous permet d’exploiter pleinement les données significatives et de les hiérarchiser en fonction de leur degré d’importance pour le panel.



 

Focus sur l’algorithme 
 

Une fois notre base de données structurée, nous devions pouvoir classer par ordre de choix un certain nombre d’alternatives sur la base d’un ensemble de critères favorables ou défavorables.

La solution que nous avons choisi ce nome Topsis (Technique for Order of Preference by Similarity to Ideal Solution).

En effet, TOPSIS nous permet de déterminer, pour chaque alternative, un coefficient sur la base des distances (euclidiennes) entre chaque alternative d’une part et les solutions idéales favorables et défavorables 

NB : une alternative est dite idéale favorable si elle est la plus loin de la pire alternative et la plus proche de la meilleure alternative ; au contraire, une alternative est dite idéale défavorable si elle est la plus proche de la pire alternative et la plus loin de la meilleure alternative) 

De plus TOPSIS a la capacité de nous fournir des résultats normés, assez simples à mettre en œuvre, avec un classement relatif des critères (il permet d’ordonner les critères par ordre de préférence, les uns par rapport aux autres) et de fournir un calcul basé sur la distance moyenne des établissements dans une zone circulaire, pondérée par le nombre d’établissements dans la zone de calcul (cela permet de traiter la problématique d’un point situé à la frontière d’un quartier).

Ces critères permettent de répondre à la problématique cartographique que nous envisagions sur le confort de vie pour visualiser les notes de confort en fonction des différents quartiers d’une même ville.



 

Focus sur le maillage et la zone minimale de calcul 
 

Nous sommes partis du constat que l’utilisateur est en mesure d’avoir des préférences sur les différents quartiers ou zones de la ville. Dans ce cas, l’application devrait lui permettre de comparer des zones sur plusieurs niveaux de détail. Ainsi nous devions agréger les données détaillées afin de proposer une expérience satisfaisante (performance).

Pour répondre à ce besoin de maillage, la carte avec des hexagones réguliers est la forme la plus optimale (le calcul des établissements est effectué dans un cercle de rayon d’une grille, automatiquement générée à partir d’un seul point (centre de la France), permet donc de quadriller la France entière. 

 

 

Pour chaque niveau de zoom, le score de confort de vie est recalculé en fonction des critères enregistrés dans la zone. Pour le premier prototype, un seul niveau de zoom a été mis en place.




 

Focus sur la visualisation de la donnée
 

Notre prototype embarque les services de MapBox nous permettant de travailler une cartographie épurée, en zone de gris, pour mettre en avant les scores de chaque zone.

La couleur mauve vient matérialiser les zones de score et l’opacité de la couleur détermine l’intensité du score de chaque hexagone. Enfin, les sources open-data et private data viennent se structurer sur la map au moyen de points jaune, orange, vert et bleu. Chaque couleur étant assimilable à une catégorie de données.

Lors du chargement un loader vient prévenir l’utilisateur du travail de notre serveur pour traiter la demande et afficher les informations.



 

5 zones de clics sont proposées :

Chaque angle de l’écran contient un élément cliquable que ce soit pour revenir à l’accueil, déployer le menu, zoomer ou encore obtenir plus d’informations.

Les hexagones de la cartographie sont cliquables afin d’apporter les informations liées à la data qui a permis de déterminer le score de confort de vie de la zone concernée. Lors de chaque clic sur un hexagone, la map vient automatiquement se repositionner pour centrer l’interface sur la zone cliquée. Cette option nous permet de faciliter la navigation et la compréhension des informations pour l’utilisateur.

 

***

Pour découvrir le prototype, les scores et naviguer sur la map, voici l’URL de test à votre disposition :

www.bil.10h11.xyz

Tout feedback est le bienvenu, n’hésitez pas à contacter notre équipe sur ce sujet.