Open data on en parle beaucoup mais ça sert vraiment?

L’open data c’est quoi ?

On ne va pas réinventer la roue, Wikipédia propose effectivement une définition que l’on trouve très bien. L’Open data ou encore « donnée ouverte » c’est :

« une donnée numérique dont l’accès et l’usage sont laissés libres aux usagers. Elle peut être d’origine publique ou privée […]. Elle est diffusée de manière structurée selon une méthode et une licence ouverte garantissant son libre accès et sa réutilisation par tous, sans restriction technique, juridique ou financière. »

Wikipédia : https://fr.wikipedia.org/wiki/Open_data

Quelles informations puis-je trouver en Open Data ?

De nombreux acteurs publics et privés mettent à disposition leurs données et celles-ci couvrent de nombreux thèmes parmi lesquels on peut retrouver :

  • La Démographie ( données issues du recensement, données d’infrastructure des villes…)
  • La Santé (base de données des médicaments, dépenses d’assurance maladie etc..)
  • Les Transports : données sur les autolib, horaires de train / métro
  • Le Tourisme et la culture : (Monuments historiques, offres culturelles ….)
  • L’éducation / la recherche (Effectifs étudiants, liste des établissements scolaires …)
  • Maix aussi la Météo, l’agriculture, le logement, le développement durable et bien d’autres encore…
C’est bien tout ça mais j’en fais quoi moi de l’Open Data ?

Avec ces données apportant de l’information indépendante ou complémentaire de ce que l’on peut avoir dans nos bases privées on peut avoir trois approches :

  • Ne rien faire mais stocker dans le doute : Certaines données Open Data peuvent nous sembler intéressantes d’exploiter à long terme mais pas forcément tout de suite. Dans ce cas récupérer la donnée et la stocker peut être intéressant pour le futur surtout que rien ne garantit quelle reste “open” éternellement. Attention tout de même à ne pas sombrer dans le “je stocke tout ce qui passe”.
  • Développer de nouveaux produits / services : Qui dit nouvelles sources de données dit possibilité d’extraire de la valeur que je n’avais pas initialement et ainsi de créer de nouveaux produits et services. De nombreuses applications mobiles notamment ont vu le jour en se basant sur l’Open Data :

– L’application Tranquilien : elle permet de prédire l’influence des trains et ainsi nous permettre de prendre un train avec de la place. Elle utilise notamment les données “open” de la SNCF et de la RATP:  http://tranquilien.com/

– L’application Small steps to be greener : elle  permet de géolocaliser les décharges publiques aux alentours compte tenu de la nature des déchets à jeter, et permet également de photographier et géolocaliser une décharge sauvage pour la signaler aux services publics.

Il en existe bien d’autres basées sur de nombreux thèmes différents (culture, transports, loisir etc…) et si cela vous intéresse vous pouvez faire un tour par ici : https://openappstore.wordpress.com/

  • Améliorer les services / études / produits existants : Ces Open Data peuvent également servir à enrichir nos données existantes et améliorer certaines de nos activités / services déjà mis en place.

On peut notamment :

 – Améliorer nos études (de marché) en utilisant les données mises à disposition par l’INSEE par exemple (les zones géographiques résidentielles / Industrielles, l’emplacement des concurrents, etc.)

– Utiliser les données météo (par exemple) pour enrichir nos modèles de prédiction et de description d’événements (vente, churn, satisfaction client etc….)

– Mieux connaître ce que recherche les gens d’une façon générale sur Internet en utilisant notamment Google trends

– Enrichir ses bases de données en ajoutant un référentiel géographique avec des données de positionnement (qui seront utiles en DataViz par exemple)

Illu_Open_Data

Quels sont les avantages des Open Data ?
  • Facilement accessibles
  • Gratuites
  • Plusieurs formats disponibles pour un même jeu de données
Quels sont les points d’attention ?
  • Aucune garantie de mise à jour régulière ou de maintien du dataset dans le temps
  • Qualité de données non-maîtrisée
  • Différents types de licences « ouvertes »
Où puis-je trouver de l’Open Data ?

Voici notamment un lien répertoriant tous les sites d’open data dans le monde : ici

En guise de conclusion voici quelques uns de nos sites préférés pour trouver de l’Open Data en France :

  • https://www.data.gouv.fr/fr/: Il faut commencer par là! ce site du gouvernement recense énormément de datasets provenant d’autres sites d’Open Data et a pour but de fédérer les initiatives Open Data en France
  • https://www.insee.fr/fr/statistiques?categorie=1: Site de l’INSEE qui propose beaucoup de données démographiques disponibles à différentes “mailles géographiques” (de la France à l’Iris ou même des données carroyées à 200m, en passant par les régions et départements)
  • https://datanova.laposte.fr/page/accueil/: Site de Laposte où l’on trouve notamment un dataset très utile lorsque l’on veut visualiser des données sur une carte, comme c’est désormais possible dans la plupart des outils de DataViz. Pour chaque commune de France, le dataset en question nous donne notamment une latitude et une longitude mais également une “géoshape” associée
  • https://opendata.paris.fr/page/home/: Site Open Data de la ville de Paris ou l’on trouve diverses informations sur la capitale (comme par exemple la position des bornes autolib ou des parkings, ce qui peut nous permettre en 5min de créer une DataViz permettant de répondre à la question “ou recharger ma voiture électrique à Paris ?”)

Article écrit par Anne-Sophie LAUGIER et Louis-Baptiste FRANCE

2 thoughts on “Open data on en parle beaucoup mais ça sert vraiment?

  • 4 juin 2017 at 10 h 53 min
    Permalink

    Bonjour,

    Petite question : les données qu’on peut récolter d’entreprise grâce à des api (airbnb par exemple) sont elles considérées comme des données open data ?

    Reply
  • 5 juin 2017 at 10 h 43 min
    Permalink

    Bonjour Hocine,

    Effectivement on peut les considérer comme de l’open data. Plusieurs sociétés telles qu’en effet airbnb mais aussi twitter mettent a disposition une api gratuite pour accéder à certaines de leurs données. Quand ces API sont gratuites on est quand même souvent limité soit au nombre de requêtes que l’on peut faire soit à la quantité de données que l’on peut récupérer. Il faut également faire attention aux chartes d’utilisation de ces données. Quand elles sont payantes on parle dans ce cas de data sharing (thème d’un prochain article) et non plus d’open data.

    Reply