OpenData : L'ouverture des données publiques au service de l'innovation
Ce post a été rédigé suite aux échanges ayant eu lieu lors de l’atelier sur l’ouverture des données publiques lors de la première édition du Barcamp Bordeaux.
L’ouverture des données est une notion à la fois claire et complexe. Claire dans le sens où l’on imagine bien le potentiel d’innovation que peut donner l’ouverture des données en l’assimilant à la dynamique générée par exemple par l’ouverture du code dans le domaine du logiciel libre, et complexe dans le sens où son côté novateur et abstrait, ainsi que son immense potentiel ne nous permettent difficilement d’imaginer ce à quoi cela va ou peut nous mener.
Pour expliquer sommairement le fonctionnement de l’ouverture des données, on peut prendre l’image d’un silo où serait stocké tout un ensemble de données accessibles, exploitables et modifiables par tout un chacun. Chacun peut à son tour croiser les données, les enrichir, en créer de nouvelles à partir d’existantes ou simplement les mettre à jour et les repartager à nouveau. C’est un partage démocratique des moyens et outils nécessaire à la création de nouvelles applications.
La première des questions que vous vous posez certainement doit être "A quoi ça sert" ? Pour donner des exemples concrets, on peut citer les sites iBordeaux ou iRennes qui sont la mise en forme de données libérées qui offrent un service de proximité d’utilité indéniable. Difficile également de parler de ce sujet en éludant OpenStreetMap, carte du monde modifiable de manière participative par n’importe quel internaute. Ajouté à la collecte des positions GPS de chaque personne par triangulation, on peut également mettre en place la mise à jour en temps réel et la cartographie des flux de déplacements et ainsi permettre de nous avertir de la présence de bouchons, etc.
On peut tout aussi facilement étendre le catalogue des possibles grâce à l’avènement du web mobile et de la réalité augmentée. La création d’un Street View-like alimentée par les photos utilisateurs, la cartographie des cépages et châteaux bordelais, la comparaison en temps réel des prix du carburant dans les différentes stations essence sont tout autant de possibilités qui peuvent s’offrir à nous si l’ensemble des données sont rendues publiques.
Cependant, de nombreuses questions restent encore non résolues :comment formater les données ainsi libérées ? Ou encore : comment garantir leur intégrité ? Car si n’importe qui peut accéder et modifier et créer de l’information, il est tout aussi simple d’insérer des informations erronées, ce qui dans le cas de données de travail peut se révéler embêtant. Pour éviter cela, on peut mettre en place un historique des modification des données sur le même principe que Wikipédia. L’autorégulation par la communauté ainsi que le recoupement des données permet également de limiter ce risque.
Une autre solution consisterait à faire coexister deux modèles de données : l’un ouvert à tous et modifiable par tous sans restriction et l’autre certifié par les collectivités, principalement pour les informations sensibles. Les modifications apportées à celles-ci ne seraient alors prises en compte qu’après approbation, assurant ainsi l’exactitude de celles-ci mais nuisant fortement à l’un des principaux intérêts des données libres qui est la fraicheur des informations partagées grâce à la réactivité de la communauté.
Certes, l’enthousiasme généré par l’ensemble des possibles offerts grâce à cette technique peut effrayer quelque peu : l’impression d’être fiché rend les gens très réfractaires à certaines applications. Attention toutefois à l’amalgame qui tenterait de mélanger données publiques et nominatives. Toutes les données publiques doivent être non-nominatives et l’état doit également statuer sur les différents types d’informations dites sensibles qui ne devrait pas faire l’objet d’une ouverture. Qui souhaiterait par exemple rendre public les casiers judiciaires afin qu’ils soient accessibles par tout le monde ?
La finalité est réellement de permettre à chacun d’utiliser des données d’utilité publique de manière à innover en créant de nouveaux services et usages gratuits comme payants (qui peuvent avoir de réels modèles économiques motivés par l’ajout de valeur par rapport aux données brutes) mais conçus par et pour la communauté donc répondant à des besoins réels et spécifiques. On peut également miser sur la mise à disposition de boites à outils libres exploitant ces données et d’API permettant d’utiliser plus facilement ces données et de faciliter le développement de services autour d’une problématique donnée.
Le mouvement de collecte et de partage des données détenues par les collectivités a d’ores et déjà commencé en particulier sur les ressources environnementales pour lesquelles une directive a rendu nécessaire cette collecte de manière à rester en conformité autour de la loi étatique. L’enjeu est désormais de rassembler, de libérer et de croiser les données détenues par les collectivités, les entreprises privées et les particuliers de manière à avoir un contenu le plus large possible, voire même si possible redondant pour permettre de vérifier la véracité des informations.
Qui sait ensuite ce que que ce mouvement d’ouverture nous réserve pour demain ? L’inventivité de l’homme n’a aucune limite; reste à lui fournir les moyens de réaliser ce qu’il a en tête et l’ouverture des données lui donne les moyens de concrétiser des idées qui peuvent au départ paraitre utopiques. A partir de cette conclusion, l’univers des possibles s’étend grandement et peut donner naissance à des applications que vous n’imaginez pas encore aujourd’hui mais qui demain vous paraitront indispensables…
Pour en savoir plus je vous conseille de faire un tour sur le site web de la FING.
Commentaires
Pour le suivi sur les données publics je conseillerais également:
http://libertic.wordpress.com/
http://www.regardscitoyens.org/
http://www.epsiplatform.eu/
Ca commence à bouger un peu partout en France
Bonjour, j’ai l’impression qu’il faudrait définir plus précisément ce que l’on entend par "données publiques" qui, à mon sens, devraient pouvoir être "accessibles" et "exploitables" mais non-modifiables. Il s’agit de données que possèdent des entités publiques (Etat, communes, régies, transports publics, Poste, Telecom, etc.). D’un autre côté, il y a des données "qui peuvent être rendues publiques", et ce n’est pas pareil (les vélos ou voitures en libre service, les prix des carburants dans les stations services, etc.). Certaines de ces données existent ou peuvent relativement aisément disponibles, d’autres devront être élaborées (par qui? comment?).
Puis, il y a les "crowdsourced data", les traces numériques, volontaires ou contraintes que nous laissons…
En tout état de cause, la SOURCE des données devrait être très claire. Les données brutes d’une part (qui est le fournisseur? quelle est leur nature? comment sont-elles recueillies?); les données modifiées ou enrichies (par qui? comment? avec quelles autres données?) devraient être accessibles de manière distincte.
Oui, la question est complexe et mérite réflexion.
on en parle ici : http://europe-ecologie.net/groups/d…
avec quelques liens
pcrevoisier > Bonjour et bienvenue ici !
Lorsque je parle de données publiques, je parle de données en libre accès qui peuvent être à la fois accessibles et modifiables par n’importe qui. Peut-être serait-ce plus clair de parler de données "libérées" parmi lesquelles ont peut regrouper toutes les catégories de données que vous citez ici.
Par contre, comme je l’ai précisé dans mon billet, il est certain que la traçabilité et l’historique des modifications des données doivent être disponibles de manière à s’assurer de leur intégrité. Cependant, je ne suis pas convaincu que fermer les données en empêchant leur modification soit forcément une bonne solution, y compris pour des données fournies par l’Etat.
Merci pour l’article, j’ai été très intéressé
Merci de votre réponse. Je ne suis pas tout-à-fait d’accord
Je prends les données des transports publics. Si je souhaite, par exemple, réaliser une application permettant d’afficher des données multimodales (bus, trains, bateaux, etc.), permettant à un usager de composer un parcours avec l’ensemble de ces informations en temps réel, j’ai besoin d’accéder à des données brutes, dont le format, l’intégrité, la consistance sont assurés.
J’ai besoin d’avoir la certitude que ces données n’ont pas été modifiées par un quelconque autre acteur… Et je pourrais donner d’autres exemples.
Autrement dit, il me semble dangereux, au stade actuel des débats sur l’accès aux données publiques, de mélanger allègrement les "données publiques", les "données générées par Tartempion", les "données de Tartempion à partir des données publiques", etc.
Au cours de la discussion de samedi dernier, une idée a été proposée pour pallier à ce problème : la certification de données. Elle permet de mettre à disposition un certains nombre de données contrôlées par les collectivités qui peuvent être reprises et modifiées par qui le souhaite mais qui nécessitent d’être re-validées afin d’être à nouveau certifiées.
L’avantage de cette certification serait notamment de mettre à disposition des données dont la véracité ne sera remise en cause que par l’ancienneté de leur certification mais qui seront étiquetées comme "correctes" par l’Etat.
L’état possède des données qui ne sont pas toujours correctes.
Lorsqu’il remet des données il peut certifier l’origine, pas la qualité.
Voir aussi l’initiative de cartes ouvertes au pays de Brest :
http://www.wiki-brest.net/index.php…
au carrefour
et pour celles et ceux que cela intéresse une session cartes ouvertes au Forum des usages le 30 juin 2010 et sur les données publiques le 1er juillet avce des démos de chimère et d’OSM :
http://forum-usages-cooperatifs.net
Fil des commentaires de ce billet