Ce post a été rédigé suite aux échanges ayant eu lieu lors de l’atelier sur l’ouverture des données publiques lors de la première édition du Barcamp Bordeaux.

L’ouverture des données est une notion à la fois claire et complexe. Claire dans le sens où l’on imagine bien le potentiel d’innovation que peut donner l’ouverture des données en l’assimilant à la dynamique générée par exemple par l’ouverture du code dans le domaine du logiciel libre, et complexe dans le sens où son côté novateur et abstrait, ainsi que son immense potentiel ne nous permettent difficilement d’imaginer ce à quoi cela va ou peut nous mener.

Pour expliquer sommairement le fonctionnement de l’ouverture des données, on peut prendre l’image d’un silo où serait stocké tout un ensemble de données accessibles, exploitables et modifiables par tout un chacun. Chacun peut à son tour croiser les données, les enrichir, en créer de nouvelles à partir d’existantes ou simplement les mettre à jour et les repartager à nouveau. C’est un partage démocratique des moyens et outils nécessaire à la création de nouvelles applications.

La première des questions que vous vous posez certainement doit être "A quoi ça sert" ? Pour donner des exemples concrets, on peut citer les sites iBordeaux ou iRennes qui sont la mise en forme de données libérées qui offrent un service de proximité d’utilité indéniable. Difficile également de parler de ce sujet en éludant OpenStreetMap, carte du monde modifiable de manière participative par n’importe quel internaute. Ajouté à la collecte des positions GPS de chaque personne par triangulation, on peut également mettre en place la mise à jour en temps réel et la cartographie des flux de déplacements et ainsi permettre de nous avertir de la présence de bouchons, etc.

On peut tout aussi facilement étendre le catalogue des possibles grâce à l’avènement du web mobile et de la réalité augmentée. La création d’un Street View-like alimentée par les photos utilisateurs, la cartographie des cépages et châteaux bordelais, la comparaison en temps réel des prix du carburant dans les différentes stations essence sont tout autant de possibilités qui peuvent s’offrir à nous si l’ensemble des données sont rendues publiques.

Cependant, de nombreuses questions restent encore non résolues :comment formater les données ainsi libérées ? Ou encore : comment garantir leur intégrité ? Car si n’importe qui peut accéder et modifier et créer de l’information, il est tout aussi simple d’insérer des informations erronées, ce qui dans le cas de données de travail peut se révéler embêtant. Pour éviter cela, on peut mettre en place un historique des modification des données sur le même principe que Wikipédia. L’autorégulation par la communauté ainsi que le recoupement des données permet également de limiter ce risque.

Une autre solution consisterait à faire coexister deux modèles de données : l’un ouvert à tous et modifiable par tous sans restriction et l’autre certifié par les collectivités, principalement pour les informations sensibles. Les modifications apportées à celles-ci ne seraient alors prises en compte qu’après approbation, assurant ainsi l’exactitude de celles-ci mais nuisant fortement à l’un des principaux intérêts des données libres qui est la fraicheur des informations partagées grâce à la réactivité de la communauté.

Certes, l’enthousiasme généré par l’ensemble des possibles offerts grâce à cette technique peut effrayer quelque peu : l’impression d’être fiché rend les gens très réfractaires à certaines applications. Attention toutefois à l’amalgame qui tenterait de mélanger données publiques et nominatives. Toutes les données publiques doivent être non-nominatives et l’état doit également statuer sur les différents types d’informations dites sensibles qui ne devrait pas faire l’objet d’une ouverture. Qui souhaiterait par exemple rendre public les casiers judiciaires afin qu’ils soient accessibles par tout le monde ?

La finalité est réellement de permettre à chacun d’utiliser des données d’utilité publique de manière à innover en créant de nouveaux services et usages gratuits comme payants (qui peuvent avoir de réels modèles économiques motivés par l’ajout de valeur par rapport aux données brutes) mais conçus par et pour la communauté donc répondant à des besoins réels et spécifiques. On peut également miser sur la mise à disposition de boites à outils libres exploitant ces données et d’API permettant d’utiliser plus facilement ces données et de faciliter le développement de services autour d’une problématique donnée.

Le mouvement de collecte et de partage des données détenues par les collectivités a d’ores et déjà commencé en particulier sur les ressources environnementales pour lesquelles une directive a rendu nécessaire cette collecte de manière à rester en conformité autour de la loi étatique. L’enjeu est désormais de rassembler, de libérer et de croiser les données détenues par les collectivités, les entreprises privées et les particuliers de manière à avoir un contenu le plus large possible, voire même si possible redondant pour permettre de vérifier la véracité des informations.

Qui sait ensuite ce que que ce mouvement d’ouverture nous réserve pour demain ? L’inventivité de l’homme n’a aucune limite; reste à lui fournir les moyens de réaliser ce qu’il a en tête et l’ouverture des données lui donne les moyens de concrétiser des idées qui peuvent au départ paraitre utopiques. A partir de cette conclusion, l’univers des possibles s’étend grandement et peut donner naissance à des applications que vous n’imaginez pas encore aujourd’hui mais qui demain vous paraitront indispensables…

Pour en savoir plus je vous conseille de faire un tour sur le site web de la FING.