Skip to content

Livre "Open data, le contre pouvoir des données"

Notifications You must be signed in to change notification settings

datactivist/livre

Repository files navigation

Livre "Open data, le contre pouvoir des données"

Données brutes du livre en cours de rédaction "Open Data, le contre pouvoir des données"

Résumé

À l’ère dite du « big data », les données toujours plus massives suscitent fascination et crainte, espoirs et scandales. La mise en données du monde ne semble profiter qu’aux puissants. Pourtant, depuis près de 10 ans, le mouvement de l’open data porte l’idéal démocratique d’une réduction des asymétries d’information. Promettant un renouvellement de la transparence, un foisonnement de l’innovation et une transformation des organisations, l’open data ou ouverture des données publiques désigne la mise à disposition de données d’intérêt général, ne comportant pas d’informations personnelles, que chacun peut librement utiliser dans leur plus grande finesse. À partir d’octobre 2018 en France, l’ouverture des données devient la norme pour tous les acteurs investis d’une mission de service public.

Open data : le contre-pouvoir des données ouvre de nouvelles pistes pour que l’open data redonne du pouvoir aux citoyens. Rédigé par un spécialiste à la fois chercheur et militant de l’ouverture des données, l’ouvrage porte un regard lucide et propose un bilan critique des réalisations accomplies au cours de la première décennie de ce mouvement. Cet essai didactique sort du jargon et des lieux communs du numérique pour s’adresser au plus grand nombre et aider le public le plus large à se saisir de cette opportunité démocratique. L’ouvrage est composé de trois parties : retour historique, analyse de la situation actuelle, recommandations pour l’avenir. Il est ponctué d’encarts qui présentent certaines des données déjà à disposition de tous et des cas d’usage les plus emblématiques.

L’auteur : Samuel Goëta est cofondateur de la société coopérative Datactivist qui se donne pour mission de rendre l’open data utile et utilisé. Docteur en sociologie, sa thèse entre dans les coulisses de l'open data et interroge les conditions de mise en œuvre de ces projets. Il est cofondateur de l'association Open Knowledge France où il milite pour que l'ouverture du savoir bénéficie à tous.

Partie 1 : Naissance et émergence de l'open data

Alors que le terme « open data » est apparu en 1995 et s’est véritablement propagé à partir de 2007, l’ouverture des données trouve ses racines dans une multitude de mouvements qu’on peut résumer en quatre points. Premièrement, l’open data découle des combats pour la transparence de l’action publique. On trouve l’essence de l’ouverture des données dans l’article 15 de la Déclaration des droits de l’homme et du citoyen qui stipule que « la société a le droit de demander compte à tout agent public de son administration», mais aussi dans les archives publiques ou encore l’émergence d’un « droit de savoir » avec le Freedom of Information Act aux États-Unis en 1956. Deuxièmement, l’open data s’inscrit à la suite du lobbying des industries de l’information pour que les données publiques soient librement réutilisables. Placées dans le domaine public aux États-Unis depuis les années 1970, les données publiques ont longtemps été soumises à redevance en France du fait des revenus du Minitel. Troisièmement, c’est dans les sciences que l’on trouve les premières pratiques de partage de données. La statistique, à la fois outil de savoir et outil de pouvoir, s’est bâtie autour du partage de données financées par l’impôt. Les premières infrastructures de circulation de données ont émergé dans des disciplines comme la botanique, la génétique ou l’astronomie dès les années 1960. Enfin, l’open data s’inscrit dans la lignée des mouvements de l’informatique libre que ce soit pour l’ouverture des standards de télécommunication, du code source des logiciels (open source) ou du savoir qui circule sur les réseaux (open knowledge).

Le mouvement de l’open data a émergé véritablement à partir de 2005 d’abord au Royaume-Uni où il a trouvé un terreau fertile suite à une série de mobilisations citoyennes : création d’OpenStreetMap en 2005 (le « Wikipedia de la carte »), création de l’Open Knowledge Foundation la principale ONG internationale en faveur de l’ouverture des données, campagne du Guardian « Free Our Data » en 2006, scandale des dépenses des parlementaires en 2009, plaidoyer de Tim Berners-Lee l’inventeur du web... C’est aux États-Unis que le terme open data est entré dans le débat public en 2007 après une rencontre d’une trentaine d’entrepreneurs et de militants réunis à Sebastopol en Californie. Leur objectif: établir une série de principes pour la libre réutilisation des données publiques afin de les faire adopter par le futur président des États-Unis. Un objectif couronné de succès puisque le premier acte de Barack Obama à la Maison Blanche a été de signer trois mémorandums qui ont permis le lancement de data.gov, le premier portail open data national.

Sur ces bases essentiellement anglo-saxonnes, l’open data a connu une phase d’internationalisation avec notamment la création de l’Open Government Partnership, une organisation internationale dédiée à la transparence et à l’ouverture des politiques publiques et l’adoption par les chefs d’État du G8 d’une charte internationale qui fixe pour objectif l’ouverture des données par défaut. D’une revendication issue de la société civile, l’open data est devenu un élément essentiel des politiques numériques. En dix ans, ses grands principes se sont progressivement stabilisés. Ils réclament la mise à disposition, dès leur production, des données publiques, dans leur plus grande finesse et dans des conditions juridiques et techniques qui facilitent leur libre réutilisation.

L’open data en France est d’abord apparu sous l’impulsion de collectivités locales pionnières comme Rennes, Nantes ou Paris qui ont mis en place les premières politiques d’ouverture de données. De son côté, l’État avait pris une orientation différente en misant sur le développement des redevances plutôt que la gratuité des données avec la création d’une Agence pour le Patrimoine Immatériel de l’État. Etalab, la mission gouvernementale en charge de l’open data, a été créée en 2010 au terme d’un revirement politique. Ce dernier est dû à la fois aux avancées locales, à l’internationalisation de l’ouverture des données plaçant la France « en retard » et à l’approche de la campagne présidentielle qui a incité le président sortant Sarkozy à afficher la transparence de son action. Data.gouv.fr, le portail open data national, est lancé à la fin de l’année 2011. Après une phase d’incertitude au moment de l’alternance, le gouvernement adopte une feuille de route fin 2012 sur l’open data dont une des actions prioritaires a consisté à refondre entièrement le portail data.gouv.fr lancé dans la précipitation.

D’une administration dédiée à l’ouverture des données, Etalab est devenu l’épicentre d’une multitude d’initiatives (startups d’État, entrepreneurs d’intérêt général, data science...) centrée autour de la gouvernance et de la circulation des données, devenues un actif stratégique pour la transformation de l’État. En 2016, l’adoption de la loi pour une République Numérique marque un tournant. L’ouverture des données devient, à partir d’octobre 2018, une obligation pour tous les acteurs investis d’une mission de service public et les principes de l’open data favorisant la réutilisation des données sont consacrés par la loi. En quelques années, l’open data est passé de l’exception à la norme.

Partie 2 : 10 ans d'open data, un bilan critique

L’obligation légale d’ouverture des données par défaut en France ressemble à la tour de Pise : un bel édifice construit sur des fondations instables. La loi CADA de 1978 qui régit la transparence de l’action publique connait en effet de nombreuses faiblesses. Mal connu, peu utilisé par les journalistes et les militants, le droit d’accès à l’information publique laisse de nombreuses possibilités de contournement aux administrations. Les citoyens ne disposant pas d’un contre-pouvoir légal efficace, la transparence volontaire des administrations n’a donné que peu de résultats par rapport aux promesses d’une transparence renouvelée. Comme nous le verrons à travers une série d’exemples dans des domaines variés (alimentation, environnement, finances publiques...), les données sont soit manquantes, soit généralement trop nettoyées pour constituer une véritable « machine à scandale » et permettre des révélations.

Si l’on regarde dans les coulisses pour comprendre pourquoi les données ouvertes n’ont pas renouvelé la transparence, on constate que l’open data est une « politique de l’offre » dans laquelle l’administration choisit quelles données ouvrir, dans quelles conditions et décide de ses mises à jour sans prendre en compte la demande. De plus, les agents publics n’ont généralement pas le mandat pour ouvrir des données « sensibles » sans obtenir un aval politique. Du fait de fondations juridiques instables, la réduction des asymétries d’information entre le public et l’administration promise par l’open data n’a pas encore rempli ses promesses.

De grands cabinets de prospective et des institutions comme la Commission européenne ont promis des retombées économiques de l’ordre de plusieurs dizaines de milliards d’euros chaque année qui découleraient de la réutilisation des données publiques ouvertes. Ces promesses d’un « nouveau pétrole » qui stimulerait l’innovation et la croissance se sont révélées irréalistes au regard des résultats empiriques des études qui ont évalué l’impact de l’ouverture des données.

Même si on note quelques success stories découlant de la réutilisation de données ouvertes dans les domaines des transports et des services pratiques, le faible impact sur l’économie a pu susciter une certaine déception pour les acteurs politiques qui ont misé sur l’open data pour créer des emplois. Cette déception risque à terme de mettre en péril les projets d’ouverture de données qui sont dépendants de leurs attaches politiques. Le faible impact économique s’explique aussi par les difficultés des usagers à exploiter les données ouvertes. En effet, les données se révèlent souvent soit manquantes soit introuvables soit inutilisables quand elles sont disponibles. Nombreux sont les cas où les usagers se plaignent de la faible documentation des données et des incohérences des fichiers mis à disposition. Les données ouvertes se révèlent généralement peu fiables et trop parcellaires pour permettre la création de services, d’entreprises et d’emplois pérennes.

Au-delà des promesses de renouvellement de la transparence et de l’innovation, l’open data a aussi bénéficié directement à l’administration elle- même. Les projets d’open data sont ainsi souvent rattachés à des services de modernisation de l’administration. Pour le service public, le passage à l’open data par défaut prévu par la loi Lemaire pour tous les acteurs investis d’une mission de service public et les collectivités locales de plus de 3500 habitants et 50 agents constitue un défi de taille. On estime que près de 300 collectivités locales ont déjà ouvert des données, elles seront plus de 4000 à partir d’octobre 2018. Dans les coulisses des administrations qui ont déjà ouvert des données, l’open data a provoqué une transformation en profondeur des pratiques des agents. Ouvrir des données nécessite un travail important qui reste généralement invisible et n’entre pas dans les missions des agents. De ce fait, l’amélioration de la qualité et de la fiabilité des données ne trouve généralement pas de moyens. Sous-évalué et négligé par les décideurs, le travail d’ouverture des données est pourtant une condition indispensable au développement des usages des données ouvertes. Le travail sur les données dans les administrations engendre des bénéfices immédiats pour le service public : développement de nouveaux usages analytiques et prédictifs liés à la data science, possibilités de médiation et de concertation avec le public, amélioration de la qualité des données, meilleure connaissance du patrimoine informationnel de la collectivité... L’open data constitue un vecteur essentiel de la transformation numérique de l’administration.

Partie 3 : Remettre l'open data au service des citoyens

Lorsque les données publiques sont manquantes ou inexploitables, il est toujours possible d’obtenir des données. Illustré par de nombreux exemples, ce chapitre présente quatre stratégies alternatives d’ouverture de données. La première consiste à faire appel au droit d’accès à l’information publique pour exiger la mise à disposition des données. Aux États-Unis, l’utilisation du Freedom of Information Act est un réflexe chez les journalistes et les militants. En France, la loi CADA, malgré ses faiblesses, peut être utilisée simplement pour obtenir des données publiques : l’envoi d’un courriel type suffit. La deuxième stratégie, celle dite du scrapping, consiste à extraire des données exposées sur des sites web et à les agréger dans une base de données. Par exemple, la CIMADE collecte automatiquement des données sur les sites des préfectures pour montrer que les délais d’attente au guichet pour les immigrants sont excessivement longs par rapport aux autres formalités administratives. La troisième stratégie consiste à reconstituer les données manuellement à partir des informations disponibles. Ces données peuvent ne pas être très fiables, mais elles sont suffisantes pour exercer un travail de plaidoyer. Si en retour l’administration déclare que les données utilisées sont erronées, il devient alors très facile d’exiger l’ouverture des données publiques. C’est par exemple ce qu’a fait le syndicat de la presse indépendante (SPIIL) pour obtenir l’ouverture des données détaillées des aides à la presse. Enfin, la quatrième stratégie propose de produire ex nihilo une base de données de manière collaborative. Ces communs, produits et gérés de manière communautaire, ont permis de constituer certaines des plus grandes et prometteuses bases de données comme OpenStreetMap. Ce « Wikipedia de la carte » propose partout dans le monde des données ouvertes sur tous les éléments présents dans l’espace public rivalisant avec les géants du secteur, Google Maps en particulier. Ces quatre stratégies, illustrées par de nombreux exemples, serviront à inspirer le lecteur afin de renforcer les contre-pouvoirs et de réduire les asymétries d’informations. Elles permettent de passer à l’action rapidement pour que l’open data remplisse ses promesses démocratiques sans attendre une réforme de long terme.

Le dernier chapitre envisage les pistes de réforme pour que les données ouvertes permettent effectivement de réduire les asymétries d’information. Le chantier prioritaire porte sur le droit d’accès à l’information publique dont nous avons vu précédemment les nombreuses faiblesses. Si les administrations peuvent continuer à contourner les demandes, il n’y a pas de raisons qu’elles s’orientent effectivement vers l’ouverture volontaire de leurs données. La CADA doit voir ses moyens d’action augmenter et les possibilités de contournement pour les administrations doivent être limitées (réduction des délais, notification obligatoire, désignation systématique et effective d’une personne responsable, silence vaut acceptation...) Par ailleurs, l’open data par défaut reste une chimère tant qu’on ne se donne pas les moyens. Il faudra d’abord renforcer les moyens d’action d’Etalab pour que les portails ne s’adressent plus uniquement à des techniciens habitués aux données et développer les pratiques de cartographie des données. Des relais dans les collectivités locales sont indispensables pour éviter que ne se développent les inégalités territoriales autour des données. Les efforts doivent aussi porter sur les données elles-mêmes pour garantir leur fiabilité en renforçant le service public de la donnée. Enfin, réduire les asymétries d’information ne pourra se faire que si l’on ouvre la gouvernance des données. Le passage d’un open data « de l’offre » à un open data « de la demande » implique d’écouter et de résoudre les problèmes des usagers. Comme pour la statistique depuis plus de cinquante ans, les pratiques de concertation autour des besoins de données doivent se développer pour objectiver le débat public. Cela passera aussi par l’ouverture de certaines données d’intérêt général détenues par des entreprises. Ces pistes d’action esquissent la possibilité de données gérées comme des communs, des ressources partagées et gouvernées par une communauté.

About

Livre "Open data, le contre pouvoir des données"

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages