OWNI http://owni.fr News, Augmented Tue, 17 Sep 2013 12:04:49 +0000 http://wordpress.org/?v=2.9.2 fr hourly 1 Et si c’était la faim de l’Open Data http://owni.fr/2012/11/06/et-si-cetait-la-faim-de-l-open-data/ http://owni.fr/2012/11/06/et-si-cetait-la-faim-de-l-open-data/#comments Tue, 06 Nov 2012 16:24:35 +0000 libertic http://owni.fr/?p=125241

Nous assistons depuis quelques semaines à la fleuraison de nombreux articles venant orner avec anticipation la tombe de l’Open Data français. Entre le retour de la question de la tarification des données, la fermeture de services basés sur des informations santé, et le remaniement d’Etalab, les pythies prédisent déjà la fin de l’aventure Open Data.

Certaines questions n’ont pourtant pas lieu d’être tandis que d’autres signes, parfois passés inaperçus, semblent plus préoccupants pour l’avenir. Puisqu’il semble d’actualité en période d’Halloween de jouer à se faire peur, si on développait de vrais arguments de préoccupations après avoir fait tomber les faux ?

L’horreur de la gratuité

Le 17 octobre dernier, un article des Echos paraissait sous le titre : L’État pourrait renoncer à la gratuité des données publiques. Olivier Schrameck, membre de la commission sur la rénovation et la déontologie de la vie publique s’y interrogeait sur la pertinence de proposer gratuitement des données publiques en temps de crise. Cet article largement cité a inauguré la saison d’écrits mortifères sur la future tarification des données, le conditionnel étant devenu affirmation par la force des reprises médiatiques.

Vol noir de corbeaux sur l’Open Data français

Vol noir de corbeaux sur l’Open Data français

Regards citoyens, association pionnière sur l'Open Data en France, réagit pour Owni aux deux articles très ...

La publication par Owni le jour même de l’écriture de ce billet nous épargne un fastidieux travail d’analyse des théories de développement des rumeurs avec les étapes de réduction et accentuation des propos. Owni pointe ainsi qu’Olivier Schrameck a soutenu en public la gratuité des données, ce qui laisse supposer la retranscription d’une phrase sortie de son contexte dans l’article à la base du florilège médiatique. Le gouvernement a par ailleurs répondu le 31 octobre par un communiqué affirmant le maintien du programme d’ouverture de données gratuites.

La question de la tarification des données ouvertes ne semble donc pas se poser, ce qui aurait pu être une bonne nouvelle si seulement ce débat n’avait déjà été tranché en 2011 par la circulaire du 26 mai instaurant le principe de gratuité par défaut des données publiques.

Pour irriguer le moulin des controverses, nous pouvons néanmoins ajouter qu’il n’y a toujours pas eu de positionnement du gouvernement sur la question de l’extension de la gratuité des données à celles encore facturées sans justification évidente. La stratégie Open Data française devrait être dévoilée en fin d’année.

Etalab, soluble dans la modernisation de l’action publique

Cette semaine a également été marquée par le départ de Séverin Naudet, jusque-là directeur de la mission Etalab en charge de l’ouverture des données interministérielles et de la plateforme nationale data.gouv.fr. Départ accompagné de l’abrogation de la mission Etalab par le Décret 2012-1198 du 30 octobre 2012 portant création du secrétariat général pour la modernisation de l’action publique.

Certains ont voulu y voir la fin de la mission Open Data du gouvernement. Celui-ci a pourtant indiqué maintenir le programme d’ouverture des données en plaçant l’Open Data sous la tutelle du nouveau service de modernisation de l’action publique. Nous avons déjà expliqué que nous souhaitions ce changement, sur notre blog ici et . Ce remaniement était attendu et semble parfaitement opportun car pour envisager un développement ambitieux de l’Open Data en France :

• Il est nécessaire de développer l’harmonisation des pratiques et standards de données par la collaboration ;
• Il est donc nécessaire d’avoir une mission nationale enfin fédératrice ;
• Il est nécessaire d’organiser les espaces d’échanges et de mutualisations pour le développement des initiatives ;
• Il est donc nécessaire que la mission ne s’attache plus uniquement à sa propre ouverture mais également à une stratégie de développement national ;
• Il est nécessaire de sortir les démarches d’ouverture d’une seule logique de publication de données en ligne ;
• Il était donc nécessaire d’intégrer l’Open Data au sein d’une stratégie globale de modernisation de l’action publique en lien avec les systèmes d’information et de la communication.
Pourquoi l’avenir sera open(data)

Pourquoi l’avenir sera open(data)

A partir de quand les données publiques le sont-elles vraiment ? LiberTIC présente le panorama des villes en pointes sur ...

En rattachant l’Open Data, jusque-là élément expérimental isolé, à la direction interministérielle pour la modernisation de l’action publique, la France se donne les moyens de développer une stratégie globale, transversale et cohérente afin d’assurer la diffusion des pratiques.

L’objet du nouveau secrétariat général n’est pas sans rappeler les objectifs de la gouvernance ouverte avec ses notions d’évaluation et modernisation de l’action publique, ce qui procure l’avantage de proposer enfin une stratégie au-delà de la seule publication de données. Nous avions d’ailleurs appelé à ce repositionnement il y a presque un an.

Et malgré cet acte nécessaire à la pérennité de l’Open Data, des dérives politiques ont favorisé le relais de la fausse information sur la fin de l’Open Data en France, provoquant le déchaînement des réseaux. L’UMP publiait ainsi que “le gouvernement décide de diluer la politique de transparence et d’ouverture des données publiques (Open Data) engagée par Nicolas Sarkozy et François Fillon” invitant à considérer la fin de l’Open Data pour une actualité qui pourrait au contraire en marquer le début.

Les critiques récemment relayées semblent donc injustifiées et occultent les vraies questions. Il serait peu ambitieux de focaliser les débats sur la gratuité ou le statut d’Etalab et de s’estimer bienheureux d’en voir la continuité assurée. Aujourd’hui les attentes sont passées à un stade supérieur et parmi tous les enjeux (en terme de qualité, quantité, dispositifs autour des données, etc)… nous pouvons évoquer plus assurément un questionnement sur une volonté politique de l’extension des données ouvertes.

Le risque de tartufferie

Si ces derniers remaniements semblent de bon augure pour la pérennité des démarches, il serait encore prématuré d’y associer l’existence d’une réelle ambition pour faire de l’Open Data un levier de changement. Pour preuve, les conflits liés aux données fermées se multiplient et l’absence de soutien politique pour l’extension de l’ouverture à des données d’intérêt général, ou permettant réellement de rendre compte de l’action publique risque de confiner le mouvement français à une logique de publication de données gadgets.

Un premier sujet de déception porte sur la position du ministère de la Culture qui s’est récemment déclaré “favorable à l’ouverture des données culturelles dans un cadre d’exception“. Entendez : oui à l’Open Data, mais sans toucher au cadre juridique actuel qui confère aux données culturelles le pouvoir de se soustraire à l’obligation d’ouverture.

Dans cette réponse publique à l’Assemblée Nationale, le ministère de la Culture et de la Communication rappelle qu’il participe très activement aux négociations européennes sur la révision de la directive portant sur la réutilisation des informations publiques. Il s’y est même montré favorable à l’élargissement du champ de la réutilisation des données aux musées, archives et bibliothèques, “dans la mesure où un régime spécifique leur serait appliqué”. Ce qui, une fois traduit en Open Data, revient à confirmer un lobbying français en faveur de l’exclusion des données culturelles du champ du droit d’accès à l’information publique en Europe.

Dans le domaine de la culture, le nouveau gouvernement semble donc être aussi peu disposé que l’ancien à faire preuve de volontarisme.

Une police bien gardée

Courir après les policiers municipaux

Courir après les policiers municipaux

La transparence et l'ouverture des données (Open Data) sont des priorités pour nos administrations. À priori. Nous ...

Une autre source de questionnement quant à une volonté politique réelle sur l’extension de l’ouverture de données : une cartographie d’Owni qui identifie les préfectures ayant accepté de fournir aux journalistes l’effectif des polices municipales locales. Si la carte semble s’être enrichie depuis la parution de l’article, on y constate que de nombreuses préfectures refusent encore de fournir leurs informations publiques.

Les villes et régions engagées dans des procédures d’ouverture de données n’ont pas de préfectures plus collaboratives que les autres. La Préfecture de Paris, qui a le mérite d’être la seule engagée dans une démarche Open Data, se cantonne malheureusement à publier la localisation des fourrières et commissariats et n’aurait, selon la carte, pas transmis les informations sollicitées par Owni.

Même constat de rétention pour la Préfecture de Loire-Atlantique dont tous les niveaux de collectivités sont pourtant engagés dans l’ouverture de données avec un portage politique.

Tartufferie Open Data : posture de communication sur la transparence tout en faisant entrave au droit d’accès à l’information publique. Cette définition est probablement applicable à toutes les administrations engagées dans l’Open Data. Il va manquer quelques actes aux paroles pour convaincre d’un changement d’orientation.

L’accès aux soins pour les plus démunis d’information

D’autres domaines semblent également confirmer un manque de volonté politique sur l’Open Data. À quelques semaines d’intervalle, deux services se sont vus interdire l’usage d’informations liées à la santé. S’il s’agit parfois d’informations pouvant sortir du cadre du droit à la réutilisation, ces deux événements interpellent néanmoins sur la nécessité d’un questionnement des pratiques de services publics qui ne sont, de toute évidence, pas à l’avantage des usagers.

Fourmisanté, lauréate du concours Open Data national Dataconnexions, réutilisait des informations publiques disponibles sur le site Ameli, géré par la Caisse Nationale d’Assurance Maladie des Salariés (Cnams). Le projet : développer un service permettant aux internautes de comparer les tarifs de consultation des médecins généralistes et des spécialistes sur une localité. Objectif : favoriser la diffusion d’information sur le coût de la santé afin de permettre à chacun de faire de meilleurs choix et des économies.

Le site a dû fermer son comparateur de tarifs médicaux après une mise en demeure de la Cnams.

Un cas similaire de demande d’accès à ces informations avait déjà été traité par la Cada qui confirme la nature publique des informations sollicitées, tout en précisant que la liste des médecins comporte des informations à caractère personnel qui ne sauraient entrer dans le cadre d’une communication sans anonymisation malgré le fait que l’information soit effectivement disponible en ligne.

Pour rappel, il est possible de réutiliser des données à caractère personnel (tels que le nom et numéro de téléphone d’un médecin ou autres professions libérales) s’il y a eu consentement de diffusion. Il serait possible de transposer ce droit aux usages externes mais ce n’est pas l’objectif de la Cnams qui s’offusque selon Rue89 que les données présentes sur le site Ameli-Direct, “résultat d’investissement financier, matériel et humain substantiels” (ceux des services de l’État, donc), soient utilisées par fourmisante.com

Les commentaires des internautes sur l’article en disent d’ailleurs long sur le chemin culturel qu’il reste à parcourir pour rendre présentable la notion de réutilisation d’informations publiques en France, pourtant créatrice d’emplois notamment sur le projet Fourmisanté. La médiatisation de l’affaire a finalement poussé Marisol Touraine, Ministre de la Santé, à s’exprimer sur le sujet en ces termes selon Politis : “Il revient aux pouvoirs publics de rassembler ces informations sur les hôpitaux, pour les rendre plus accessibles et plus transparentes”.

“Aux pouvoir publics.”

Entreprises-créatrices d’emploi, certes mais entreprises avant tout : non gratae. Ce qui remet en question l’argument avancé de développement de l’innovation sur des données publiques lorsque de toute évidence cela reste perçu comme un dommage collatéral. Pourtant à travers la charte de déontologie signée par les ministres, chacun d’entre-eux s’engageait à développer transparence mais également mise à disposition des données. Tant que les intentions ne seront pas suivies par des actes, tous les doutes restent permis sur l’existence d’une réelle volonté politique.

Ce différend est rendu public le jour même où démarrent des négociations entre l’assurance maladie, les syndicats de médecins libéraux et les mutuelles complémentaires santé, pour tenter d’encadrer les dépassements d’honoraires médicaux. On estime entre 300 et 400 le nombre de médecins qui pratiquent des honoraires “hors normes” soit jusqu’à dix fois le tarif sécu. Et plusieurs milliers de médecins ont des dépassements qui posent des problèmes concrets pour l’accès aux soins. Reste, dans cette jungle tarifaire, à comprendre pourquoi la Sécurité sociale ne fait pas tout pour faciliter l’accès des assurés à une comparaison des montants des honoraires. (Source)

Il semble que l’usage de données d’utilité publique comme moyen de pression et de négociation par certains corporatismes se fasse aujourd’hui avec le consentement des pouvoirs publics et au détriment des citoyens et usagers. Le constat est applicable à d’autres acteurs de la santé. Lire à ce sujet le pamphlet de la directrice de Fourmisanté qui dénonce un scandale français sur l’accès à l’information santé, devenu marronnier des médias par manque d’action politique.

Feu Dentistedegarde.net était un service santé basé sur des informations publiques devenues inaccessibles. Le service disponible pour la Loire-Atlantique proposait d’accéder aux coordonnées du dentiste de garde le plus proche en cas d’urgence. Il intégrait également les données ouvertes de Nantes Métropole pour offrir aux Nantais un calculateur d’itinéraire intégré. Le CHU de Nantes renvoyait vers ce service depuis son site internet et dentistedegarde.net a reçu plus de 18 000 visites en moins d’un an. Selon les développeurs, des dentistes allaient jusqu’à mettre à jour leurs coordonnées via le site, conduisant à l’enrichissement de la base.

Un partenariat entre l’ordre des chirurgiens-dentistes de Loire-Atlantique et les développeurs permettait à ces derniers d’obtenir les informations sur les gardes en amont de la mise en place (pour adapter leur service) et en échange ils enrichissaient la base fournie avec la liste des numéros de téléphones de dentistes qui n’étaient pas renseignés initialement. Chacun y trouvait donc son compte.

En octobre dernier, l’ordre de Loire-Atlantique a indiqué aux développeurs qu’ils devaient cesser de fournir la liste des gardes pour la fin d’année 2012. Dans un article de 20minutes, il est en effet rappelé que le remaniement dans la diffusion des gardes a été demandé au niveau national et par le ministère de la Santé afin d’organiser une redirection générale vers le Samu pour qu’il procède à l’orientation des patients auprès des praticiens ou hôpitaux selon les besoins.

Face à ce constat, les développeurs n’ont pas jugé utile de renouveler les domaines et hébergements du site qui devaient être reconduits en octobre. Le service n’est donc plus disponible en ligne.

Paradoxalement, Jérôme Mousseau, Président de l’ordre départemental, explique dans une interview sur Radio SUN que cette volonté de remaniement dans le traitement des informations répond à un manque d’informations sur le service de garde. “Beaucoup de gens ne savent pas qu’il y a un service de garde tous les dimanches matins et tous les matins des jours fériés”. On ne comprend pas bien comment supprimer l’information en ligne et la cantonner au 15 permettra au public de mieux prendre connaissance de l’existence de ces services.

Autre bémol à la stratégie : tout le monde n’appelle pas le 15 avant de se déplacer. Les infirmières du CHU de Nantes affirment que des patients qui auraient dû être orientés vers des praticiens finissent par engorger les urgences. Le système 15 focalise finalement l’effort sur le SAMU inondé d’appels de simple informations sur la localisation des gardes et sur les services hospitaliers tenus de gérer les cas des praticiens.

En 2009, Roselyne Bachelot, alors ministre de la Santé, disait vouloir mettre 10 millions d’euros sur la création d’une plate-forme internet et téléphonique visant à désengorger les centres 15. L’objectif du projet, qui n’a finalement pas été mis en œuvre, était de faciliter l’accès à l’information par un dispositif spécifique plutôt que de faciliter sa dissémination à moindre coût. La mode était et semble rester à une gestion centralisée et à l’information téléphonique.

Mathieu Le Gac-Olanié, créateur de dentistedegarde.net regrette :

La suppression de notre service va vers une plus grande concentration des appels vers le 15 ou un passage direct aux services hospitaliers sans orientation. Notre service gratuit et accessible à tous proposait pourtant d’offrir une première information en répondant aux questions telles que le numéro des gardes. Il était facilement possible de rajouter une mention invitant à appeler le 15 avant tout déplacement.

Dans l’interview sur Radio SUN, l’ordre des chirurgiens-dentistes justifie le contrôle de la diffusion de l’information par une question de sécurité des praticiens dans un domaine “très féminisé”. Cela semble paradoxal avec la volonté de promouvoir l’existence des gardes d’urgence auprès du grand public mais nous pourrions entendre l’argument sécuritaire s’il ne perdait de la crédibilité au constat que les services publics eux-mêmes ont parfois des difficultés à accéder à l’information des gardes (des dentistes comme des pharmaciens). Il y a donc un réel problème de diffusion et accès des informations aux services d’urgence, au détriment même des services publics et des usagers.

Son : Radio SUN (93.0 FM)

La mise à disposition d’informations en ligne reste une solution négligée et synonyme de perte d’un contrôle toujours plus illusoire lorsque l’on pourrait au contraire explorer les pistes des nouvelles pratiques numériques pour tenter de résoudre des problèmes d’utilité publique.

Serons-nous tartuffés ?

L’Open Data payant s’ouvre à la gratuité des débats

L’Open Data payant s’ouvre à la gratuité des débats

Monétiser les données publiques : le débat a ressurgi après l'annonce la semaine d'une réflexion menée dans ce sens. Un ...

S’il est encore trop tôt pour discuter de la stratégie Open Data du gouvernement, qui semble cependant se donner les moyens de pérenniser les actions, les quelques éléments de réponse et non-réponse des nouveaux dirigeants politiques sur les conflits d’accessibilité aux données pouvant provoquer débat ou interprétation semblent refléter une position résolument conservatrice. Il serait donc légitime de se demander si nous allons continuer d’assister à de l’Open Data gadget qui ne libère que les informations accessibles par ailleurs.

Toutes les données ne sont pas bonnes à ouvrir largement mais pour celles considérées publiques, la loi garantit devrait garantir qu’elles soient accessibles à tous. Pour certaines données essentielles parfois hors-cadre du droit d’accès à l’information, une réflexion s’impose sur leur requalification. Des données dans le domaine de la santé, de la sécurité, de la culture et des finances sont notamment concernées. Des données des administrations mais également d’entreprises, associations et autres organismes qui détiennent aujourd’hui des informations d’utilité publique. Cela implique l’affirmation politique d’une volonté d’extension de l’ouverture.

Dans un contexte de forte pression fiscale et d’efforts demandés aux Français, il paraît d’autant plus essentiel d’assurer la transparence de l’action publique et de garantir une action de qualité orientée vers l’usager. Une réflexion est donc indispensable pour définir le cadre de l’extension de l’ouverture et le délimiter.

Si l’Open Data ne devait libérer que des données consensuelles, sans remettre en question certaines pratiques, nous passerions à côté des objectifs et opportunités de ce projet social. Or cela requiert du volontarisme politique qui fait encore cruellement défaut.


Photos sous licences Creative Commons par Pulpolux, JFPhoto, Sharon Drummond et Kicki
Billet initialement publié sur LiberTIC en Creative Commons et reproduit avec l’aimable autorisation de son auteur.

]]>
http://owni.fr/2012/11/06/et-si-cetait-la-faim-de-l-open-data/feed/ 18
Vol noir de corbeaux sur l’Open Data français http://owni.fr/2012/11/02/vol-noir-de-corbeaux-sur-lopen-data-francais/ http://owni.fr/2012/11/02/vol-noir-de-corbeaux-sur-lopen-data-francais/#comments Fri, 02 Nov 2012 14:29:02 +0000 Sabine Blanc http://owni.fr/?p=124902 Owni aux deux articles très relayés qui laissent augurer d'un avenir assombri pour l'ouverture des données en France. Pour elle, il s'agit d'un bad buzz non étayé. Tribune en mode décorticage des faits. ]]>

La France entr’ouverte

La France entr’ouverte

L'État a lancé son site data.gouv.fr. La France, enthousiaste, ouvre donc ses données publiques comme les États-Unis. ...

Ce mercredi, Le Journal du Net a publié un article intitulé “Etalab dissout, vers la fin de l’open data à la française ?”, à propos du regroupement d’Etalab, la mission gouvernementale chargée depuis 2011 de l’Open Data, avec la direction interministérielle pour la modernisation de l’action publique (DIMAP) et la direction interministérielle des systèmes d’information et de communication (DISIC).

Pour nos confrères, cette évolution “pourrait entrainer un changement de philosophie de la part de l’Etat en matière d’ouverture des données publiques”, en mal. L’article en évoquait un autre à l’appui, des Echos, “Open data : l’Etat pourrait renoncer à la gratuité des données publiques”.

Deux articles assez pessimistes, qui apparaissent peu factuels à Regards citoyens, association pionnière de l’Open Data en France, d’autant plus qu’ils ont été très relayés, en particulier sur Twitter, et qu’il a déclenché une réaction de l’UMP, qui y a vu une occasion de taper sur la majorité. Pour dénoncer le retour en arrière du gouvernement.

Au contraire, Regards citoyens y voient un effet de communication sans fondements :

Nous n’hésitons jamais à Regards citoyens à réagir quand des choses nous semblent alarmantes, par exemple sur les redevances que font payer certaines administrations ou les formats propriétaires d’Etalab, mais là nous avons plus le sentiment d’assister à la déferlante d’un buzz basé sur aucun fait réellement inquiétant.

#OpenData <3 #FactChecking :)

Un point de vue partagé par LiberTIC, autre historique :

Point par point, Regards citoyens (RC) revient sur ce qu’il estime être des imprécisions et des spéculations, en s’appuyant en particulier sur le texte du décret (les gras sont de RC). Ainsi, le verbe dissoudre leur semble incorrect : “Le gouvernement a décidé de dissoudre Etalab dans la Direction interministérielle pour la modernisation de l’action publique [...]

L’Open Data payant s’ouvre à la gratuité des débats

L’Open Data payant s’ouvre à la gratuité des débats

Monétiser les données publiques : le débat a ressurgi après l'annonce la semaine d'une réflexion menée dans ce sens. Un ...

“Le secrétariat général pour la modernisation de l’action publique regroupera l’ancienne direction générale de la modernisation de l’Etat  (devenue direction interministérielle pour la modernisation de l’action  publique) et la direction interministérielle des systèmes d’information  et de communication (DISIC). Il prendra également en charge la coordination  interministérielle de la réforme des services déconcentrés de l’Etat,  ainsi que la mission chargée de faciliter la mise à disposition des  données publiques (mission dite Etalab). L’ensemble, placé sous  l’autorité du Premier ministre, constitue un outil cohérent pour une  nouvelle approche de la réforme administrative.”

“Il s’agit donc plus d’une refonte et modernisation de la DGME (anciennement juste à Bercy) dans l’esprit, interministériel, d’Etalab et de la DISIC que l’inverse”, commente RC. D’autant que le nouveau directeur est Jérôme Filippini, ancien de la DGME mais seulement depuis trois semaines, probablement en prévision de cette réorganisation, et surtout ancien de la DISIC.

Autre point mis en avant par le Journal du Net, qui avançait : “Mais alors que  la mission d’Etalab était de “rassembler” et de “mettre librement” les  données publiques à disposition d’une communauté de réutilisateurs,  l’ex-DGME se contentera désormais de “faciliter la mise à disposition  des données publiques”, stipule le décret paru au Journal Officiel.”

Une lecture un peu rapide du décret, poursuit RC, puisque les missions restent inchangées :

“Article 2.III ― Il coordonne l’action des services de l’Etat et de ses  établissements publics pour faciliter la réutilisation la plus large possible de leurs informations publiques. Il administre le portail  unique interministériel destiné à rassembler et à mettre à disposition librement l’ensemble des informations publiques de l’Etat, de ses établissements publics et, si elles le souhaitent, des collectivités  territoriales et des personnes de droit public ou de droit privé chargées d’une mission de service public. Il coordonne les travaux interministériels relatifs à l’amélioration du fonctionnement des services déconcentrés de l’Etat.”

Open Data, un premier bilan français

Open Data, un premier bilan français

Six mois après le lancement du portail gouvernemental de libération des données publiques Etalab, de nombreuses ...

Rajoutons que Jérôme Filippini a plutôt un profil data-compatible. Lors de son discours d’ouverture de l’Open World Forum, le mois dernier, le même Journal du Net rapportait “Evoquant le projet data.gouv sur l’ouverture des données publiques comme première étape de la démarche, il enfonce le clou : “Le premier ministre a pris l’initiative de lancer la semaine dernière un nouveau cycle de réformes de modernisation de l’action publique”, enchaîne-t-il. Or, l’une des colonnes vertébrales de ce nouveau projet est bien la participation des usagers et des agents à la construction du service public. “C’est évidemment là un premier lien qui va se dessiner entre l’Open Source et l’Open Gouvernance”

Feuille de route inchangée

Sur le passage au payant de certaines données, RC pointe un communiqué de presse du gouvernement relayé cette semaine par Etalab, annonçant l’inverse :

La feuille de route d’Etalab sera précisée dans les semaines qui viennent. Il s’agira de poursuivre la mise à disposition gratuite des données publiques.

Sur l’article des Echos, RC relève que “les informations sont au conditionnel et n’ont d’autres sources que la phrase d’Olivier Schrameck, peut-être même sortie de son contexte, Schrameck disait par ailleurs le contraire lors d’un colloque OpenData le lendemain” :

“Au final ce décret ne fait que confirmer l’engagement opendata, conclut Regards citoyens, en le réorganisant, mais c’est la seule information nouvelle depuis la charte de déontologie [pdf] au premier conseil des ministres du gouvernement qui annonçait déjà un engagement fort pour l’opendata.”

On devrait en savoir davantage en décembre, avec la tenue du premier comité interministériel pour la modernisation de l’action publique. Il adoptera alors “une feuille de route sur l’administration numérique, l’e-citoyenneté et la mise à disposition de données publiques.”


Photo par John Curley [CC-byncsa]

À lire aussi cet article de LiberTIC : Couvrez ces données que l’on ne saurait voir

]]>
http://owni.fr/2012/11/02/vol-noir-de-corbeaux-sur-lopen-data-francais/feed/ 4
Les mauvaises données des marchés http://owni.fr/2012/06/12/les-mauvaises-donnees-des-marches/ http://owni.fr/2012/06/12/les-mauvaises-donnees-des-marches/#comments Tue, 12 Jun 2012 15:40:29 +0000 Marie Coussin http://owni.fr/?p=113029

Depuis peu, le site data.gouv.fr met en avant sur sa page d’accueil trois sets de données particulièrement attractifs : la liste des attributaires des marchés publics d’État pour les années 2008, 2009 et 2010.

Or ces données contiennent de nombreuses erreurs (montants invalides, cases vides, informations incomplètes, etc.), rendant tout le fichier inutilisable. Une petite boulette qui récuse même la notion de “donnée ouverte” pourtant au cœur même du mouvement Open Data dont se revendique data.gouv.fr.

Simon Chignard, vice-président de la Cantine de Rennes, spécialisé sur ce sujet, donne la définition d’une donnée ouverte dans son livre L’open data, comprendre l’ouverture des données publiques :

Pour qu’une donnée soit ouverte, elle doit répondre à trois grands critères :

  • techniques : les données brutes doivent être exploitables de manière automatique (i.e. par des programmes informatiques) et mise à disposition dans des formats les plus ouverts possibles et non propriétaires (par exemple : on privilégie le format .csv à .xls d’Excel),
  • juridiques : les licences doivent clarifier les droits et les obligations des détenteurs et des réutilisateurs de données, elles doivent être les plus ouvertes possibles (par exemple : obligation d’attribution ou de partage à l’identique),
  • économiques : peu ou pas de redevances tarifaires (susceptibles de constituer des freins à la réutilisation), tarification maximale au coût marginal, …
  • Les explications d’Etalab

    L’interlocuteur de référence sur ce sujet est Etalab, mission mise en oeuvre par le Premier Ministre François Fillon, en mai 2011 pour la création et de la gestion de data.gouv.fr. Bien que créée sous le gouvernement précédent, Etalab reste néanmoins en charge du portail, avec l’élection de François Hollande. La Charte de déontologie du gouvernement Ayrault, signée par les ministres, fait clairement mention de leur engagement envers l’Open Data :

    Plus généralement, le gouvernement a un devoir de transparence. Il respecte scrupuleusement les dispositions garantissant l’accès des citoyens aux documents administratifs. Il mène une action déterminée pour la mise à disposition gratuite et commode sur internet d’un grand nombre de données publiques.

    Owni a donc demandé à Etalab des explications sur les erreurs rencontrées. Romain Tales, responsable du recensement des données publiques, précise le parcours de publication sur data.gouv.fr :

    Conformément à la circulaire du 26 mai 2011 instituant Etalab, un coordinateur a été nommé par ministère pour définir et transmettre les données à publier. Ce coordinateur initie les différents contacts dans les services, les directions, les bureaux, reliés à son ministère. Il peut ensuite créer une “équipe” qui a accès au back office du site. Cette “équipe” est globalement autonome sur le back office. Une personne est responsable de charger le jeu de données à mettre en ligne.
    Ce jeu de données est ensuite soumis à validation : relecture, vérification du contenu, des méta-données, etc. Jusqu’à trois personnes peuvent valider ce jeu de données avant que le responsable de publication de data.gouv.fr ne le publie définitivement.

    La France entr’ouverte

    La France entr’ouverte

    L'État a lancé son site data.gouv.fr. La France, enthousiaste, ouvre donc ses données publiques comme les États-Unis. ...

    La personne pouvant répondre précisément sur les erreurs du jeu de données ne dépend donc pas directement d’Etalab mais du ministère concerné. Dans ce cas, il s’agit du ministère du Budget, des Comptes publics et de la Réforme de l’Etat, plus précisément le SAE – service des achats de l’Etat. Romain Tales nous assure les avoir contactés et être, plus de 72 heures après notre premier appel, sans retour de leur part.

    Owni n’est pas le seul à avoir relevé des incohérences dans ces jeux de données : des internautes l’avaient d’ores et déjà exprimé sur le forum mis à disposition par data.gouv.fr. Les commentaires relevaient notamment des données incomplètes et “des valeurs extrêmes étranges”.

    Le modérateur d’Etalab poste à chaque fois la réponse suivante (dernière en date : 5 mai 2012) :

    Bonjour,
    Le Ministère du Budget, des Comptes publics et de la Réforme de l’Etat a pris connaissance de ce dysfonctionnement.
    Nous ne manquerons pas de vous tenir informé dès que le problème sera résolu.
    Merci pour votre contribution sur data.gouv.fr

    Sans éléments précis de réponse sur ce jeu de données, Romain Tales conclut néanmoins :

    Le processus que nous avons mis en place est fait pour éviter ce genre de situation. Le problème avec ce jeu de données sur les marchés publics est plutôt l’exception, passée au travers des mailles du filet. Mais l’ouverture et la publication des données est encore quelque chose de nouveau, et de complexe, avec lequel nous devons nous familiariser.

    Dommage que les mailles du filet aient laissé passer autant d’erreurs, sur un jeu de données aussi emblématique. Florilège des plus importantes.

    Des montants surréalistes

    Par exemple, le rectorat de Montpellier aurait publié un marché ayant pour objet “la localisation de données pour relier l’ensemble des sites du Rectorat de l’Académie de Montpellier”, attribué à France Telecom, pour un montant de plus de 30 milliards d’euros.

    Owni a retrouvé le réglement de consultation accompagnant la publication de ce marché : il stipule que le montant minimum de cette opération sera de 30 000 euros et le montant maximum de 120 000 euros. Voilà d’où viennent donc les 30 milliards d’euros : 30 000 + 120 000 ont été accolés dans le fichier publié par data.gouv.fr.

    D’autres montants semblent très suspects dans le fichier :

  • plus de 1,4 milliard d’euros a été attribué à l’entreprise AMD Multicom pour “l’impression des documents (brochures, affiches et dépliant) du plan académique de formation et des innovations de l’académie pour 2009″, toujours pour le rectorat de Montpellier ;
  • 300 millions d’euros auraient été attribués par la préfecture des Hauts-de-Seine et les sous-préfectures d’Antony et Boulogne-Billancourt, pour de la location et entretien de vêtements.
  • Le jeu de données 2010 comportant 16 231 lignes, il est impossible de vérifier l’ensemble des montants à la main. Les anomalies relevées sur quelques unes des lignes jettent donc le discrédit sur l’ensemble du fichier.

    52 % des marchés

    Sur ce même jeu de données, 7 519 lignes sont renseignées sans aucun montant relatif au marché public passé. A ces lignes sans montant, il faut ajouter les 1 010 lignes pour lesquelles la colonne “Montant” est effectivement remplie, mais de manière erronée : “611193.96partieforfaitaire-sansminimaxi” par exemple. Autrement dit, le montant du marché public est inconnu pour 52 % du fichier.

    Parfois, des cases vides se cumulent : c’est le cas de deux marchés passés par le Ministère de la Défense avec la société Amesys (que nous connaissons bien à Owni) mais dont on ne perçoit ni l’objet ni le montant.

    Sur des pans entiers du fichier, les colonnes ont été décalées : la colonne “Montant” a ainsi été renseignée avec les codes postaux. Pour un grand nombre de marchés publics, impossible donc de savoir qui a passé le marché. Dommage : on aurait adoré savoir quel ministère ou entité publique s’est réabonnée à la revue “La coiffure de Paris”.

    Si les erreurs relevées sur ce fichier ne peuvent servir de référence à la qualité des 352 431 jeux de données publiés sur data.gouv.fr ; leur accumulation, sur un fichier aussi emblématique de l’Open Data que les marchés publics et mis en avant sur la page d’accueil du site, mérite réflexion.


    Analyse réalisée avec Nicolas Patte.
    Photo Flickr CC Hans Gerwitz (by-sa)

    ]]>
    http://owni.fr/2012/06/12/les-mauvaises-donnees-des-marches/feed/ 13
    L’Open Data à la croisée des chemins juridiques http://owni.fr/2012/06/07/l%e2%80%99open-data-a-la-croisee-des-chemins-juridiques/ http://owni.fr/2012/06/07/l%e2%80%99open-data-a-la-croisee-des-chemins-juridiques/#comments Thu, 07 Jun 2012 10:17:26 +0000 Lionel Maurel (Calimaq) http://owni.fr/?p=112746

    Les premiers bilans de l’Open Data en France, 6 mois après le lancement du portail data.gouv.fr, oscillent entre la reconnaissance des efforts consacrés par les administrations publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les citoyens.

    Mais en matière d’Open Data, la dimension juridique est également essentielle et c’est ce que vient de rappeler le Conseil national du numérique (CNNum), en publiant cette semaine un avis [pdf] qui recommande d’apporter des modifications substantielles au cadre législatif français.

    Open Data, un premier bilan français

    Open Data, un premier bilan français

    Six mois après le lancement du portail gouvernemental de libération des données publiques Etalab, de nombreuses ...


    C’est la loi CADA du 17 juillet 1978, qui pose les grands principes en la matière, modifiée à l’issue de la transposition en 2005 d’une directive européenne concernant la réutilisation des informations du secteur public.

    Longtemps, le débat en France a tourné autour des questions de licences employées par les administrations pour libérer leurs données et de leur compatibilité, à la fois avec les principes de l’Open Data qu’avec les exigences de la loi du 17 juillet 1978. Cette question contractuelle tend aujourd’hui à passer au second plan, l’essentiel des initiatives françaises ayant choisi d’opter soit pour la Licence Ouverte d’Etalab, soit pour l’ODbL proposée par l’Open Knowledge Foundation.

    Néanmoins, comme l’indique le Conseil national du numérique dans son avis, c’est sans doute au niveau législatif que les questionnements pourraient à présent glisser, et, au-delà, au niveau communautaire, puisqu’une proposition de révision de la directive sur les informations du secteur public a été avancée par la Commission européenne en décembre 2011[pdf]. Il est intéressant de confronter les recommandations du CNNum avec les orientations possibles de la future directive européenne, pour essayer de cerner les différents chemins juridiques qui s’ouvrent pour l’Open Data.

    Conforter le droit à la réutilisation des informations publiques

    La première recommandation du CNNum consiste à imposer progressivement aux administrations l’obligation de publier d’elles-mêmes leurs données, alors que la loi de 1978 les oblige seulement à les communiquer sur demande. Il s’agirait en effet d’une avancée indiscutable, mais en la matière, il faut cependant voir que la France est en quelque sorte en avance au sein de l’Union européenne, car la loi de 1978 reconnaît un véritable droit au profit des citoyens à la réutilisation des informations publiques, dès lors que les documents qui les contiennent sont accessibles.

    La directive européenne de 2003 n’allait pas si loin, dans la mesure où elle laissait la possibilité aux Etats ou aux administrations de décider quelles informations ils souhaitent rendre réutilisables ou non. Comme le dit Katleen Janssen dans une analyse d’avril 2012 [pdf], la directive “ne créait donc pas un droit plein et entier à la réutilisation” et cette limitation a pu constituer un frein important à la réutilisation des données publiques en Europe.

    Pour lever cet obstacle, la Commission recommande une modification de la directive qui exigera que toutes les informations accessibles puissent être réutilisées, aussi bien à des fins non-commerciales que commerciales. Les seules restrictions qui persistent concerneront la protection des données personnelles ou des droits de propriété intellectuelle de tiers. D’une certaine façon, l’Union européenne s’aligne en la matière sur des principes que la France a déjà mis en oeuvre dans sa législation dès la transposition de 2005 et il faut reconnaître que notre droit avait déjà franchi cette étape.

    La gratuité comme objectif

    En ce qui concerne la question de la gratuité, le CNNum et la Commission ont des approches un peu différentes, mais qui tendent toutes les deux à étendre le champ de la réutilisation gratuite des données.

    En France, comme le rappelle le CNNum, la gratuité a été fixée comme un principe par la circulaire du 26 mai 2011 qui a créé le portail data.gouv.fr. Ce texte  demande aux ministères et aux établissements publics relevant de leur tutelle de diffuser leurs données via le portail unique de l’Etat , en recourant à la Licence Ouverte qui permet la réutilisation gratuite, y compris à des fins commerciales.

    La France entr’ouverte

    La France entr’ouverte

    L'État a lancé son site data.gouv.fr. La France, enthousiaste, ouvre donc ses données publiques comme les États-Unis. ...

    Selon cette même circulaire, les administrations ne pourront plus après le 1er juillet 2012 instaurer d’elles-mêmes une redevance pour la réutilisation des données. Cela ne sera possible que par le biais d’un décret du Premier Ministre et à condition de pouvoir avancer des “éléments dûment motivés” considérés comme pertinents par le Conseil d’Orientation de l’Edition Publique et de l’Information Administrative (COEPIA). Pour renforcer encore cette dynamique de gratuité, le CNNum propose d’appliquer également cette procédure aux redevances instituées avant le 1er juillet 2012, afin de réexaminer leur bien-fondé au regard des évolutions actuelles.

    La proposition de directive européenne ne va pas de son côté jusqu’à proclamer un principe de gratuité en matière de réutilisation des informations publiques. Elle laisse, comme c’est le cas actuellement, la faculté aux administrations de décider d’instaurer des redevances, mais elle introduit des principes plus stricts que jusqu’alors en matière de calcul des tarifs. En principe, les redevances ne devront pas excéder “le coût marginal de reproduction et de diffusion“, ce qui empêchera aux administrations de rechercher à dégager des bénéfices importants et peut les inciter fortement à autoriser la réutilisation gratuite des données.

    Comme le relève le CNNum, ces préconisations sont plus restrictives que l’actuelle loi française qui permet aux administrations de tenir compte des coûts de collecte et de production, mais aussi d’inclure dans la redevance “une rémunération raisonnable de ses investissements“.

    Des licences ouvertes, mais les formats ?

    En ce qui concerne la question des licences, la proposition de directive européenne contient une consécration de cette démarche contractuelle inspirée des licences libres, alors que certains avaient pu douter un temps qu’elle soit vraiment compatible avec le régime légal de la réutilisation des données.

    La Commission indique que “les organismes du secteur public peuvent autoriser la réutilisation sans conditions ou poser des conditions, telle qu’une indication de la source, le cas échéant par le biais d’une licence”. Cette modification ouvre la voie à l’adoption de licences très ouvertes, telle la Creative Commons Zéro (CC0) et conforte la licence ouverte créée par Etalab.

    En ce qui concerne les formats en revanche, on peut regretter un manque de volontarisme aussi bien du côté de la directive que du CNNum. La proposition de révision de la directive impose l’obligation de diffuser les données dans des formats “lisibles par des machines”, mais elle n’indique pas que ces formats doivent être libres et non propriétaires. Pareillement, le CNNum propose que soit mis en place un Référentiel Général de Réutilisabilité des données publiques, qui comportera des indications concernant les formats, mais ne donne pas de recommandation forte en faveur des formats ouverts.

    Conjurer l’ #EPICFAIL en matière d’Open Data

    En revanche, le CNNum fait preuve d’audace en s’attaquant à une des limitations les plus importantes au développement de l’Open Data en France. Il préconise en effet que le droit à la réutilisation des données publiques soit étendu à celles produites par des SPIC (Services Publics à caractère Industriel et Commercial), alors que la loi du 17 juillet 1978 considère pour l’instant qu’il ne s’agit pas d’informations publiques.

    Or de nombreux EPIC (Établissements Publics à caractère Industriel et Commercial) disposent de données particulièrement intéressantes pour l’Open Data, comme c’est le cas de la SNCF, du CNES, de l’ONF, de l’IGN, de l’IFREMER et d’autres encore. La restriction de la loi de 1978 n’a certes pas empêché un établissement comme la SNCF de se lancer dans une démarche d’Open Data, mais elle l’a fait sur une base purement volontaire (et avec certaines frictions du côté des licences).

    (cliquez sur la photo pour la version PDF) Une des nouvelles proposition de cartes du métro de Paris lors du concours lancé par Check My Metro - Plan de Nojhan. Vote du Jury : Plan d’Argent.

    Le régime particulier des EPIC a pu conduire aussi à des #EPICFAILS (;-), comme ce fut le cas en 2011 avec l’épisode rocambolesque du conflit entre la RATP et CheckMyMetro. On peut du coup se réjouir de la proposition faite par le CNNum, tout en restant conscient que la question de la tarification des réutilisations pourra néanmoins continuer à se poser.

    L’épineuse question des données culturelles

    C’est également une des prises de positions du CNNum les plus fortes que celles qu’il avance à propos des données culturelles. A l’heure actuelle, les données culturelles relèvent elles aussi d’un régime dérogatoire, dénommé “exception culturelle”,  qui découle de la directive européenne. J’ai déjà eu l’occasion sur Owni de montrer que ce régime d’exception soulève de réelles difficultés et qu’il provoque une marginalisation des données culturelles au sein du mouvement d’Open Data en France.

    Le CNNum partage cette analyse et déplore la sous-exploitation des données culturelles, qui sont pourtant par leur richesse particulièrement propices à la réutilisation. Considérant que leur nature ne justifie pas qu’elles soient traitées à part, il recommande que l’exception culturelle soit purement et simplement levée et que les données culturelles réintègrent le régime général de la loi de 1978.

    Mieux encore, le CNNum condamne une des dérives les plus criantes de l’emploi du droit des données publiques en France. En effet, certains établissements culturels utilisent ce droit pour empêcher la réutilisation à des fins commerciales des oeuvres du domaine public qu’ils numérisent, à moins de payer une redevance. D’autres utilisent le droit de la propriété intellectuelle pour “reprivatiser” le domaine public en s’arrogeant un droit sur les images scannées. Le CNNum déplore ces pratiques et c’est sans doute la première fois en France qu’une position officielle s’élève aussi nettement en faveur de la défense du domaine public.

    Des données culturelles à diffuser

    Des données culturelles à diffuser

    La libération des données est loin d'être complètement acquise en France. Si le portail Etalab est une première étape, ...

    Mais hélas, en matière de données culturelles, la proposition de révision de la directive européenne s’avère plus décevante et elle pourrait même conduire à une régression en France. En effet, en apparence, la nouvelle directive propose également de considérer les données des bibliothèques, des musées et des archives comme des informations réutilisables, ce qui supprime la fameuse exception culturelle. Mais plus loin, et de manière assez contradictoire, le texte réintroduit des règles spécifiques en ce qui concerne les données produites par ces établissements, et elles ne vont pas dans le sens de l’ouverture.

    Par exemple, pour les informations sur lesquelles les bibliothèques, musées et archives détiennent eux-mêmes des droits de propriété intellectuelle, ces établissements pourraient toujours continuer à décider de permettre ou non a priori la réutilisation des données. De telles dispositions appliquées en France constitueraient une régression, car la  jurisprudence administrative a déjà décidé que l’exception culturelle ne permettait pas, par exemple, à un service d’archives de s’opposer à la réutilisation de données numérisées par une entreprise.

    Par ailleurs, la proposition de directive indique que par dérogation avec les principes généraux qu’elle énonce, les établissements culturels pourraient continuer à fixer des tarifs de réutilisation des données supérieur “aux coûts marginaux de reproduction et de diffusion” qu’elle fixe comme limite aux autres administrations. Il n’y a pas pire signal à envoyer aux établissements culturels, qui cèderont sans doute à la tentation de monétiser leurs données, ce qui continuera à les couper de l’Open Data. La CADA avait pourtant déjà interdit aux services d’archives de fixer des tarifs trop élevés et là aussi, la nouvelle directive constituerait une forme de régression.

    On peut franchement déplorer le manque de cohérence de la proposition de révision de la directive en matière de données culturelles et espérer que ces aspects soient modifiés avant son adoption.

    Les données publiques, des biens communs ?

    Il y a une question relative à l’Open Data qui n’est abordée ni par le CNNum, ni par la proposition de révision de la directive et qui me paraît pourtant correspondre à un véritable enjeu.

    Le cadre juridique n’envisage pour l’instant, ni au niveau européen, ni au niveau national, la possibilité d’appliquer une clause de partage à l’identique (Share Alike) en cas de réutilisation de données publiques, à l’image de ce qui caractérise le Copyleft dans le domaine du logiciel libre. Une clause de ce type impose à celui qui réutilise des éléments de placer ses propres enrichissements sous la même licence, afin de conserver le caractère ouvert et réutilisable prévu par la licence initiale. Appliquée aux données publiques, une telle démarche signifie qu’en cas de réutilisation, une firme serait par exemple obligée de placer les bases qu’elles auraient constituées sous une licence ouverte et de permettre elle aussi la réutilisation des données en les reversant à une sorte de “pot commun” où d’autres pourraient venir puiser.

    Certaines administrations françaises, au niveau local, ont déjà opté pour cette logique du partage à l’identique, en choisissant de placer leurs données sous la licence ODbL, qui comporte une telle clause virale. Mais au niveau des administrations centrales, cette démarche est pour l’instant impossible, car la Licence Ouverte de data.gouv.fr n’impose pas le Share Alike, mais seulement la mention de la source.

    Certains estiment que le partage à l’identique serait nécessaire pour constituer les données publiques en biens communs et empêcher qu’elles soient réappropriées de manière définitive par des acteurs privés. On évoluerait ainsi vers une approche moins “libérale” de l’Open Data et des rapports économiques plus équilibrés entre le public et le privé. Force est de constater que cette dimension ne figure ni dans les recommandations du CNNum, ni dans la proposition de directive, mais la situation pourrait être modifiée si le partage à l’identique était au moins proposé commune option dans la Licence Ouverte de data.gouv.fr.

    Au niveau européen, on peut même se demander si l’ajout d’un Share Alike par le biais d’une licence est bien compatible avec les orientations de la nouvelle directive, dans la mesure où celle-ci indique que conditions posées par les licences ne doivent pas “limiter indument les possibilités de réutilisation“.

    Doit-on faire de l’Open Data la règle ?

    Dans une chronique précédente, j’avais évoqué les recommandations du réseau européen Communia, qui préconisait de faire de l’Open Data un principe général applicable par défaut au données publiques. Pour ce faire, Communia recommandait :

    1) de recourir à des licences les plus ouvertes possibles, afin de rapprocher au maximum le régime juridique des données publiques du domaine public ;

    2) de rendre obligatoire la diffusion des données dans des formats ouverts, lisibles par des machines ;

    3) d’affirmer un principe de gratuité en matière de réutilisation des données publiques.

    Les recommandations du CNNum et la proposition de révision de directive contiennent des orientations fortes en ce sens, mais ils ne vont ni l’un, ni l’autre jusqu’à consacrer l’Open Data comme un principe général. Cela signifie que l’Open Data restera encore dans les années à venir avant tout une question de volonté politique et non la simple conséquence d’une obligation juridique.


    Photo par Tim.tom [CC-byncsa] ; Plan du métro par Nohjan via CheckMyMetro et via sa galerie Flickr [CC-bysa]

    ]]>
    http://owni.fr/2012/06/07/l%e2%80%99open-data-a-la-croisee-des-chemins-juridiques/feed/ 7
    Open Data, un premier bilan français http://owni.fr/2012/05/31/open-data-france-premier-bilan-francais-etalab/ http://owni.fr/2012/05/31/open-data-france-premier-bilan-francais-etalab/#comments Thu, 31 May 2012 07:45:45 +0000 Hubert Guillaud http://owni.fr/?p=111977 Internet Actu, dans un papier que nous republions ici.]]> Claire Gallon de LiberTIC, l’association nantaise de promotion de l’ouverture des données publiques (@LiberTIC), et Charles Nepote du programme Réutilisation des données publiques de la Fondation internet nouvelle génération (Fing) (@CharlesNepote, @la_fing), principaux coorganisateurs de la Semaine européenne de l’Open Data qui avait lieu à Nantes du 21 au 26 mai 2012, ont commencé par poser un état des lieux assez complet du mouvement de réutilisation des données publiques.

    OpenDataWeek - photo cc Ton Zijlstra

    OpenDataWeek - photo cc Ton Zijlstra

    Ce que l’Open Data a réalisé

    Le mouvement pour la réutilisation des données publiques est un mouvement mondial né début 2009 et qui a connu une forte accélération en 2010-2011, estime Charles Nepote. Si le mouvement a été esquissé par la liste des 8 principes pour un gouvernement ouvert en décembre 2007, qui a initié et cristallisé une dynamique auprès de multiples acteurs associatifs, il est devenu un principe avec l’investiture de Barack Obama et le lancement en mars 2009 du projet Data.gov (voir l’historique retracé par Wikipédia ou celui de Simon Chignard sur son blog : “Comment l’Open Data est devenu un objet politique”).

    La France entr’ouverte

    La France entr’ouverte

    L'État a lancé son site data.gouv.fr. La France, enthousiaste, ouvre donc ses données publiques comme les États-Unis. ...

    Aujourd’hui, dans le monde, une quinzaine d’Etats et une cinquantaine de communautés urbaines (sans compter les villes du Royaume-Uni, où une centaine de communautés urbaines se sont lancées dans la libération de données sous l’impulsion du gouvernement britannique) parmi les plus importantes villes américaines sont impliquées. PublicData.eu recense quelques 215 initiatives d’acteurs publics en Europe, que ce soit au niveau national (Belgique, Finlande, Suède, Norvège, Espagne, Grèce, France, Royaume-Uni…) ou régional.

    En France, c’est Kéolis et Rennes Métropole qui ont lancé la première initiative en 2010 avec l’entrepôt de données de Rennes Métropole, rejoint par d’autres initiatives régionales et territoriales (dont les plates-formes Open Data de Paris, de la Saône-et-Loire, de la Loire Atlantique, du Loir-et-Cher, de la Gironde, de la Communauté urbaine de Bordeaux, du Grand Toulouse, de Nantes, Montpellier… voire la carte des initiatives d’ouverture des données publiques établie par LiberTIC), puis par le lancement fin 2011 d’EtaLab puis du portail Data.gouv.fr, l’initiative portée par l’Etat. En 2 ans, le paysage juridique s’est simplifié, comme le soulignait Regards Citoyens il y a quelques mois. L’essentiel des jeux de données convergent autour de deux licences : l’Open Database License (ODLB) et la Licence ouverte [pdf]. L’initiative Open Data va-t-elle être portée plus avant par son inscription dans la charte de déontologie du gouvernement Ayrault ?

    Carte de France de l'Open Data maintenue par LiberTIC, version 4, mise à jour janvier 2012

    Carte de France de l'Open Data maintenue par LiberTIC, version 4, mise à jour janvier 2012

    Pourtant “si le mouvement commence à se structurer, force est de reconnaître que nous en sommes encore au temps des pionniers“, souligne Charles Nepote. Si on observe la carte de France des initiatives d’ouverture des données publiques maintenues par LiberTIC, on constate que de plus en plus de collectivités s’engagent à différents niveaux de territorialité dans le domaine de la publication de données réutilisables. D’ici 18 mois, 11 villes sur les 15 plus grandes villes de France auront ouvert leurs données. Régions, conseils généraux, villes et agglomérations, mais également prestataires de services des villes (comme Suez Environnement) ou sociétés privées (le portail Open Data de la SNCF par exemple) ont rejoint le mouvement, sans compter le rôle moteur d’associations citoyennes qui organisent la coproduction des données comme Open Street Map ou Regards Citoyens. Pas moins de 8 mouvements citoyens locaux de réutilisation de données ont déjà vu le jour (c’est-à-dire initiés par des associations de citoyens et non pas par l’acteur public), comme Open Data 69 ou le collectif Open Data de Touraine. Hors la libération de données par l’Etat, on a plus de 800 jeux de données ouvertes par les acteurs territoriaux qui ont permis de produire plus de 200 applications…

    La France a rattrapé son retard au démarrage. – Charles Nepote

    Les défis à venir de l’Open Data

    Reste que ces premiers chiffres passés, l’approche de l’Open Data demeure encore très technique, très geek. L’une des grandes questions que se posent les animateurs du mouvement, c’est comment toucher le grand public, comment élargir la dynamique à d’autres acteurs qu’à des gens impliqués dans la publication et la réutilisation des données. Le mouvement n’a pas réussi notamment à toucher les acteurs traditionnels de l’économie sociale et solidaire ou de la démocratie participative.

    Des données culturelles à diffuser

    Des données culturelles à diffuser

    La libération des données est loin d'être complètement acquise en France. Si le portail Etalab est une première étape, ...

    Néanmoins, l’Open Data n’a pas produit que des jeux de données. Il a montré tout d’abord que le sujet était un levier interne de modernisation pour les acteurs publics. Recenser les données, rationaliser les systèmes d’information, aider au décloisonnement des services, élargir la culture de la donnée (en en faisant un outil de monitoring, de pilotage de la décision publique), améliorer la qualité des données et surtout introduire de nouvelles dynamiques de dialogues avec les usagers, se sont vites montrées comme des enjeux certainement encore plus essentiels que la libération des données elles-mêmes. Elle permet d’initier de nouvelles relations à l’information et plus encore elle est un moyen de nouer une nouvelle forme de dialogue entre les administrations et leurs publics.

    L’Open Data a aussi permis de forger des partenariats entre acteurs du territoire. Il a permis également de développer de nouveaux services, même si le marché est encore fragile et balbutiant. Charles Nepote s’étonne néanmoins qu’aucun acteur public n’ait publié son catalogue de données (incluant les données non encore publiées). Sans cet outil, comment connaître l’offre de données potentielle ? C’est pourtant à ses yeux ce qui permettrait de mieux dialoguer avec les potentiels réutilisateurs, si essentiels à l’élargissement de cette démarche. Il s’étonne également de l’obsession des applications. Pourquoi être aussi obnubilé par le développement d’applications ?

    On aimerait voir plus de diversités dans les modalités d’usages.

    A quand des dispositifs urbains ou hybrides, des services qui publient par e-mails plus que via des applications pour smartphone… Les méthodologies d’animation souffrent également de l’obsession du concours, alors qu’elles mériteraient d’être ouvertes à un peu plus de créativité (“cartoparties” permettant de cartographier ou documenter le territoire de données, approche de type “résidence” pour accompagner des publics spécifiques avec des spécialistes du sujet, etc.). Enfin, la question de l’éthique des données est une question qui est presque absente du débat, alors qu’elle est une question primordiale.

    Open Data Week Nantes - photo cc Ton Zijlstra

    Open Data Week Nantes - photo cc Ton Zijlstra

    Dialoguer, s’ouvrir

    Pérenniser, généraliser et banaliser les pratiques de l’Open Data comme levier de développement des territoires et des organisations est encore un enjeu à atteindre. Standardiser, mutualiser et harmoniser les initiatives également. Il n’est pas si simple de développer la coproduction et les usages sur ce sujet qui parait à tous bien technique. Pour tous, la clef repose dans l’animation. Car c’est par l’animation qu’on développera l’appropriation des données par le plus grand nombre, qu’on dépassera le public de geeks auquel les données s’adressent pour le moment. Car le risque est là, que le petit milieu de l’Open Data finisse par ressembler à celui des acteurs de la concertation publique : un microcosme qui évolue le plus souvent en vase clos. L’Open Data a besoin de systématiser et structurer le dialogue entre acteurs, de porter une attention particulière aux acteurs historiques de la médiation et de la concertation par lesquels le sujet peut s’élargir. Et certainement de développer la pédagogie de la culture des données.

    Le chemin parcouru en deux ans a été considérable conclut Charles Népote pour remonter le moral des troupes.

    Dans de nombreux territoires, un vrai dialogue s’est instauré entre l’acteur public et un petit cercle de développeurs et de réutilisateurs. La tension qui était présente quand on évoquait ce nécessaire dialogue avant le lancement des initiatives a partout disparu. Le dialogue a montré ses vertus. Reste à l’élargir.

    En effet. Les données ont été un moyen pour faire discuter l’acteur public avec des acteurs auquel il ne parlait pas nécessairement. Réussira-t-on à étendre ce dialogue constructif à d’autres objets que les données ? Peut-on étendre le dialogue à d’autres publics que les seuls développeurs ? L’acteur public doit-il élargir le champ des données à mettre en dialogue avec la société et mieux coproduire les données avec les citoyens ? Les données semblent être un prétexte pour interroger la transformation de l’acteur public et la façon de faire société. Reste à savoir si le plus petit morceau de technologie que sont les données est le bon levier ? Suffira-t-il pour pérenniser les actions engagées ?

    Le meilleur du pire des dépenses de l’Elysée

    Le meilleur du pire des dépenses de l’Elysée

    OWNI a dessiné un quinquennat d'explosion des dépenses de l’Élysée, à partir du dernier livre de René ...

    Le risque existe que le mouvement s’enferme dans des questions techniques, jouant de données toujours plus particulières ou complexes, peut préhensiles par le grand public. La libération de données budgétaires par exemple, s’il porte un enjeu de transparence publique, demeure un objet très technique, difficilement utilisable par le grand public. Il y a une exigence de libération de données toujours plus variées et de cocréation de données plus accessibles. Il y a certainement un enjeu dans la question de publication d’autres jeux de données, comme les données personnelles que l’administration dispose sur chacun de nous ou la coproduction de données utiles à tous. Et pour cela, le plus important, est incontestatblement de continuer et élargir le dialogue engagé avec les utilisateurs.


    Mise à jour le 7 juin 2012 : Open Data, un premier bilan français est le premier d’une série de quatre articles publiés par Hubert Guillaud sur Internet Actu. Nous invitons le lecteur à prendre connaissance des trois autres.

    Animer, animer et encore animer

    L’enjeu de la coproduction

    Le monde de l’entreprise face au défi de l’ouverture…

    ]]>
    http://owni.fr/2012/05/31/open-data-france-premier-bilan-francais-etalab/feed/ 9
    Des données culturelles à diffuser http://owni.fr/2012/03/28/des-donnees-culturelles-a-diffuser-opendata-bnus/ http://owni.fr/2012/03/28/des-donnees-culturelles-a-diffuser-opendata-bnus/#comments Wed, 28 Mar 2012 13:01:37 +0000 Lionel Maurel (Calimaq) http://owni.fr/?p=103776

    Les données culturelles ou celles qui concernent la recherche occupent une place particulière parmi les données publiques. Elles restent de fait encore en retrait au sein du mouvement d’Open Data qui se développe en France.

    Données particulières

    En effet, un statut juridique particulier a été fixé par la loi sur la réutilisation des informations publiques, pour les données produites par “des établissements et institutions d’enseignement ou de recherche” ou par des “établissements, organismes ou services culturels”. Ce régime particulier, dit “exception culturelle”, permet à ces établissements de fixer les conditions de la réutilisation de leurs données. Les autres administrations relèvent du régime général de cette loi, qui instaure un véritable droit à la réutilisation des informations publiques au profit des citoyens.

    Jusqu’à présent, les institutions culturelles et de recherche se sont plutôt servies de cette exception pour restreindre la réutilisation de leurs données, ce qui a pu faire dire que la culture constituait le “parent pauvre de l’Open Data en France“.

    Des tensions sont même apparues entre certains services culturels, comme des archives,  et des entreprises à qui la réutilisation des données a été refusée. Les institutions culturelles (bibliothèques, musées, archives) et les institutions de recherche sont pourtant détentrices de données de grande qualité, dont l’apport pourrait être décisif pour le mouvement de l’Open Data.

    La France entr’ouverte

    La France entr’ouverte

    L'État a lancé son site data.gouv.fr. La France, enthousiaste, ouvre donc ses données publiques comme les États-Unis. ...

    Le lancement du portail Etalab, de ce point de vue, n’a pas complètement permis de lever les obstacles à la diffusion de ces données. Le Ministère de la Culture et de la Communication, ainsi que celui de l’Enseignement Supérieur et de la Recherche participent bien à data.gouv.fr, et mettent en ligne plusieurs jeux de données.

    En effet, les ministères en eux-mêmes ne bénéficient pas de l’exception culturelle prévue dans la loi de 1978, celle-ci n’étant ouverte qu’aux profits des établissements, institutions et services relevant de leurs tutelles ou a fortiori de celles des collectivités territoriales. De ce fait, ces ministères ont dû, de la même manière que tous les autres, se plier à l’obligation, imposée par la circulaire émise le 26 mai 2011 par François Fillon, de verser leurs données dans data.gouv.fr.

    La circulaire a posé dans ce cadre un principe de réutilisation gratuite des données publiques, les administrations ne pouvant imposer de redevances que si “des circonstances particulières le justifient” et par le biais de la procédure relativement lourde d’un décret du Premier Ministre.

    Néanmoins l’exception culturelle, si elle ne joue pas au niveau des ministères, continue à protéger les établissements publics. En effet, la circulaire du 26 mai 2011 précise que :

    L’article 11 de la loi prévoit un régime dérogatoire pour les établissements et les institutions d’enseignement et de recherche ainsi que pour les établissements, organismes ou services culturels qui fixent, le cas échéant, leurs conditions de réutilisation de leurs informations publiques. Ces établissements ainsi que les collectivités territoriales et les personnes de droit public ou de droit privé chargées d’une mission de service public peuvent, s’ils le souhaitent, mettre à disposition leurs informations publiques sur le portail ‘data.gouv.fr’. Dans ce cas, une convention fixe les conditions de réutilisation de ces informations.

    La participation à Etalab reste donc facultative pour les organismes culturels ou de recherche et c’est bien ce que traduit la liste des contributeurs, puisque seule la Bibliothèque nationale de France y figure à ce jour, pour une partie de ses données. C’est pourtant au niveau des établissements eux-mêmes que les jeux de données les plus intéressants sont situés (catalogues, instruments de recherche, données bibliographiques, documents numérisées, etc).

    Licence ouverte

    Cependant, cette mise à l’écart des données culturelles et de recherche n’est pas une fatalité. Car comme j’avais déjà eu l’occasion de le dire, les établissements peuvent user des latitudes dont ils bénéficient au titre de l’exception culturelle pour poser des règles favorables à la réutilisation. Rien ne les oblige à aller dans le sens de la fermeture.

    De ce point de vue, Etalab leur offre un instrument essentiel pour mettre en place des conditions ouvertes de diffusion des données : la Licence Ouverte/Open Licence, retenue pour le portail data.gouv.fr.

    Cette licence Etalab présente l’intérêt d’être ancrée dans le droit des données publiques français, tout en étant compatible avec les principes de l’Open Data et les licences libres employées dans le cadre de ces initiatives. S’appuyant sur le droit à la réutilisation des données publiques reconnues par la loi de 1978, la licence Etalab permet la réutilisation gratuite, y compris à des fins commerciales, tout en maintenant les exigences minimales du texte et notamment la mention obligatoire de la source des données (paternité).

    Depuis l’ouverture du portail Etalab, un seul établissement culturel avait utilisé cette licence Etalab de manière volontaire pour la diffusion de ses données. Il s’agit de la BnF pour les données bibliographiques enrichies qu’elle diffuse au format RDF par le biais du site data.bnf.fr.

    Néanmoins la semaine dernière, une autre bibliothèque, la Bibliothèque Nationale et Universitaire de Strasbourg (BNUS) a annoncé qu’elle adoptait la licence Etalab pour se lancer dans une démarche globale de libération de ses données. Une interview de l’un des responsable de l’établissement, le conservateur Frédéric Blin, explique la démarche de l’établissement et les raisons l’ayant poussé à faire ce choix.

    La première originalité de la BNUS consiste à avoir choisi d’utiliser la licence Etalab aussi bien pour diffuser les métadonnées produites par l’établissement que pour les documents numérisés eux-mêmes, qu’elle produit à partir des œuvres du domaine public qu’elle conserve.


    “La décision exacte votée par notre Conseil d’administration est formulée de la manière suivante”
    :

    La décision exacte votée par notre Conseil d’administration est formulée de la manière suivante :

    • Les données bibliographiques (dont les métadonnées des documents numériques) produites par la BNU sont considérées comme des données publiques et à ce titre placées sous Licence Ouverte ou autre licence compatible (libre réutilisation, y compris à des fins commerciales, sous réserve de mentionner la source de l’information) ;
    • Les fichiers numériques issus de la numérisation par la BNU d’œuvres du domaine public conservées dans ses collections sont considérés comme des données publiques et à ce titre placés sous Licence Ouverte ou autre licence compatible.

    Par ailleurs, Frédéric Blin explique le calcul économique qui a conduit son établissement à renoncer à tarifer les réutilisations à des fins commerciales de ses données :


    Avant notre décision, nous appliquions une redevance d’usage, de l’ordre de 35€ par image [...] Cependant, les sommes récoltées par la BNU chaque année au titre de la redevance d’usage étaient minimes, de l’ordre de 3000€. Elles ne couvraient naturellement pas le temps de travail de la secrétaire chargée de gérer les factures et la correspondance avec les lecteurs, ni le temps des autres personnes – y compris de l’Administrateur – impliquées en cas de demande d’exonération ponctuelle ou systématique. En outre, nous espérons que l’abandon de la redevance d’usage entrainera une augmentation des demandes de numérisation de documents, service qui lui restera payant. Dans notre cas particulier, nous pensons qu’en autorisant la libre réutilisation, l’établissement sera au final bénéficiaire au strict plan financier.

    D’autre part, nous estimons que la libération des données favorise la créativité artistique et intellectuelle, de même que commerciale : établissement public, il est dans l’intérêt de la BNU de favoriser le dynamisme économique et commercial du pays, créateur d’emplois et générateur de rentrées fiscales. La BNU devient ainsi indirectement une source d’activité économique : le retour sur l’investissement consenti par la Nation pour le financement de la BNU trouve ici une concrétisation potentiellement mesurable.

    Cette logique, qui est complètement en phase avec la philosophie de l’Open Data, est hélas fort peu répandue dans le secteur culturel. J’avais eu l’occasion de montrer par exemple, à partir d’une analyse systématique des pratiques, qu’une part écrasante des bibliothèques françaises restreignent l’utilisation des œuvres du domaine public qu’elles numérisent, en recourant à des droits de propriété intellectuelle revendiqués dans des conditions contestables.

    La situation n’est pas différente, sinon plus fermée encore, dans les services d’archives et de musées, et le discours au niveau central reste celui d’une valorisation économique des données, assortie d’une défense de l’exception culturelle.

    Quelques établissements commencent à adopter une attitude plus ouverte, en employant notamment la Public Domain Mark, pour les documents du domaine public qu’ils diffusent.

    L’exemple de la BNUS ouvre une nouvelle piste, plus générale, par laquelle la licence Etalab permet la libre diffusion à la fois des métadonnées et des documents numérisés.

    L’enjeu de ces discussions n’est pas seulement juridique. Il est aussi celui de la participation des données produites par les institutions françaises, culturelles et de recherche, au mouvement général de l’Open Data et à la constitution du web sémantique.

    Beaucoup de temps a sans doute été perdu en France autour de débats stériles à propos de cette exception culturelle, dont l’utilité reste encore à démontrer. Pendant ce temps, au niveau européen, une nouvelle directive sur la réutilisation des informations du secteur public est en préparation.

    Dont l’un des enjeux est justement à savoir s’il faut maintenir un statut particulier pour les données de la culture et de la recherche.


    Illustration par Marion Boucharlat pour Owni /-)

    ]]>
    http://owni.fr/2012/03/28/des-donnees-culturelles-a-diffuser-opendata-bnus/feed/ 8
    La France entr’ouverte http://owni.fr/2011/12/10/la-france-entrouverte-transparence-open-gov-open-data-etalab/ http://owni.fr/2011/12/10/la-france-entrouverte-transparence-open-gov-open-data-etalab/#comments Sat, 10 Dec 2011 10:16:50 +0000 Nicolas Patte http://owni.fr/?p=89343

    Officiellement, le 5 décembre, la République a donc ouvert ses données publiques lors d’une sauterie organisée sous les lambris de la salle de la Chapelle, en l’Hôtel de Cassini à Paris. Au terme de 817 jours de développement, de 691 624 lignes de code déployées par des partenaires technologiques français le site data.gouv.fr a vu le jour en grandes pompes, mais en version beta.

    Viennoiseries

    Ce jour-là, sémillant comme à son habitude, le jeune (35 ans) directeur du projet gouvernemental Séverin Naudet fait la claque avec Prezi, le logiciel de présentation en ligne qui relègue PowerPoint au Paléolithique moyen. Rompu à l’exercice, il parvient miraculeusement à tenir en haleine le parterre de journalistes en déroulant les écrans de tableur. Aimable, cet ancien producteur des Nada Surf et pratiquant le Kung-fu sait flatter ses collaborateurs, son audience et ses soutiens anonymes, qui participèrent assidûment à “quatre workshops avec l’écosystème Open Data durant les neuf derniers mois”. Et ses sponsors aussi - nombreux - dont on entend les noms de Google et de… Microsoft sans en voir la présence sur les documents distribués avec les viennoiseries.

    Chargé de l’innovation dans l’équipe, Romain Lacombe est au cœur du projet. Co-auteur du rapport Pour une politique ambitieuse des données publiques l’été dernier, lui non plus n’est pas avare de bonnes ficelles pour faire passer cette pilule sucrée nommée “Open Data“. La démonstration (dont il avouera humblement, en privé, que l’idée est de sa pimpante collègue Valérie Schlosser) est aussi brillante que convaincante. En simulant le parcours d’un utilisateur moyen au sein de cette “place de marché globale”, l’ingénieur dévoile en quelques clics combien il est simple d’accéder aux plus basiques éléments de la statistique nationale. Dans les faits, il n’est pas certain que la manipulation sera aussi aisée que celle, balisée, préparée, qui fut offerte à la presse. Néanmoins, la salle frémit ; l’enthousiasme est là, et il est transmis sans quasiment aucun accroc.

    Data martyrisée, mais data libérée

    Reste que dans les documents de travail que nous avons pu consulter, et dont Regards Citoyens s’est également fait l’écho, l’ouverture des données concerne à ce jour, avant tout, la quantité des informations. S’agissant des formats de fichiers utilisés sur le site, l’ouverture est beaucoup moins visible.

    Car sur un peu moins de 300 000 fichiers présents dans la base, seuls 2 600 environ sont au format ouvert (CSV, TXT, SHP, XML, PDF, ODS, HTML et RDF), soit moins de 1%. Le reste, soit quasiment l’intégralité des jeux de données présents sur le site, sont téléchargeables aux formats propriétaires DOC (une trentaine) et XLS. Interrogé par nos soins dans le cadre du Personal Democracy Forum, Romain Lacombe se montre à la fois prudent et catégorique. Non, il n’existe aucune volonté de privilégier le format propriétaire de Microsoft. À ce jour, la priorité de la mission Etalab (nom de l’équipe chargée de ce chantier) est de mettre à disposition l’ensemble des données publiques disponibles, et il se trouve à ce titre que le format Excel est celui qui est le plus utilisé au sein des différentes administrations françaises, “notamment par l’Insee“.

    Rebondissant sur l’anecdote, Lacombe ajoute :

    La mission d’Etalab, c’est coordonner l’ouverture des données publiques des administrations de l’État. Promouvoir l’harmonisation et l’utilisation de formats ouverts et réutilisables en fait partie intégrante.

    En outre, le discours de la Mission est bien goupillé : primo c’est gratuit, ce qui signifie que le fonctionnement du projet ne peut inclure la reconstitution coûteuse de jeux de données inédits. On prend ce qu’on a. Deuxio, le choix des formats de fichiers par les différentes administrations est antérieur à la Mission, on ne peut pas demander à celle-ci de prendre en charge la migration d’une quantité phénoménale de data d’un format propriétaire vers l’univers du libre. Arguant qu’il faut laisser le temps au temps, l’équipe chargée de la libération des données publiques en France a donc choisi de suivre les recommandations indirectes [en] de “l’inventeur du Web”, Tim Berners-Lee : balancer les données en vrac, on verra plus tard pour le reste.

    Vers l’infini, et au-delà

    Etalab n’est donc qu’un moteur de recherche, ni plus ni moins. D’où le soin apporté à bien communiquer sur la mention BETA du site, qui sonne comme une promesse des jours meilleurs – en espérant évidemment que l’État sera plus prompt que Google, spécialiste du genre, à éliminer ce statut qui fleure bon l’inachevé. Un moteur qui recherche dans un catalogue de documents déjà présents, le plus souvent, sur les plates-formes des différents ministères. Etalab peut toujours communiquer (un peu systématiquement) sur la géolocalisation inédite des gares SNCF, la réalité est aride : soit les jeux de données disponibles existent ailleurs, soit de nombreuses données à ce jour réclamées par les chercheurs, les journalistes et les simples citoyens ne sont pas à disposition du contribuable – alors qu’elles lui appartiennent, de facto.

    Un journaliste de données : Data.gouv ? À moi, ça me sert à rien.

    Ceci étant posé, à ce stade, savoir s’il est bon ou pas de pouvoir accéder à ces nombreuses ressources dans un format ou dans un autre semble donc un peu secondaire. Pour plusieurs journalistes de données (“data-journalists“) interrogés dès le lendemain de l’ouverture d’Etalab, pour eux qui manipulent ces fichiers bruts à longueur de journées – sautant d’un tableur à un autre pour tirer la substantifique moelle de jeux de données – un fichier en format ouvert de type PDF peut s’avérer être parfois plus compliqué à exploiter s’il est mal élaboré qu’un fichier dans un format propriétaire construit avec méthode. “Les fichiers PDF, c’est sympa, mais ce sont souvent des fichiers inexploitables, conçus à partir de données ‘propres’ [qu'elles proviennent de formats ouverts ou pas, ndlr], et sur lesquels il faut passer un temps fou pour les remettre en format exploitable. C’est kafkaïen !“, argue même François Bancilhon, le directeur général de Data Publica, dont le métier, entre autres, est justement de (re)mettre à disposition des données exploitables.

    La vraie question qui point au-delà de l’enthousiasme convenu par cette volonté du gouvernement de promouvoir une certaine transparence démocratique, c’est surtout : et après ?

    Top-down et bottom-up sont dans un bateau

    Et après, la question centrale du déploiement et de la promotion de l’Open Data, que nous posions déjà en février dernier, c’est la place du citoyen-contribuable au sein de ce dispositif complexe. Derrière les concepts de stratégie de gouvernance un peu pompeux de “top-down” et de “bottom-up” se cache l’enjeu majeur de la réalisation (ou pas) d’un projet de transparence démocratique à la française. Soit les données s’ouvrent de haut en bas, considérant le citoyen comme un consommateur passif – on ose l’euphémisme – et par conséquent bien incapable de contrôler la qualité et la pertinence de la donnée qui lui est offerte par l’État ; soit les données s’ouvrent de bas en haut, portées par la demande du citoyen envers son administration, en s’assurant que celle-ci a les moyens – et la volonté – d’y répondre. Ce qui, globalement, aujourd’hui, est loin d’être le cas.

    Face au doute, la mission Etalab sort un atout de sa manche : les DataConnexions. Le “moteur de recherche” data.gouv.fr doit évoluer, et il le fera “dès janvier” sous les auspices de l’innovation et l’autorité des têtes bien faites de partenaires déjà programmés, tels Orange, Inria, l’Afnic, l’Epita ou encore Oséo. Véritable “programme de soutien à l’innovation“, il va permettre “d’enrichir Etalab et sortir du simple moteur de recherche qu’il est actuellement“. En clôture du Personal Democracy Forum, Séverin Naudet en remettra d’ailleurs une couche, évoquant même un programme “enrichi d’espaces collaboratifs et d’échanges entre ses utilisateurs et ses producteurs“, un “espace dédié à la mise en valeur des réutilisations des données les plus innovantes“.

    Paroles, paroles

    On a forcément envie d’y croire, à cette ouverture de l’ouverture. D’autant que dans le rapport rédigé par Romain Lacombe, qui tient nécessairement une place importante dans la mise en place du portail gouvernemental – rapport déjà mentionné plus haut – figurent quelques passages qui pourraient inciter à l’optimisme. Comme OWNI le relevait en juillet dernier :

    L’État devra donc réfléchir à la possibilité de passer d’un modèle “à sens unique” (diffusion des données du secteur public vers la société civile) à un modèle d’écosystème où les données de l’État et des collectivités, ouvertes à la société civile, pourraient être enrichies en retour de façon collaborative (“crowdsourcing”).

    Collaboration certaine de centres de recherche et de l’enseignement supérieur, participation éventuelle du citoyen à la constitution de bases de données et d’applications réutilisant vertueusement ces bases de données. On n’est pas loin du but. À condition, là encore, d’aller jusqu’au bout de la démarche de transparence et de coupler ces efforts et ces ambitions d’Open Data avec celles de l’Open Gov – ou “gouvernance ouverte” – comme le rappelle régulièrement l’association LiberTIC à travers son porte-voix Claire Gallon. Une libération des données qui prépare la gouvernance ouverte : là, on en demande peut-être un peu trop à la France.

    Invitée par Barack Obama et Dilma Rousseff, la présidente du Brésil, à prendre siège autour de la table du projet Open Government Partnership (OGP), la France ne fait aujourd’hui pas partie de la cinquantaine de pays [en] s’étant engagés fermement à suivre les intentions vertueuses de cette initiative promue par l’Onu – dont le programme est pourtant alléchant : “engagement à la disponibilité accrue d’informations relatives aux activités gouvernementales”, “engagement à promouvoir la participation civique”, “engagement à faire appliquer par les administrations les normes les plus strictes d’intégrité professionnelle”, ou encore “engagement à intensifier l’accès aux nouvelles technologies à des fins de transparence et de responsabilisation”. Le reste est à l’avenant. Des pays européens comme la Grande-Bretagne, la Grèce, l’Espagne ou l’Italie, la Suède, la Norvège ou encore le Danemark ont franchi le pas vers l’avant que le couple franco-allemand aura décidé de ne pas faire.

    Transparence à la française

    Ce manque de volontarisme apparent de la France serait officiellement une question d’agenda, la demande de l’OGP ayant vraisemblablement été envoyée au cabinet de Christine Lagarde – alors à Bercy – qui n’y aurait pas répondu dans les temps. Selon une source proche du dossier, cette absence remarquée pourrait toutefois s’expliquer par d’autres raisons plus politiques. Articulé autour d’une vision anglo-saxonne de la transparence (Transparency & Accountability), le projet Open Government Partnership pourrait imposer cette vision dans laquelle la frontière entre transparence de l’État et transparence de la vie privée est si ténue qu’elle s’opposerait illico au modèle de protection des données personnelles qui fait loi dans l’Hexagone. Méfiance donc. Méfiance justifiée ? En vérité, les grands principes de l’OGP sont évidemment compatibles avec une vision cocorico de la transparence de l’État ; il semblerait que les inventeurs du clavier AZERTY aient aujourd’hui surtout besoin d’une “transparence à la française”.

    De plus, un engagement de la France dans le programme Obama nécessiterait l’existence d’un agenda politique dédié à la gouvernance ouverte. En Grande-Bretagne, il existe une équipe “Transparency” au sein du Cabinet Office, ainsi qu’un “Public Sector Transparency Board” [en] qui oriente la démarche Open Data depuis 2010, et qui compte parmi ses membres des éminences telles que Tim Berners-Lee et Nigel Shadbolt (les pères spirituels du portail data.gov.uk, en ligne depuis 2009) ou Rufus Pollock de l’Open Knowledge Foundation. En France, la nécessité de relier Open Data à Open Gov semble encore avoir un bout de chemin à faire, malgré l’énergie déployée par Séverin Naudet et son équipe à passer pour de radicaux rénovateurs de la société. Ou même mieux, si l’on en croit Franck Riester :

    L’Open Data, c’est une révolution silencieuse.

    Entre contrepoint, par précaution, on rappellera une récente intervention de David Eaves, célèbre conseiller canadien sur les questions d’ouverture des données publiques :

    Un risque majeur pour l’Open Data, c’est que tout notre travail soit réduit à n’être qu’une initiative pour la transparence et aurait par conséquent pour unique objet de mettre en conformité des structures gouvernementales. Si c’est ainsi que se joue notre destin, je suspecte que dans 5 à 10 ans les gouvernements, désireux de pratiquer des coupes budgétaires, n’inscrivent les portails Open Data dans la liste des économies à réaliser.

    Construit vingt ans avant la grande Révolution française, l’Hôtel de Cassini porte le nom d’une célèbre famille d’astronomes royalistes, savoyards puis français par naturalisation, dont le patriarche Giovanni Domenico fut notamment le premier à diriger l’observatoire de Paris. C’est lui qui découvrit la grande tache rouge de Jupiter, qui mesura la distance de la Terre au Soleil et qui mourut aveugle, après avoir passé sa vie à observer l’infini et tenté d’organiser les étoiles.


    Photos au mobile par Nicolas Patte /-)



    ]]>
    http://owni.fr/2011/12/10/la-france-entrouverte-transparence-open-gov-open-data-etalab/feed/ 17
    Une certaine idée de l’open data http://owni.fr/2011/07/29/une-certaine-idee-de-lopen-data/ http://owni.fr/2011/07/29/une-certaine-idee-de-lopen-data/#comments Fri, 29 Jul 2011 16:28:46 +0000 Marie Coussin http://owni.fr/?p=74973 L’open data est à la mode. Le conseil général de Gironde vient de lancer son site DataLocale, la Saône-et-Loire a annoncé l’ouverture d’un portail pour octobre, celui du gouvernement sortira dans quelques mois. Plusieurs villes y réfléchissent : Le Havre, Saint-Maur-des-fosses et Montpellier a sauté le pas. L’ouverture des données publiques est devenue la nouvelle mesure phare des collectivités en matière de transparence et de démocratie.

    Dans ce contexte est sorti un rapport très complet, intitulé Pour une politique ambitieuse des données publiques produit par quatre élèves de l’école des Ponts ParisTech : Romain Lacombe, François Vauglin, Pierre-Henri Bertin et Alice Vieillefosse.

    Il fait la synthèse des enjeux de l’open data et fournit une série de 16 recommandations pour la mise en oeuvre de la politique de l’État. Logique, puisque ces élèves sortent du Master Action Publique de l’école des Ponts. Le rapport a été remis le 13 juillet dernier à Éric Besson, ministre de l’Industrie, de l’Énergie et de l’Économie numérique .

    Romain Lacombe, qui travaille aujourd’hui à Etalab en tant que chargé de l’innovation et du développement, explique à OWNI la genèse et le but de ce rapport.

    “Identifier des modèles économiques”

    Comment l’idée de ce rapport est-elle née ? Est-ce une commande ?

    “Après des études scientifiques à l’école Polytechnique, j’ai intégré le corps des Ponts et suis parti terminer mes études au MIT [ndlr : Massachussets Institute of Technology, une prestigieuse université américaine] ; après mon diplôme, j’ai lancé en 2008, puis cédé début 2010, une startup d’applications mobiles géolocalisées, implantée dans la Silicon Valley.

    Du fait de ma double culture, celle du numérique et celle des politiques publiques, l’ouverture des données m’est apparue, à mon retour en France, comme un des leviers majeurs à travers lesquels l’État pouvait encourager l’innovation. Pour apporter une contribution, modeste mais je l’espère utile, au développement de l’Open Data en France, j’ai proposé à l’école des Ponts ParisTech, à la fin de l’été 2010, de réaliser une étude sur les données publiques.

    L’étude portait principalement sur l’économie des données publiques, mais nos expériences complémentaires nous ont poussé à nous intéresser à toute la largeur du spectre des enjeux qui entourent l’open data.”

    Quel en était l’objectif ?

    “L’objectif de notre étude était d’identifier des stratégies et des modèles économiques, desquels l’État puisse s’inspirer pour faciliter l’ouverture des données publiques et encourager leur réutilisation. Il s’agit donc d’une réflexion sur les leviers d’action de l’état en faveur de l’open data, et les raisons qui pourraient motiver ce choix de politique publique, concernant aussi bien ses données que celles des autres acteurs concernés, des établissements publics aux collectivités territoriales.

    À partir d’un état des lieux des expériences internationales et locales, nous avons identifié les enjeux et les acteurs de l’open data, ainsi que les principaux freins subsistant à l’ouverture et la réutilisation des données, notamment techniques, juridiques, économiques et organisationnels ; et nous avons esquissé des solutions pour les dépasser.

    Il s’agissait en particulier d’identifier des modèles économiques permettant d’assurer à la fois le soutien à l’innovation et à la réutilisation, et la sauvegarde des équilibres financiers du service public permettant la production de ces données.”

    Quel lien entre ce rapport et la politique de l’État en termes d’open data ?

    “Ce travail de prospective et nos échanges fructueux avec les différents acteurs du sujet ont abouti à la formulation de 16 propositions pour une politique ambitieuse des données publiques, présentées au Ministère de l’Enseignement supérieur et de la Recherche et au Ministère de l’Industrie, de l’Energie et de l’Economie numérique.

    Elles se déclinent en recommandations très concrètes sur des sujets comme les formats ouverts et l’interopérabilité, la gratuité de réutilisation, l’enrichissement « bottom-up » des données par la communauté, une stratégie nationale avec l’ensemble des acteurs publics, et l’émergence d’un véritable écosystème des données publiques.”

    Des ambitions…

    Les 16 propositions du rapport évoquent en effet quelques idées ambitieuses et rarement pointées, notamment :

    - la nécessité de formation et de pédagogie auprès des différents acteurs publics qui devront intégrer la production et publication de données dans leur travail : c’est la première proposition du rapport. OWNI avait déjà eu l’occasion de constater à quel point le manque de connaissances et de consignes relatives aux données publiques sont des obstacles à leur accès.

    - la question des formats est abordée à plusieurs reprises. La proposition 2 y est même entièrement consacrée :

    encourager l’utilisation de formats facilement réexploitables, qui respectent les normes d’interopérabilité et de “lisibilité machine”.

    La question est en effet cruciale : d’après les données issues de l’étude réalisée par François Bancilhon (Data publica) et Benjamin Gans (INRIA) et publiées par Proxima mobile le 26 juillet dernier, sur les 6,2 millions de fichiers de données publiques disponibles en ligne, seuls 11% le sont sous des formats exploitables.

    - faire de la gratuité la norme. Le paiement d’une redevance pour accéder à certaines séries devient une exception. Une proposition à laquelle les auteurs du rapport sont arrivés de manière empirique :

    Notre analyse économique nous mène à conclure que la gratuité la plus large, y compris pour une réutilisation des données à titre commercial, favorise l’innovation et les nouveaux usages, et contribue à financer le service public par l’impôt généré ; c’est le modèle économique optimal pour les données publiques.

    - Plusieurs propositions visent à faire émerger un écosystème des données publiques, mettant ainsi en valeur que l’open data est une politique qui doit s’inscrire dans la durée et dans les habitudes de l’administration.

    Il est ainsi préconisé que “l’ensemble des Contrats d’Objectifs et de Moyens des Etablissements publics et des Délégations de Service Public contractées avec des entreprises abordent explicitement le statut et les droits de réutilisation afférant aux données générées dans leur cadre”. Les données liées à de nouveaux contrats signés pour la délégation du service public de l’eau, des transports pourraient ainsi être rendues publiques…

    …mais une volonté de contrôle

    Comme l’essentiel des initiatives en open data, la philosophie portée par ce rapport reste celle d’une approche “top down” où le choix des données rendues publiques appartient à l’organisme qui les met en ligne. Ce qui n’est pas la seule voie : ouvrir les données publiques, c’est aussi les “rendre” aux citoyens grâce à qui elles sont produites.

    C’est ce qu’explique ici Jean-Marc Manach et c’était l’idée de la campagne du Guardian “Free our data” qui a amené le gouvernement britannique à se lancer dans l’open data.

    Dans le rapport, l’alternative inverse est même présentée comme un danger. Par exemple, le rapport évoque trois scénarios possibles d’attitude de l’État face à l’ouverture des données publiques : inertie, capture et symbiose.
    Dans la cas de l’interie (c’est-à-dire le développement de l’offre de données publiques à son rythme historique) un des inconvénients évoqués est “le risque fort de manquer les opportunités stratégiques de l’ouverture des données publiques” et par là “fragiliser les institutions productrices de données” :

    “la frustration des citoyens et consommateurs face à la difficulté d’accès à des données qui leur importent pourrait les pousser à développer leurs propres solutions ad hoc, par exemple de manière collaborative. Bien que louable si ces solutions évoluent vers une relation public-privé efficace, ce développement comporte une part de risques, notamment celui de la perte de légitimité des institutions qui historiquement ont produit des données importantes pour les citoyens. Le risque serait alors grand de voir s’effriter un tissu d’expertises utiles, et la qualité des services aux citoyens pourrait en souffrir.”

    Lâcher le monopole de production des données n’est pas pour demain.

    Ainsi, la seule fonctionnalité “bottom-up” (la demande ou l’initiative vient des citoyens) proposée dans le rapport se fait par le biais du crowdsourcing et reste relativement limitée.

    L’État devra donc réfléchir à la possibilité de passer d’un modèle “à sens unique” (diffusion des données du secteur public vers la société civile) à un modèle d’écosystème où les données de l’État et des collectivités, ouvertes à la société civile, pourraient être enrichies en retour de façon collaborative (“crowdsourcing”).

    Le rapport ne recommande pas la mise en place, sur le site d’ouverture des données, d’un formulaire permettant de demander un jeu de données spécifiques, par exemple. Dans les sites open data des gouvernements, la Suède est d’ailleurs la seule à le proposer.

    Ce rapport est une étude remise à un ministère : il ne représente pas la feuille de route d’Etalab ni même la politique globale du gouvernement français autour de l’ouverture des données publiques, même si de nombreux points sont communs (la gratuité des données par exemple).

    Son contenu est cependant assez révélateur de la philosophie qui prévaut actuellement dans les politiques et initiatives open data et qui constitue une façon bien spécifique de voir l’ouverture des données publiques. Les données publiques commencent à être libérées en France. Mais d’une certaine manière.


    Crédits photos Flickr CC by-nd loop_oh et Laurent Jégou

    ]]>
    http://owni.fr/2011/07/29/une-certaine-idee-de-lopen-data/feed/ 15
    Fillon entrouvre les données publiques http://owni.fr/2011/05/30/fillon-entrouvre-les-donnees-publiques/ http://owni.fr/2011/05/30/fillon-entrouvre-les-donnees-publiques/#comments Mon, 30 May 2011 12:00:56 +0000 Nicolas Kayser-Bril http://owni.fr/?p=64890 François Fillon a fait publier un décret et une circulaire relative à l’ouverture des données publiques le vendredi 27 mai. Le texte était attendu depuis plusieurs mois ; il devait annoncer la direction de l’action du Premier Ministre vis-à-vis de l’ouverture des données publiques.

    Que dit le décret ?

    En gros, les services du premier ministre (lire ‘Etalab’) reprennent en main les conditions de diffusion des informations publiques. Si une administration veut faire payer la réutilisation d’une série de données, elle devra d’abord la faire inscrire à un décret fixant la liste des données payantes, qui sera publiée dans les semaines qui viennent.

    C’est une bonne chose. Aujourd’hui, les ministères fixent les tarifs au petit bonheur. Au ministère de l’écologie, l’instruction d’une demande coûte 145€, comme vous pouvez le voir sur le devis ci-dessous.

    Comme le contrat ne prévoit pas de limite dans la réutilisation, j’ai évidemment mis en ligne les fichiers Excel sur NosDonnées.fr. Le but du décret est de mettre un terme à de telles pratiques et de favoriser la gratuité.

    Pour en savoir plus sur cette mesure, Numérama a fait un bon tour d’horizon, tout comme Regards Citoyens.

    Et la circulaire ?

    Fillon est plus prolixe dans sa circulaire, où il dévoile plus ses intentions.

    -          L’opendata, c’est Etalab.

    L’ouverture des données publiques a commencé en 1978 avec la création de la Commission d’Accès aux Documents Administratifs (CADA), chargée de rendre des avis lorsque les citoyens demandent des informations à l’administration.

    Depuis la refonte de la loi CADA, en 2005, à la suite de la directive européenne PSI, des correspondants locaux ont été nommés dans chaque administration. Leur rôle est de faire le lien entre les citoyens demandeurs d’information et la CADA.

    Or, la circulaire demande à chaque administration de nommer un interlocuteur unique Etalab. On rajoute donc un deuxième système à celui de la CADA. Tant pis pour la simplification de l’administration.

    Pour Etalab, les deux rôles n’ont rien à voir. Les représentants CADA ne sont là que pour régler les problèmes. Les interlocuteurs Etalab, en revanche, auront un rôle actif et prendront des initiatives pour mettre en ligne les données et aucune synergie ne peut être développée entre représentants CADA et Etalab.

    -          L’approche top-down triomphe.

    La loi CADA prévoyait que les citoyens puissent demander les informations recherchées à l’administration. Prenant le contrepied de cette approche bottom-up, Etalab consacre une approche top-down où les administrations décident de ce qu’elles diffusent – et de ce qu’elles gardent.

    La CADA n’est mentionnée qu’une fois dans la circulaire, son rôle se bornant à « veiller au respect des dispositions légales relatives à la réutilisation des informations publiques. » Ce que prévoit de toute façon la loi de 1978.

    Comme je l’expliquais en février dernier, l’approche top-down n’a aucun sens quand on parle de données publiques, dans la mesure où l’exhaustivité ne sera jamais atteinte (opendata.paris.fr ne propose encore que 36 jeux de données, par exemple, et data.gov.uk à peine 7000) et où les contribuables n’ont pas à payer pour la mise en ligne de données qui seront exploitées par des entreprises privées.

    L’espoir d’Etalab est d’arriver à lister l’intégralité des données publiques, rendant la CADA inutile.

    -          Les « circonstances particulières » du payant.

    Les données ne pourront être payantes que lorsque des circonstances particulières sont réunies. A en croire les propos tenus par Séverin Naudet aux Echos, les “grands équilibres” de certaines administrations dépendant de la vente d’information doivent être préservés de la sorte. Pourtant, pas question de se lier les mains avec une définition trop précise de ce qui restera ou deviendra payant. Même si le premier ministre (lire: Etalab) restera seul décideur, le Conseil d’orientation de l’édition publique et de l’information administrative, un groupement d’acteurs publics et privés, devra rendre un avis avant toute décision. Si les circonstances particulières restent floues, le parcours d’obstacle avant de pouvoir inscrire un jeu de données sur la liste payante sera long.

    Heureusement, les circulaires, mêmes signées par le premier ministre, n’ont pas plus de valeur qu’une note de service et ne sauraient faire force de loi. Mais les décisions de Matignon montrent que le chemin à parcourir pour ouvrir les données publiques reste long.

    Photo CC BY SA par RSLN

    ]]>
    http://owni.fr/2011/05/30/fillon-entrouvre-les-donnees-publiques/feed/ 4