Les premiers bilans de l’Open Data en France, 6 mois après le lancement du portail data.gouv.fr, oscillent entre la reconnaissance des efforts consacrés par les administrations publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les citoyens.
Mais en matière d’Open Data, la dimension juridique est également essentielle et c’est ce que vient de rappeler le Conseil national du numérique (CNNum), en publiant cette semaine un avis [pdf] qui recommande d’apporter des modifications substantielles au cadre législatif français.
Longtemps, le débat en France a tourné autour des questions de licences employées par les administrations pour libérer leurs données et de leur compatibilité, à la fois avec les principes de l’Open Data qu’avec les exigences de la loi du 17 juillet 1978. Cette question contractuelle tend aujourd’hui à passer au second plan, l’essentiel des initiatives françaises ayant choisi d’opter soit pour la Licence Ouverte d’Etalab, soit pour l’ODbL proposée par l’Open Knowledge Foundation.
Néanmoins, comme l’indique le Conseil national du numérique dans son avis, c’est sans doute au niveau législatif que les questionnements pourraient à présent glisser, et, au-delà, au niveau communautaire, puisqu’une proposition de révision de la directive sur les informations du secteur public a été avancée par la Commission européenne en décembre 2011[pdf]. Il est intéressant de confronter les recommandations du CNNum avec les orientations possibles de la future directive européenne, pour essayer de cerner les différents chemins juridiques qui s’ouvrent pour l’Open Data.
La première recommandation du CNNum consiste à imposer progressivement aux administrations l’obligation de publier d’elles-mêmes leurs données, alors que la loi de 1978 les oblige seulement à les communiquer sur demande. Il s’agirait en effet d’une avancée indiscutable, mais en la matière, il faut cependant voir que la France est en quelque sorte en avance au sein de l’Union européenne, car la loi de 1978 reconnaît un véritable droit au profit des citoyens à la réutilisation des informations publiques, dès lors que les documents qui les contiennent sont accessibles.
La directive européenne de 2003 n’allait pas si loin, dans la mesure où elle laissait la possibilité aux Etats ou aux administrations de décider quelles informations ils souhaitent rendre réutilisables ou non. Comme le dit Katleen Janssen dans une analyse d’avril 2012 [pdf], la directive “ne créait donc pas un droit plein et entier à la réutilisation” et cette limitation a pu constituer un frein important à la réutilisation des données publiques en Europe.
Pour lever cet obstacle, la Commission recommande une modification de la directive qui exigera que toutes les informations accessibles puissent être réutilisées, aussi bien à des fins non-commerciales que commerciales. Les seules restrictions qui persistent concerneront la protection des données personnelles ou des droits de propriété intellectuelle de tiers. D’une certaine façon, l’Union européenne s’aligne en la matière sur des principes que la France a déjà mis en oeuvre dans sa législation dès la transposition de 2005 et il faut reconnaître que notre droit avait déjà franchi cette étape.
En ce qui concerne la question de la gratuité, le CNNum et la Commission ont des approches un peu différentes, mais qui tendent toutes les deux à étendre le champ de la réutilisation gratuite des données.
En France, comme le rappelle le CNNum, la gratuité a été fixée comme un principe par la circulaire du 26 mai 2011 qui a créé le portail data.gouv.fr. Ce texte demande aux ministères et aux établissements publics relevant de leur tutelle de diffuser leurs données via le portail unique de l’Etat , en recourant à la Licence Ouverte qui permet la réutilisation gratuite, y compris à des fins commerciales.
Selon cette même circulaire, les administrations ne pourront plus après le 1er juillet 2012 instaurer d’elles-mêmes une redevance pour la réutilisation des données. Cela ne sera possible que par le biais d’un décret du Premier Ministre et à condition de pouvoir avancer des “éléments dûment motivés” considérés comme pertinents par le Conseil d’Orientation de l’Edition Publique et de l’Information Administrative (COEPIA). Pour renforcer encore cette dynamique de gratuité, le CNNum propose d’appliquer également cette procédure aux redevances instituées avant le 1er juillet 2012, afin de réexaminer leur bien-fondé au regard des évolutions actuelles.
La proposition de directive européenne ne va pas de son côté jusqu’à proclamer un principe de gratuité en matière de réutilisation des informations publiques. Elle laisse, comme c’est le cas actuellement, la faculté aux administrations de décider d’instaurer des redevances, mais elle introduit des principes plus stricts que jusqu’alors en matière de calcul des tarifs. En principe, les redevances ne devront pas excéder “le coût marginal de reproduction et de diffusion“, ce qui empêchera aux administrations de rechercher à dégager des bénéfices importants et peut les inciter fortement à autoriser la réutilisation gratuite des données.
Comme le relève le CNNum, ces préconisations sont plus restrictives que l’actuelle loi française qui permet aux administrations de tenir compte des coûts de collecte et de production, mais aussi d’inclure dans la redevance “une rémunération raisonnable de ses investissements“.
En ce qui concerne la question des licences, la proposition de directive européenne contient une consécration de cette démarche contractuelle inspirée des licences libres, alors que certains avaient pu douter un temps qu’elle soit vraiment compatible avec le régime légal de la réutilisation des données.
La Commission indique que “les organismes du secteur public peuvent autoriser la réutilisation sans conditions ou poser des conditions, telle qu’une indication de la source, le cas échéant par le biais d’une licence”. Cette modification ouvre la voie à l’adoption de licences très ouvertes, telle la Creative Commons Zéro (CC0) et conforte la licence ouverte créée par Etalab.
En ce qui concerne les formats en revanche, on peut regretter un manque de volontarisme aussi bien du côté de la directive que du CNNum. La proposition de révision de la directive impose l’obligation de diffuser les données dans des formats “lisibles par des machines”, mais elle n’indique pas que ces formats doivent être libres et non propriétaires. Pareillement, le CNNum propose que soit mis en place un Référentiel Général de Réutilisabilité des données publiques, qui comportera des indications concernant les formats, mais ne donne pas de recommandation forte en faveur des formats ouverts.
En revanche, le CNNum fait preuve d’audace en s’attaquant à une des limitations les plus importantes au développement de l’Open Data en France. Il préconise en effet que le droit à la réutilisation des données publiques soit étendu à celles produites par des SPIC (Services Publics à caractère Industriel et Commercial), alors que la loi du 17 juillet 1978 considère pour l’instant qu’il ne s’agit pas d’informations publiques.
Or de nombreux EPIC (Établissements Publics à caractère Industriel et Commercial) disposent de données particulièrement intéressantes pour l’Open Data, comme c’est le cas de la SNCF, du CNES, de l’ONF, de l’IGN, de l’IFREMER et d’autres encore. La restriction de la loi de 1978 n’a certes pas empêché un établissement comme la SNCF de se lancer dans une démarche d’Open Data, mais elle l’a fait sur une base purement volontaire (et avec certaines frictions du côté des licences).
Le régime particulier des EPIC a pu conduire aussi à des #EPICFAILS (;-), comme ce fut le cas en 2011 avec l’épisode rocambolesque du conflit entre la RATP et CheckMyMetro. On peut du coup se réjouir de la proposition faite par le CNNum, tout en restant conscient que la question de la tarification des réutilisations pourra néanmoins continuer à se poser.
C’est également une des prises de positions du CNNum les plus fortes que celles qu’il avance à propos des données culturelles. A l’heure actuelle, les données culturelles relèvent elles aussi d’un régime dérogatoire, dénommé “exception culturelle”, qui découle de la directive européenne. J’ai déjà eu l’occasion sur Owni de montrer que ce régime d’exception soulève de réelles difficultés et qu’il provoque une marginalisation des données culturelles au sein du mouvement d’Open Data en France.
Le CNNum partage cette analyse et déplore la sous-exploitation des données culturelles, qui sont pourtant par leur richesse particulièrement propices à la réutilisation. Considérant que leur nature ne justifie pas qu’elles soient traitées à part, il recommande que l’exception culturelle soit purement et simplement levée et que les données culturelles réintègrent le régime général de la loi de 1978.
Mieux encore, le CNNum condamne une des dérives les plus criantes de l’emploi du droit des données publiques en France. En effet, certains établissements culturels utilisent ce droit pour empêcher la réutilisation à des fins commerciales des oeuvres du domaine public qu’ils numérisent, à moins de payer une redevance. D’autres utilisent le droit de la propriété intellectuelle pour “reprivatiser” le domaine public en s’arrogeant un droit sur les images scannées. Le CNNum déplore ces pratiques et c’est sans doute la première fois en France qu’une position officielle s’élève aussi nettement en faveur de la défense du domaine public.
Mais hélas, en matière de données culturelles, la proposition de révision de la directive européenne s’avère plus décevante et elle pourrait même conduire à une régression en France. En effet, en apparence, la nouvelle directive propose également de considérer les données des bibliothèques, des musées et des archives comme des informations réutilisables, ce qui supprime la fameuse exception culturelle. Mais plus loin, et de manière assez contradictoire, le texte réintroduit des règles spécifiques en ce qui concerne les données produites par ces établissements, et elles ne vont pas dans le sens de l’ouverture.
Par exemple, pour les informations sur lesquelles les bibliothèques, musées et archives détiennent eux-mêmes des droits de propriété intellectuelle, ces établissements pourraient toujours continuer à décider de permettre ou non a priori la réutilisation des données. De telles dispositions appliquées en France constitueraient une régression, car la jurisprudence administrative a déjà décidé que l’exception culturelle ne permettait pas, par exemple, à un service d’archives de s’opposer à la réutilisation de données numérisées par une entreprise.
Par ailleurs, la proposition de directive indique que par dérogation avec les principes généraux qu’elle énonce, les établissements culturels pourraient continuer à fixer des tarifs de réutilisation des données supérieur “aux coûts marginaux de reproduction et de diffusion” qu’elle fixe comme limite aux autres administrations. Il n’y a pas pire signal à envoyer aux établissements culturels, qui cèderont sans doute à la tentation de monétiser leurs données, ce qui continuera à les couper de l’Open Data. La CADA avait pourtant déjà interdit aux services d’archives de fixer des tarifs trop élevés et là aussi, la nouvelle directive constituerait une forme de régression.
On peut franchement déplorer le manque de cohérence de la proposition de révision de la directive en matière de données culturelles et espérer que ces aspects soient modifiés avant son adoption.
Il y a une question relative à l’Open Data qui n’est abordée ni par le CNNum, ni par la proposition de révision de la directive et qui me paraît pourtant correspondre à un véritable enjeu.
Le cadre juridique n’envisage pour l’instant, ni au niveau européen, ni au niveau national, la possibilité d’appliquer une clause de partage à l’identique (Share Alike) en cas de réutilisation de données publiques, à l’image de ce qui caractérise le Copyleft dans le domaine du logiciel libre. Une clause de ce type impose à celui qui réutilise des éléments de placer ses propres enrichissements sous la même licence, afin de conserver le caractère ouvert et réutilisable prévu par la licence initiale. Appliquée aux données publiques, une telle démarche signifie qu’en cas de réutilisation, une firme serait par exemple obligée de placer les bases qu’elles auraient constituées sous une licence ouverte et de permettre elle aussi la réutilisation des données en les reversant à une sorte de “pot commun” où d’autres pourraient venir puiser.
Certaines administrations françaises, au niveau local, ont déjà opté pour cette logique du partage à l’identique, en choisissant de placer leurs données sous la licence ODbL, qui comporte une telle clause virale. Mais au niveau des administrations centrales, cette démarche est pour l’instant impossible, car la Licence Ouverte de data.gouv.fr n’impose pas le Share Alike, mais seulement la mention de la source.
Certains estiment que le partage à l’identique serait nécessaire pour constituer les données publiques en biens communs et empêcher qu’elles soient réappropriées de manière définitive par des acteurs privés. On évoluerait ainsi vers une approche moins “libérale” de l’Open Data et des rapports économiques plus équilibrés entre le public et le privé. Force est de constater que cette dimension ne figure ni dans les recommandations du CNNum, ni dans la proposition de directive, mais la situation pourrait être modifiée si le partage à l’identique était au moins proposé commune option dans la Licence Ouverte de data.gouv.fr.
Au niveau européen, on peut même se demander si l’ajout d’un Share Alike par le biais d’une licence est bien compatible avec les orientations de la nouvelle directive, dans la mesure où celle-ci indique que conditions posées par les licences ne doivent pas “limiter indument les possibilités de réutilisation“.
Dans une chronique précédente, j’avais évoqué les recommandations du réseau européen Communia, qui préconisait de faire de l’Open Data un principe général applicable par défaut au données publiques. Pour ce faire, Communia recommandait :
1) de recourir à des licences les plus ouvertes possibles, afin de rapprocher au maximum le régime juridique des données publiques du domaine public ;
2) de rendre obligatoire la diffusion des données dans des formats ouverts, lisibles par des machines ;
3) d’affirmer un principe de gratuité en matière de réutilisation des données publiques.
Les recommandations du CNNum et la proposition de révision de directive contiennent des orientations fortes en ce sens, mais ils ne vont ni l’un, ni l’autre jusqu’à consacrer l’Open Data comme un principe général. Cela signifie que l’Open Data restera encore dans les années à venir avant tout une question de volonté politique et non la simple conséquence d’une obligation juridique.
Le choix d’une licence de réutilisation à apposer aux données ouvertes est l’un des premiers choix politiques d’un programme d’ouverture de données publiques. Il s’agit de conditionner les droits et devoirs associés à la mise à disposition et à la réutilisation des données.
Tandis que certains pays légifèrent pour créer une licence unique de réutilisation, l’entrée tardive de l’État français dans le mouvement open data a obligé les collectivités ouvertes à improviser sur le sujet.
Si ces dernières communiquent entre elles sur les retours d’expérience et la mutualisation de procédures d’ouverture, l’absence d’une licence juridique de référence leur impose de répéter individuellement un travail juridique complexe et chronophage. Travail qui consiste à effectuer un comparatif des licences possibles avant de faire un choix basé sur le projet et contexte politique local.
Le manque de standard a donc généré l’utilisation et la création de licences diverses, pénalisant la lisibilité d’usage et l’interopérabilité des données. Ainsi Montpellier et Bordeaux ont opté pour les CGR de l’APIE , Rennes en a fait une adaptation, Paris et le conseil général de la Gironde ont choisi l’ODbL .
Pourquoi n’y a-t-il pas de consensus en matière de licence ?
Extrait du volet juridique du Guide pratique de l’ouverture des données publiques territoriales (FING)
En France, la loi encadre la réutilisation des données publiques en précisant les droits et obligations des acteurs publics comme des réutilisateurs. Ainsi, la loi CADA de 1978 exige, sauf consentement explicite, que les réutilisateurs :
En cas de mise à disposition de données sans notification de licence, c’est cette loi et ces devoirs qui s’imposent par défaut.
L’Agence du Patrimoine Immatériel de l’État a été chargée de rédiger des licences de réutilisation pour les données publiques. Partant du principe que si les collectivités ne souhaitaient pas tarifer les données, les droits et devoirs liés à la loi CADA se substituaient à une licence, l’agence n’avait tout d’abord développé que des licences payantes.
Cependant, lorsque Rennes décida en 2010 d’ouvrir ses données pour des réutilisations gratuites, la ville souhaita y associer une licence. Ce n’est pas une obligation légale mais cela rassure les juristes et facilite la compréhension d’usage pour les réutilisateurs. C’est donc suite à ces échanges avec Rennes que l’APIE finit par rédiger une licence de réutilisation gratuite (les Conditions Générales de Réutilisation de l’APIE) qui est en fait une retranscription des conditions légales définies dans la loi CADA (impératifs de source, date, intégrité).
Bordeaux et Montpellier utilisent la licence CGR pour la mise à disposition de leurs données mais le positionnement initial de l’APIE sur leur tarification a nui à l’image de l’agence et de ses licences auprès de la communauté du libre.
Un flou juridique semble planer sur les CGR de l’APIE qui ne seraient pas compatibles sur les projets libres de type OpenStreetMap dont on sait le potentiel de valorisation de données.
À la question de savoir si l’usage d’une licence du type APIE permettrait ensuite la réutilisation des données au sein du projet Open Street Map (sous ODbL), la réponse risquerait d’être négative :
1) si la licence de l’APIE contenait des obligations à la charge de l’utilisateur différentes de celles contenues dans la licence ODbL ou
2) si les bases de données ouvertes étaient originales (donc objet de droit d’auteur) ou conséquentes à un investissement (donc objet du droit sui generis des bases de données), car l’ajout de la licence ODbL à ces bases nécessiterait qu’il y ait en amont une cession de droits adaptée.
Elles ont cependant pour inconvénients d’être franco-françaises (et donc incompatibles à l’international) et inspirées des modèles de contrats administratifs qui sont peu adaptés à des utilisateurs standards (notamment du fait du renvoi à d’autres textes). Au surplus, elles présentent pour défauts rédhibitoires (sources d’insécurité juridique) :
1) d’être principalement axées sur la diffusion des données et non sur l’échange et la construction de services qu’une diffusion libre pourrait offrir, et
2) surtout d’être uniquement construites sur la base de la Loi du 17 juillet 1978 et de ne pas du tout prendre en compte les différents droits de propriété intellectuelle que la collectivité ou l’administration pourraient détenir sur ces bases.
VeniVidiLibri : Les enjeux relatifs au choix de la licence
MAJ : la v2 de la licence vient de sortir, à laquelle RegardsCitoyens a répondu.
Alors que Rennes utilisait initialement les CGR pour la mise à disposition de ses données, la ville a ensuite développé une licence « Rennes Métropole en Accès Libre » afin de répondre aux attentes des libristes qui estimaient que les CGR de l’APIE n’étaient pas compatibles avec les projets libres (Wikipedia, OpenStreetMap, etc.) notamment du fait de la mention « non altération des données » qui semble très floue. Une simple traduction d’une base de données en anglais pourrait être considérée comme une altération ?
D’où la rédaction de la licence Accès Libre qui comprend les mentions suivantes:
Les droits octroyés concernent :
La licence rennaise est donc une adaptation des CGR de l’APIE auxquelles ont été ajoutées des mentions sur les droits associés afin de la rendre compatible avec les projets libres. Si l’on peut regretter que cette licence ne soit pas non plus reconnue à l’international, limitant la compilation avec des données étrangères, des doutes semblent encore subsister sur la compatibilité avec les projets libres.
Tout en respectant les droits et devoirs du cadre légal, les producteurs de données peuvent en effet orienter des choix plus précis (conditions en matière d’intégrité des données, d’identification de la source, etc.) et intégrer des variantes.
Ainsi à Paris, c’est la licence libre ODbL, développée initialement par Opendatacommons et traduite en français par VeniVidiLibri, qui est associée aux jeux de données. Elle ne se soustrait pas au droit français (droits et devoirs de la loi CADA repris dans les CGR de l’APIE) mais y ajoute au contraire des éléments.
L’ODbL met en œuvre la notion de copyleft. Le copyleft comme le copyright définissent et encadrent les droits des utilisateurs de façon contraignante. Le mécanisme est identique, mais les objectifs différents : le copyright garantit exclusivement les droits de l’auteur, le copyleft s’attarde tout particulièrement aux droits des utilisateurs, et vise à préserver la liberté d’utiliser, d’étudier, de modifier et de diffuser des bases de données et leurs versions dérivées.
L’ODbL impose que toute base de données dérivée soit maintenue sous la même licence, c’est-à-dire libre : accessible, modifiable et réutilisable par tous.
La licence OdbL crée donc un pot commun dans lequel s’ajoutent les contributions réalisées sur les bases de données libérées et participe à l’enrichissement collectif du travail plutôt qu’à l’appropriation individuelle. Une solution qui impose ce qui est au cœur de la démarche des logiciels libres : le partage à l’identique, c’est-à-dire le fait d’ouvrir à nouveau, et à tous, ce qui a été produit en reversant cette valeur ajoutée dans le pot commun.
En utilisant cette licence libre, les détenteurs de données imposent un devoir de contribution collective aux réutilisateurs. L’usage des données publiques est alors orienté non seulement vers l’innovation mais vers l’innovation sociale et la production de biens communs.
RegardsCitoyens explique :
Lorsque des administrations optent pour des licences interdisant les usages commerciaux, elles font le choix de se couper des projets emblématiques libres (Wikipedia, OpenStreetMap). Elles ne se donnent pas la chance de profiter de la visibilité offertes par ces sites (150 millions de visiteurs uniques pour Wikipédia). C’est d’autant plus dommageable que le travail effectué par ces communautés pourrait constituer un atout majeur pour les données publiques.
En rendant accessible les données cartographiques à tous et sans discrimination, OpenStreetMap propose une alternative plus que crédible face aux services de cartographies publiques. Faire le choix d’être incompatible avec leurs licences pourrait être interprété plus que négativement par ces communautés. Ainsi, alors que l’Open Data vise à rapprocher les citoyens de leurs administrations, le choix d’une clause restrictive aurait plutôt tendance à les éloigner.
Sans licences libres pour les données publiques, des projets tels qu’OpenStreetMap, dont l’utilité sociale est reconnue par les Nations Unies [en] et dont la qualité et les données sont souvent plus riches que Google Maps, se verraient donc mis à l’écart par l’open data.
Pour soutenir l’usage des licences libres associées aux données publiques, Creative Commons, OKF, RegardsCitoyens et VVL ont publié un appel aux données libres dans lequel ils indiquent :
Toute licence introduisant des limitations ou des discriminations à l’accès aux données ou des restrictions sur leur reproduction ou redistribution à des fins commerciales ne doit pas être considérée comme une licence Open Data, et cela en conformité avec ce qui a été préalablement établi par OpenDefinition.org. Actuellement, en France, seules certaines licences utilisées par les administrations publiques satisfont ces critères et nous recommandons donc le choix de ces licences libres.
Vous pouvez soutenir les licences open data libres en signant cette pétition.
Les licences franco-françaises s’additionnent donc tandis que la communauté de réutilisateurs ne reconnaît pas leur potentiel de libération des données. N’étant pas juriste, on se gardera bien de statuer sur la validité ou non de ces licences, ce qui est sûr en revanche c’est que leur dénombrement et leur non-reconnaissance est un frein en soi à la valorisation des données.
Un cadre juridique n’est pas seulement là pour protéger mais aussi pour faciliter la rencontre entre le détenteur des données et ses réutilisateurs. Ainsi, un cadre trop restrictif peut conduire à une valorisation des données médiocre voire, nulle. Un cadre trop imprécis peut créer de l’incertitude. Un cadre très précis mais incompréhensible par des non- spécialistes chassera les petits acteurs, souvent les plus innovants…
On le voit, le choix d’un cadre juridique a donc un impact réel sur le succès des usages de données publiques.
La ville et la communauté urbaine de Nantes terminent actuellement leur travail de comparaison des licences juridiques applicables pour la mise à disposition des données nantaises.
Dans la continuité de l’ouverture participative de la ville avec les acteurs, nous avons eu une réunion sur le volet licence, durant laquelle nous avons rappelé notre « idéal de licence » :
Nous avons également précisé que la licence choisie serait très probablement temporaire car les collectivités ont tout à gagner (et attendent même) la création d’un standard sur les licences.
Le choix nantais sera rendu public dans quelques jours, peut-être à l’OpenDataQuiou où vous êtes invités à nous rejoindre si vous passez sur Nantes. (MAJ : Nantes a choisi la licence ODbL.)
L‘idée d’une licence européenne semble faire son chemin mais la mission Etalab, chargée de la création du portail unique interministériel des données publiques, travaille actuellement avec l’APIE sur la création d’une nouvelle licence pour le futur portail national data.gouv.fr
Celle-ci pourrait devenir le standard attendu en France pour peu qu’elle réponde aux attentes de gratuité, lisibilité, compatibilité projets libres et cadre international.
Réponse en septembre.
<hr />
Billet initialement publié sur LiberTIC
]]>