Actions sur le document

L’ouverture des données de recherche : un retour aux sources de l’Ethos de la Science ?

– S.I.Lex – - calimaq, 5/06/2019

Le 4 avril dernier, l’OFIS (Office Français de l’Intégrité Scientifique) a organisé un colloque autour du thème « Intégrité scientifique et Science Ouverte ». Cet angle d’attaque était particulièrement intéressant, car il permettait de balayer les enjeux éthiques et déontologiques qui sont liés à la question de la Science Ouverte. Les enregistrements de l’intégralité des interventions et … Lire la suite L’ouverture des données de recherche : un retour aux sources de l’Ethos de la Science ?

Lire l'article...

Le 4 avril dernier, l’OFIS (Office Français de l’Intégrité Scientifique) a organisé un colloque autour du thème « Intégrité scientifique et Science Ouverte ». Cet angle d’attaque était particulièrement intéressant, car il permettait de balayer les enjeux éthiques et déontologiques qui sont liés à la question de la Science Ouverte.

Les enregistrements de l’intégralité des interventions et tables rondes ont été mises en ligne la semaine dernière (voir ici). J’ai eu la chance d’être invité lors de cette journée à intervenir dans la session consacrée à la question de l’ouverture des données de la recherche (voir la vidéo ci-dessous à partir de 30 minutes).

On m’avait demandé de revenir sur le cadre juridique applicable aux données de la recherche, mais afin pour rester dans la thématique de ce colloque, je me suis efforcé de le faire en croisant ces questions avec celle de la déontologie et de l’éthique des activités de recherche. Pour servir de fil conducteur, je me suis appuyé sur un article fameux de sociologie des sciences écrit par Robert K. Merton en 1942 (La Structure Normative de la Science).

Mon propos a consisté à montrer que l’ouverture des données de la recherche, notamment telle qu’elle est promue par le Plan National pour la Science Ouverte adopté l’an dernier, constitue un retour aux sources de ce que Merton appelait « l’Ethos de la Science« , à savoir les valeurs et les normes morales encadrant l’activité des membres de la communauté scientifique.

J’ajoute ci-dessous une retranscription de l’intervention.

***

Nous avons beaucoup parlé depuis le début de la journée des règles éthiques ou déontologiques qui encadrent de plus en plus l’activité scientifique, au point que parfois certains s’inquiètent de cette accumulation de soft law. De mon côté, je vais plutôt parler de hard law, c’est-à-dire de règles juridiques au sens strict du terme, car depuis l’adoption de la Loi pour une République Numérique en 2016, il existe une règlementation applicable à l’ouverture des données de recherche.

Les questions déontologiques ou éthiques ne sont pas pour autant écartées, notamment parce que les chercheurs se trouvent parfois confrontés à propos des données qu’ils produisent à des conflits de valeurs, autrement dit à la nécessité de concilier des impératifs contradictoires. Or c’est aussi un des rôles de la loi d’arbitrer et d’articuler entre elles des obligations et c’est ce que la loi République numérique fait à propos des données de recherche.

Pour tirer ce fil, je vais m’appuyer sur un article célèbre de sociologie des sciences publié en 1942 par le chercheur américain Robert K. Merton intitulé The Normative Structure of Sciences (La Structure Normative des Sciences). Il y décrit la science comme une institution sociale, reposant sur un certain nombre de valeurs se traduisant par des règles de comportement que doivent adopter les individus (les chercheurs) qui produisent les connaissances scientifiques.

Merton distingue deux types de normes régissant les comportements scientifiques : les normes méthodologiques et les normes éthiques qui forment ce qu’il appelle l’Ethos de la Science. Ces dernières sont au nombre de quatre : l’universalisme, le communalisme, le désintéressement et le scepticisme organisé.

Pour Merton, la Science constitue une institution parce que l’observation de ces règles ne dépend pas uniquement de la bonne volonté des individus, mais aussi de mécanismes institutionnalisés et qui peuvent l’être à différents degrés. Certains mécanismes de comportements relèvent des usages établis, des bonnes pratiques, des coutumes ou des traditions adoptées par les communautés scientifiques. Mais il existe aussi des degrés supérieurs d’institutionnalisation pouvant résulter de politiques d’établissement (voir par exemple la politique d’Open Data de l’INRA) ou de politiques publiques nationales (le Plan National pour la Science Ouverte).

Le degré le plus fort d’institutionnalisation est celui de l’obligation légale. En France, c’est ce qu’a réalisé la Loi pour une République numérique en 2016 qui a modifié en profondeur le statut des données de la recherche. Le législateur a en effet choisi de les assimiler à des données publiques et de les soumettre à un principe d’ouverture (ou d’Open Data) par défaut, au même titre que les informations produites par les autres administrations.

Il est intéressant de relire l’article fondateur de Robert Merton sous l’angle de l’ouverture des données de recherche et des nouvelles règles posées par la loi et par le Plan National pour la Science Ouverte. On constate en effet que les grands principes de la Science Ouverte offrent l’opportunité d’un retour aux sources même de l’Ethos de la Science, comme on va le voir en passant en revue les quatre grandes valeurs mises en évidence par Merton.

Universalisme

L’universalisme désigne pour Merton le fait que l’acceptation ou le rejet d’une proposition scientifique ne doit pas dépendre du statut social des personnes qui les produisent, mais s’opérer en fonction de critères objectifs admis par la communauté scientifique. Pour ce qui est des publications de recherche, c’est en principe le processus de peer reviewing (évaluation par les pairs), qui garantit le respect de cette norme d’universalité, notamment l’usage voulant que les membres des comités de lecture des revues demeurent anonymes.

En matière de données de recherche, cette valeur est plus compliquée à mettre en oeuvre et elle se manifeste autrement que pour les publications. « L’universalisme des données de recherche » implique qu’ une fois diffusées, celles-ci conservent leur sens, ce qui nécessite que les données soient systématiquement structurées et documentées de manière à pouvoir être comprises et traitées indépendamment de leur contexte particulier de production. Une telle préoccupation passe notamment par l’application de formats et de standards garantissant l’interopérabilité des données de recherche.

Cet impératif d’interopérabilité se traduit aussi dans le droit, car la Loi pour une République numérique impose que les données publiques soient diffusées a minima dans des « formats ouverts lisibles par des machines ». En ce qui concerne la recherche, il est cependant nécessaire d’aller plus loin et c’est la raison pour laquelle cette question de l’interopérabilité est au cœur des principes F.A.I.R. développés par la Commission européenne dans le cadre des programmes H2020 ou des travaux de la RDA (Research Data Alliance).

Communalisme

Le « communalisme » renvoie à la question de la propriété sur les résultats de la recherche. Merton explique que, même si ce sont des individus qui la font progresser, la recherche constitue toujours fondamentalement un processus collectif et cumulatif. Il en résulte que les connaissances scientifiques doivent être constituées en un « bien commun » pour que les revendications de propriété n’entravent la diffusion et la réutilisation des résultats de la recherche.

La Loi pour une République numérique va exactement dans ce sens. Le texte a en effet pour conséquence de « neutraliser » le droit de producteur de bases de données qui pouvait auparavant s’appliquer aux données de recherche. Il énonce par ailleurs une obligation de diffusion des données sur Internet assortie d’un principe de libre réutilisation, y compris à des fins commerciales.

La propriété n’est donc plus un paradigme approprié pour appréhender les données de recherche et c’est peut-être paradoxalement ce qui va permettre d’éviter la « tragédie » qui s’est produite pour les publications scientifiques. En matière de publications scientifiques, la propriété reconnue individuellement aux chercheurs a en effet été « capturée », via les cessions de droit d’auteur, par de grands groupes éditoriaux qui ont ainsi réussi à privatiser cette ressource.

Pour les données de recherche, nous avons désormais la chance d’avoir dans la loi République numérique une protection résultant de l’article 30 qui nous dit que, lorsque des données de recherche sont publiées, leur réutilisation est libre et toute restriction qui serait imposée par des éditeurs scientifiques doit être considérées comme nulles et non avenues. Quels que soient les documents que signent les chercheurs qui sous-entendraient qu’ils ont une propriété sur leurs données et que cette propriété pourrait être transférée à des intermédiaires, la loi joue un rôle protecteur en invalidant automatiquement ces cessions de droits.

La contrepartie de cette protection, c’est que la Loi République numérique assimile les données de recherche à des données publiques. Il est cependant incorrect de dire que les données de recherche seraient « la propriété des établissements scientifiques ». Il serait plus approprié de dire que les données de recherche sont des informations publiques, ce qui les fait passer sous un régime de libre utilisation. Comme toutes les données produites par des administrations en France, les données de recherche sont désormais incluses « par défaut » dans le principe d’ouverture ou d’Open Data. Cela signifie qu’en principe, les données de recherche doivent être publiées sur Internet et rendues librement réutilisables.

Néanmoins – et cela va nous ramener à la question des conflits de valeurs que j’évoquais en introduction – ce principe général d’ouverture est assorti de plusieurs exceptions. L’ouverture n’est en effet qu’une des valeurs à poursuivre et il peut exister d’autres valeurs justifiant que l’on déroge à la règle d’ouverture. Parmi ces exceptions, on trouve par exemple la protection des données personnelles et de la vie privée qui peut impliquer que des données de recherche ne soient pas diffusées ; la nécessité de protéger des droits de propriété intellectuelle appartenant à des tiers (comme ce sera le cas par exemple pour des corpus de textes ou d’images encore soumis au droit d’auteur) ou le respect de secrets (secrets administratifs, secret industriel et commercial).

La loi a donc fixé une liste d’exceptions pour articuler d’autres valeurs à celle de l’ouverture et c’est aussi ce que dit la Commission européenne par le biais de cette phrase qui résume la philosophie des principes F.A.I.R. : « Les données de recherche doivent être aussi ouvertes que possibles et aussi fermées que nécessaires« . Le loi République numérique fonctionne sur une logique similaire, puisqu’elle implique que les chercheurs aillent aussi loin que possible dans l’ouverture des données jusqu’à ce qu’ils rencontrent une exception qui justifie la fermeture.

Les règles sont donc claires, mais c’est leur application concrète qui risque d’être délicate. Car tout l’art va à présent consister à savoir déterminer quand le principe d’ouverture s’applique et quand on doit au contraire l’écarter en présence d’une exception. L’ouverture des données de recherche n’est donc pas un processus binaire (0 ou 1). Il y aura « Cinquante nuances » d’ouverture des données en fonction des situations concrètes et de leur infini variété.

Désintéressement

Pour Merton, le désintéressement résulte du fait que les chercheurs ne sont traditionnellement pas directement intéressés au produit de leur activité. C’est ce qui fait que les chercheurs ne sont pas rémunérés lorsque les résultats de leur recherche paraissent dans des revues. Pour subvenir à leurs besoins, l’État accorde aux chercheurs un statut d’agent public avec une rémunération associée sous la forme d’un traitement.

Pour les données de recherche, cette valeur se traduit par un principe de gratuité établi par la loi, qui interdit en principe aux administrations de fixer des redevances de réutilisation (hormis des exceptions strictement encadrées par décret). On ne peut donc plus faire payer la réutilisation de données publiques, y compris pour des usages commerciaux.

Ce principe de gratuité, qui aboutit à une « démarchandisation » des données, ne s’oppose pourtant pas en tant que tel à la valorisation des données de recherche, y compris sur le plan économique. La politique de Science Ouverte n’interfère pas en effet avec le dépôt de brevets, puisqu’il est possible de ne pas diffuser des données le temps qu’une demande de brevet soit acceptée. Par ailleurs, si le principe de gratuité interdit de « vendre » des données, il n’est pas incompatible avec la commercialisation de services à valeur ajoutée autour des données ouvertes (situation qui existe depuis longtemps déjà dans le secteur du logiciel libre).

Il s’agit donc désormais d’articuler ensemble la Science Ouverte et la valorisation des résultats de la recherche, bien plus que d’opposer ces deux activités comme incompatibles.

Scepticisme organisé

Ce dernier principe veut que les résultats de la recherche soient constamment soumis à un examen critique par les autres membres de la communauté scientifique et qu’ils puissent être remis en cause en vertu d’un « doute méthodologique » exercé collectivement.

Sans ouverture des données de recherche, on peut dire que cette vertu de scepticisme était vouée à rester un vœu pieu. En effet, sans accès aux données qui sous-tendent les résultats présentés dans les publications scientifiques, il est le plus souvent impossible au processus d’évaluation par les pairs de jouer véritablement. Le « scepticisme » dont parlait Merton ne peut donc être dit « organisé » tant que les données de recherche ne sont pas effectivement ouvertes et diffusées.

L’obligation légale d’ouverture des données de recherche est donc la condition de possibilité du scepticisme organisé. Pour arriver à ce résultat, le Plan National sur la Science Ouverte pointe l’importance de travailler en priorité à l’ouverture des données associées aux publications scientifiques et c’est un objectif qui va nécessiter de mettre en place des infrastructures appropriées, pour pouvoir accéder aux données sous-jacentes aux publications et, inversement, remonter des données aux publications qui les citent.

***

Universalisme, communalisme, désintéressement et scepticisme organisé : la Science Ouverte – et en particulier l’ouverture des données de recherche – joue dans le sens des quatre valeurs fondamentales de l’Ethos de la Science mises en évidence par Robert Merton, il y a plus de 70 ans.


Retrouvez l'article original ici...

Vous pouvez aussi voir...