La diffusion des thèses électroniques à l'heure de la Science Ouverte
– S.I.Lex – - calimaq, 11/01/2020
L’an dernier, j’ai eu l’occasion de participer comme membre du Jury au premier prix Open Thèse, créé par l’association Open Law, qui avait pour but de récompenser des thèses en droit diffusées en Libre Accès par leurs auteurs. La remise des prix a eu lieu en décembre dernier et trois lauréats ont vu couronnés leurs efforts pour faire progresser la Science Ouverte.
Les sciences juridiques ne constituent pas une discipline réputée particulièrement favorable au Libre Accès et l’initiative de ce prix Open Thèse constitue donc un moyen intéressant de changer progressivement le regard porté sur la diffusion en ligne des résultats de recherche. Il s’adresse en outre aux chercheurs en début de carrière, c’est-à-dire à ceux qui sont les plus à même de faire évoluer les pratiques dans l’avenir. Une telle démarche gagnerait sans doute à être répliquée dans d’autres disciplines, notamment celles où la Science Ouverte progresse le plus lentement.
73% de thèses en Libre Accès
La question pourrait d’ailleurs se poser de savoir où en sont les pratiques des doctorants concernant la diffusion de leur thèse. Il faut savoir qu’un arrêté du 25 mai 2016 réserve aux doctorants la faculté de décider s’ils souhaitent publier leur thèse en accès libre sur Internet ou la laisser en accès restreint. L’ABES (Agence Bibliographique de l’Enseignement Supérieur) a publié en février 2019 les résultats d’une enquête – à côté de laquelle j’étais passé – contenant des informations très intéressantes quant à la manière dont les doctorants font usage de cette faculté de choix.
On y apprend notamment ceci :
Au 1er janvier 2019, sur les 85000 thèses soutenues et traitées par les établissements, on dénombrait quelques 23000 thèses électroniques en accès restreint, soit 27% du corpus, avec un ratio de 26,6% pour les thèses soutenues en 2016 et de 22% pour les thèses soutenues en 2017 (sachant que 2 500 thèses sont en attente de traitement pour 2017).
Je dois dire que j’ai dû relire ces chiffres plusieurs fois pour vérifier si j’avais bien compris. Car si 27% du corpus global des thèses est encore en accès restreint, on peut en déduire que 73% sont diffusées en ligne en libre accès, ce qui constitue un chiffre somme toute assez considérable, si on considère que les doctorants sont libres de prendre cette décision. Et la proportion semble progresser dans le temps, puisqu’elle augmente jusqu’à 78% pour la dernière année considérée par l’enquête (2017).
On dit que les doctorants sont parfois dissuadés de mettre leur thèse en ligne à cause de la peur du plagiat ou parce que la diffusion en Libre Accès leur ferait perdre l’opportunité de publier leur thèse chez un éditeur. Il semblerait que ce type d’arguments perdent peu à peu de leur puissance, vu que près de quatre doctorants sur cinq font à présent le choix de la mise en ligne. Il serait néanmoins intéressant d’avoir des chiffres plus détaillés, notamment pour connaître l’état des pratiques par discipline, car il doit exister des contrastes selon les branches de la Science.
A titre de comparaison, le Baromètre de la Science Ouverte indique une moyenne de 41% d’Open Access pour les articles publiés par les chercheurs français. On ne peut toutefois comparer complètement les thèses et les articles, car pour les thèses ne sont pas des documents édités et le choix de la mise en ligne peut s’opérer de manière plus autonome.
Quelle diffusion pour les thèses en accès restreint ?
Un autre point intéressant dans l’enquête de l’ABES concerne les pratiques des bibliothèques universitaires à propos de la mise à disposition des thèses, lorsque le doctorant a opté pour un accès restreint. En effet, l’arrêté de 2016 permet aux auteurs de ne pas diffuser leur thèse en ligne, mais il prévoit que les thèses en accès restreint reste néanmoins communicables dans le périmètre suivant :
Sauf si la thèse présente un caractère de confidentialité avéré, sa diffusion est assurée dans l’établissement de soutenance et au sein de l’ensemble de la communauté universitaire. La diffusion en ligne de la thèse au-delà de ce périmètre est subordonnée à l’autorisation de son auteur, sous réserve de l’absence de clause de confidentialité.
Il faut savoir que cette nouvelle version de l’arrêté sur le doctorant a élargi ces conditions de diffusion (j’avais d’ailleurs écrit un billet à ce sujet en 2016). En effet auparavant, les bibliothèques universitaires ne pouvaient communiquer les thèses électroniques en accès restreint que dans le périmètre de l’établissement de soutenance. En ajoutant que la diffusion était possible « au sein de l’ensemble de la communauté universitaire« , le nouvel arrêté laissait présager la possibilité d’une communication à distance, à condition de l’effectuer de manière sécurisée. Mais le texte restait flou sur les modalités que pourraient prendre une telle diffusion élargie.
L’enquête de l’ABES montre que ces incertitudes ont hélas plutôt joué en défaveur de la diffusion, puisque 2/3 des établissements n’autorisent pas le PEB (Prêt Entre Bibliothèques) pour les thèses électroniques en accès restreint. Les situations sont très variables en fonction des établissements : dans la plupart des cas, les thèses sont quand même accessibles via un intranet, mais uniquement aux membres de l’établissement et non à « l’ensemble de la communauté universitaire« .
Pour une « FAIRisation » de la diffusion des thèses
L’ABES recommande à la fin de son enquête la mise en place d’un dispositif au niveau national pour permettre l’accès aux thèses en accès restreint. Cette idée a son intérêt, mais il me semble que les enjeux vont graduellement se déplacer à l’avenir.
Si l’on en croît la dynamique des chiffres, cette question de la diffusion des thèses en accès restreint risque en effet de perdre peu à peu en importance dans le temps, puisque la plupart des thèses seront accessibles en ligne. Il restera néanmoins toujours une proportion de thèses pour lesquelles l’accès devra continuer à s’effectuer de manière sécurisée, indépendamment de la volonté du doctorant. Cela découle de motifs légitimes de confidentialité ou de la nécessité de protéger des secrets reconnus par la loi (protection de la vie privée, secret industriel et commercial, secrets administratifs, etc.).
Si on extrapole un peu à partir de la situation actuelle, on arrive à un schéma proche de celui qui prévaut actuellement en droit pour les données de la recherche, à savoir un principe d’ouverture par défaut, accompagné d’une série d’exceptions fixées par la loi. On pourrait donc à terme envisager une refonte de l’arrêté sur le doctorat pour acter cet état de fait et mettre complètement en phase les règles de diffusion des thèses avec les principes de la Science Ouverte. Cela conduirait quelque part à évoluer vers ce que j’appellerai une « FAIRisation » de la logique de diffusion des thèses.
Je fais référence par là aux principes FAIR, mis en place initialement par la Commission européenne pour les données de recherche, dont l’esprit général est résumé par la phrase : « Aussi ouvert que possible, aussi fermé que nécessaire« . Cet adage traduit l’idée que l’ouverture ne doit plus dépendre d’une décision d’opportunité ou d’un choix discrétionnaire, mais plutôt d’un diagnostic, devant s’attacher à vérifier si des obstacles juridiques à la mise en ligne existent ou non. Au cas où aucun de ces obstacles n’est identifié, alors c’est le principe général qui s’applique et la mise en ligne doit être opérée.
Il me semble qu’il serait important que les doctorants soient d’emblée familiarisés avec cette logique FAIR, car ils seront désormais amenés de plus en plus souvent dans la suite de leur carrière de chercheur à devoir appliquer ces principes d’ouverture par défaut. C’est en effet la volonté du Plan National pour la Science Ouverte, adopté en 2018, de promouvoir l’ouverture systématique des résultats de la recherche financée par des fonds publics. Il serait donc assez cohérent que les doctorants qui reçoivent un financement public pour réaliser leurs thèses doivent en contrepartie publier celle-ci en ligne, à moins qu’un obstacle juridique ne s’y oppose (ouverture par défaut). Une telle règle semble d’ailleurs se dessiner au Royaume-Uni pour les thèses financées par l’équivalent de leur ANR (voir ci-dessous).
On pourrait même aller plus loin dans cette idée de « FAIRisation » de la diffusion des thèses en prenant en compte également les données de recherche associées. Il importe en effet de considérer les thèses comme des objets « hybrides », composés certes d’un texte, mais aussi des données sous-jacentes, qui en sont indissociables. La période du doctorat constitue d’ailleurs le premier moment où les chercheurs sont confrontés aux problématiques de production et de gestion de données de recherche et c’est donc un moment crucial pour l’acquisition des compétences de bonnes pratiques. Or de la même manière que les lauréats des projets ANR ou H2020 sont désormais tenus de réaliser des plans de gestion des données (DMP / Data Management Plan), on pourrait imaginer que les doctorants doivent faire de même.
Un tel plan de gestion de données, qui devrait idéalement comporter trois volets (en début de thèse, à mi-parcours, à la fin), permettrait justement d’anticiper la question de la diffusion et d’établir si des obstacles juridiques à l’ouverture existent ou non. Pour que la cohérence soit complète, de la même manière qu’un doctorant ne peut aujourd’hui soutenir sa thèse sans avoir déposé la version électronique du texte à la bibliothèques universitaire, on pourrait imaginer que les doctorants ne puissent se présenter à la soutenance sans avoir déposé les données associées, conformément à un Plan de Gestion de Données établi à l’avance. Et pour que ces principes aient une portée réelle, c’est l’arrêté sur le doctorat qui devrait être modifié pour établir de telles règles.
***
Le Plan National pour la Science Ouverte prévoyait déjà la création d’un « Label Science Ouverte » pour les écoles doctorales et lors des dernières Journées Nationales de la Science Ouverte qui se sont tenues à Paris en novembre dernier, il a été annoncé la production d’un « Vade-mecum de la Science Ouverte » à destination des écoles doctorales. Les propositions finales que j’ai fait figurer dans ce billet vont plus loin, mais si 73% des thèses sont déjà en Libre Accès, le pas à franchir pour établir un principe d’ouverture par défaut est assez ténu. Les principes mêmes de la Science Ouverte conduiront sans doute tôt ou tard à une généralisation de la logique du FAIR et il y aurait du sens à ce que les thèses soient diffusées dans cet esprit, aussi bien en ce qui concerne le texte que les données.