Et si l'Open Access était une question de Digital Labor ?
– S.I.Lex – - calimaq, 3/02/2020
Le Consortium Couperin a publié récemment les résultats d’une enquête sur les « Pratiques de publication et d’accès ouvert des chercheurs français« , qui se démarque par son ampleur (plus de 11 000 réponses de chercheurs, soit 10% de la communauté scientifique française) et l’étendue des questions abordées. Beaucoup de points mériteraient d’être commentés, mais je voudrais me concentrer sur un seul aspect qui m’a particulièrement frappé.
On peut en effet lire cette phrase dans la synthèse effectuée par Couperin à partir des résultats :
Les chercheurs sont globalement favorables à l’accès ouvert et en comprennent l’enjeu majeur : la diffusion des résultats de la science de façon libre et gratuite. Néanmoins, cet objectif doit pour eux être réalisé sans effort, de manière simple, lisible et sans financement direct des laboratoires, le tout en ne bousculant pas trop le paysage des revues traditionnelles de leur discipline auxquelles ils sont attachés.
J’ai souligné les mots « sans effort », car ils me paraissent intéressants à relever. En gros, les chercheurs sont favorables au Libre Accès, à condition qu’il n’entraîne pour eux aucun surcroît de travail à effectuer. Si, d’après l’enquête, la méconnaissance des questions juridiques liées au Libre Accès reste le premier obstacle au dépôt en archives ouvertes, on trouve en seconde position des arguments du type : « Je n’ai pas le temps » ou « le dépôt est trop laborieux ». L’archive ouverte HAL attire encore souvent ce genre de critiques, et ce alors même que la procédure de dépôt a été grandement simplifiée ces dernières années (ajout de fichiers en glissé-déposé, diminution des champs obligatoires, possibilité de récupérer automatiquement les métadonnées via un DOI, etc.).
En réalité, les positions exprimées par les chercheurs à propos des archives ouvertes sont assez paradoxales. Une majorité d’entre eux trouvent en effet que le dépôt est « rapide » et « simple » (voir ci-dessous), ce qui paraît contradictoire avec l’argument du manque de temps ou des interfaces trop complexes.
L’enquête permettait aux chercheurs de laisser des commentaires libres, qui montrent que le vrai problème se situe sans doute ailleurs que dans l’ergonomie des plateformes. Une partie des chercheurs tendent en effet à considérer que ces tâches de dépôt – même simples et rapides à effectuer – ne correspondent pas à l’image qu’ils se font de leur travail :
« Ce n’est pas mon travail, je suis déjà très pris par des charges administratives je ne vais pas en plus faire ce type de tâches. »
« Ceci n’est pas du ressort d’un enseignant-chercheur dont on demande de plus en plus de tâches administratives ou « transversales » en plus de son travail d’enseignement et de recherche. Donc, j’estime que le dépôt sous HAL doit être assuré par des personnels archivistes dont c’est effectivement le métier ! Tant que les moyens ne seront pas mis pour ouvrir des postes à ces personnels, je refuserai de faire ce travail sous HAL. »
« Je dépose les références minimales, pour l’évaluation HCERS mais pas les articles.De mon point de vue, c’est l’institution qui doit se charger de la mise en ligne des notices et des articles (après obtention accord de l’auteur) et comme elle ne s’en charge pas… Je fais donc le minimum. »
Dans ce billet, je voudrais essayer d’éclairer ces positions ambivalentes en utilisant la notion de Digital Labor (travail numérique). Pour ce faire, je ne vais pas me référer à l’acception la plus courante du terme « Digital Labor », telle que l’utilise notamment Antonio Casilli dans ses travaux sur les plateformes numériques et l’intelligence artificielle. Je vais me tourner vers une conception plus large, que j’ai découverte dans l’ouvrage (remarquable) du sociologue Jérôme Denis : « Le travail invisible des données. Éléments pour une sociologie des infrastructures scripturales« .
Omniprésence et invisibilité du travail des données
Pour Jérôme Denis, le « travail des données » n’est pas un phénomène récent et il dépasse très largement les situations où les internautes sont « mis au travail » à leur insu par des plateformes comme Facebook ou Amazon. Il s’agit plutôt d’une caractéristique générale de toutes les organisations – publiques comme privées – qui ont besoin de produire et de faire circuler de l’information pour fonctionner. Sans cette capacité à organiser des flux de données standardisées, ni les entreprises, ni les administrations ne pourraient exister, dès lors qu’elles atteignent une certaine taille et se bureaucratisent. Jérôme Denis ajoute que, bien que ce « travail des données » soit absolument vital pour ces organisations, il a pourtant constamment été minimisé, dévalorisé et même invisibilisé. En témoigne la manière dont ces tâches ont été déléguées à des personnels généralement considérés comme subalternes – les secrétaires, par exemple – et il n’est pas anodin que les professions liées à l’information furent traditionnellement – et sont en grande partie toujours – exercées majoritairement par des femmes (c’est vrai des secrétaires, mais aussi des bibliothécaires ou des documentalistes).
Paradoxalement là encore, l’informatisation des organisations est venue aggraver ce phénomène de dépréciation et d’invisibilisation. Le déploiement des ordinateurs en réseau s’est accompagné d’une croyance en vertu de laquelle l’information pourrait se propager avec la facilité et la rapidité du courant électrique, comme des impulsions le long d’un système nerveux. Ce mythe est lié au fantasme de la « dématérialisation » qui, en libérant (soit-disant) l’information de ses supports physiques, lui permettrait de circuler comme un fluide parfait. Pourtant, et c’est une chose que le livre de Jérôme Denis montre remarquablement bien, le numérique ne supprime pas en réalité le « travail des données ». Bien au contraire, l’information reste largement dépendante de supports matériels (claviers, écrans, etc.) et la numérisation tend même à intensifier et à complexifier le travail informationnel (songeons par exemple au temps invraisemblable que nous passons à gérer nos boîtes mail professionnelles et à la pénibilité que cela engendre).
Un des avantages de cette conception large du « travail des données » est qu’elle permet d’embrasser et d’éclairer tout un ensemble de situations auxquelles nous sommes quotidiennement confrontés. Pour illustrer son propos, Jérôme Denis prend notamment un exemple tiré de son expérience personnelle que j’ai trouvé particulièrement frappant. Il raconte en effet comment, après la mort de son père, il a été obligé d’effectuer avec sa famille pendant des mois de laborieuses démarches pour « pousser » l’information du décès vers de nombreuses organisations : administrations en tout genre, banques, assurances, boutiques en ligne, fournisseurs d’accès Internet, etc. Rien ne paraît pourtant plus élémentaire que l’annonce de la disparition d’une personne (vie/mort ; 0/1) et on pourrait penser à l’heure du numérique qu’une telle mise à jour des systèmes d’information est relativement simple à effectuer. Mais il n’en est rien et malgré l’interconnexion croissante des bases de données, une part importante du travail doit encore être effectué « à la main » par l’administré/client, en saisissant l’information dans des interfaces et en remplissant des formulaires.
Il existe donc une sorte « viscosité » de l’information que le numérique n’a pas fait disparaître et ne supprimera sans doute jamais complètement, sachant qu’il engendre sa propre part de « frictions » dans la production et la circulation des données.
Quelle perception du « travail des données » chez les chercheurs ?
La question n’est donc pas tant de chercher à faire disparaître le « travail des données » que de savoir quel statut et quelle reconnaissance on lui donne. La perception de la « pénibilité » de ce travail varie en outre grandement d’un contexte à un autre, non pas tellement en fonction de caractéristiques objectives, mais plutôt par rapport à la représentation que les individus s’en font.
Si l’on revient à la question de l’Open Access, j’ai toujours trouvé qu’il existait une forme de dialogue de sourds entre chercheurs et bibliothécaires/documentalistes à propos du dépôt des publications en archives ouvertes. Pour ces derniers, qui sont des professionnels de l’information, le dépôt des publications paraît quelque chose de simple, en partie parce que le travail des données est inhérent à leur métier et n’est pas déprécié symboliquement à leurs yeux. A l’inverse pour la majorité des chercheurs, un tel travail – même léger – suscitera un rejet mécanique, parce qu’il fait apparaître ce qui devrait rester invisible. Ce qui est intéressant, c’est que les mêmes chercheurs qui refusent d’effectuer les tâches de dépôt en archives ouvertes réalisent pourtant des opérations assez similaires dans leur pratique des réseaux sociaux académiques (type Researchgate ou Academia). C’est précisément le coup de génie (maléfique !) de ces plateformes d’avoir réussi à « mettre au travail » les chercheurs sans lever le voile d’invisibilité qui rend ce travail des données indolore (et pour le coup, on rejoint ici la thématique classique du Digital Labor comme exploitation des utilisateurs).
S’agissant des chercheurs, les choses sont encore compliquées par le fait qu’ils entretiennent traditionnellement un rapport ambigu avec la question des données. S’appuyant sur les apports des science studies, Jérôme Denis souligne le fait que ce sont les articles de recherche qui sont considérés depuis des siècles par les scientifiques comme les objets chargés de la plus haute valeur symbolique. Il en est ainsi car les articles, une fois mis en forme à l’issue du processus éditorial, deviennent des « mobiles immuables », c’est-à-dire des objets doués de la capacité de circuler, mais tout en gardant une forme fixe. Ils assurent ainsi la communication entre pairs des résultats de la recherche et c’est à partir d’eux quasi exclusivement que s’effectue l’évaluation de la recherche et des chercheurs. Dans un tel contexte, il est logique que le travail d’écriture des articles – celui qui assure justement cette stabilisation de la forme – soit considéré comme la partie la plus noble du travail des chercheurs, tandis que, par contraste, ce qui touche aux données – réputées instables, informes et volatiles – est rejeté dans l’ombre. A la mise en lumière des articles s’oppose la « boîte noire » du laboratoire, où le travail sur les données reste considéré comme quelque chose d’obscur, et même un peu « sale », dont traditionnellement on ne parle pas.
Certes, les choses sont en train de changer, car les données de recherche, à la faveur des politiques de Science Ouverte, gagnent peu à peu leurs lettres de noblesse, en tant qu’objets possédant intrinsèquement une valeur et méritant d’être exposés au grand jour. Mais nul doute qu’il faudra du temps pour que les représentations évoluent et l’enquête de Couperin montre d’ailleurs que si les chercheurs sont aujourd’hui globalement favorables à l’Open Access aux publications, ils restent plus réticents en ce qui concerne le partage des données.
Du coup, le travail des données est doublement dévalorisé au sein des populations de chercheurs. Il subit d’abord la dépréciation générale qui le frappe au sein des organisations modernes, mais cet effet est redoublé par la hiérarchie traditionnelle établie par les chercheurs entre travail rédactionnel et travail informationnel. Or le dépôt en archives ouvertes est précisément ce moment où le travail des données qu’on voudrait pouvoir oublier resurgit. « Cachez ces métadonnées que je ne saurais voir », alors qu’elles sont indispensables pour contextualiser les documents archivés et leur donner du sens…
Changer le statut du travail des données pour promouvoir le Libre Accès
Établir un lien entre Open Access et Digital Labor (au sens large de « travail des données ») est à mon sens important pour mieux comprendre le rapport conflictuel que les chercheurs entretiennent avec les archives ouvertes et leur demande que le Libre Accès s’effectue « sans effort ». Il me semble que cela pourrait au moins s’avérer utile pour identifier quelques « fausses bonnes idées » :
- Croire qu’en améliorant techniquement les interfaces des archives ouvertes, on pourra un jour supprimer complètement le « travail des données » lié au dépôt des publications et le rendre indolore. On trouve aujourd’hui des discours qui nous promettent la mise en place d’interfaces « seamless » (i.e. « sans couture ») qui permettraient une expérience utilisateur parfaitement fluide. On peut certes faire des progrès en matière d’ergonomie, mais il restera toujours à mon sens une part de « travail du clic » à effectuer et tant qu’il sera frappé d’une dépréciation symbolique, il suscitera une forme de rejet par les chercheurs.
- Proposer aux chercheurs d’effectuer l’intégralité de ce travail des données à leur place. C’est certes une demande que certains formulent (« ce n’est pas mon métier ; que l’on embauche des documentalistes pour le faire à ma place »). Mais outre qu’il paraît improbable de recruter un nombre suffisant de personnels d’appui pour effectuer l’intégralité de ce travail, cela ne ferait que participer encore à l’invisibilisation du travail des données et à sa dévalorisation. Les bibliothécaires qui s’engagent dans cette voie se livrent à mon sens à un calcul à court terme qui risque de s’avérer préjudiciable à long terme pour tout le monde.
- Faire effectuer ce travail des données par les éditeurs. C’est à mon sens la pire des solutions possibles et le dernier accord Couperin-Elsevier a bien montré les dangers que pouvait comporter l’idée de « sous-traiter » l’alimentation des archives ouvertes aux éditeurs. C’est aussi parce qu’il garantit justement le plein contrôle des interfaces et des données que le principe d’une alimentation des archives ouvertes par les chercheurs eux-mêmes reste absolument crucial.
Au final pour développer la pratique de l’Open Access, c’est le statut de ce « travail des données » qu’il faudrait faire évoluer au sein des communautés scientifiques pour qu’il regagne ses lettres de noblesses, lui donner la visibilité qu’il mérite et le faire apparaître comme partie intégrante de l’activité de publication. La question ne concerne d’ailleurs pas que le Libre Accès aux publications, mais aussi les données de la recherche qui gagnent peu à peu en importance. Néanmoins, cette dernière thématique étant en train de devenir « à la mode », elle va sans doute faire l’objet d’une revalorisation symbolique, tandis que l’on peut craindre que le travail informationnel à effectuer pour alimenter les archives ouvertes reste encore longtemps frappé d’indignité.
Dans l’enquête Couperin, on voit bien par exemple que les communautés de mathématiciens et d’informaticiens sont celles qui ont le plus recours aux archives ouvertes et ce sont aussi justement aussi celles qui ont le moins « externalisé » le travail informationnel, puisque les chercheurs dans ces disciplines effectuent eux-mêmes une large partie du travail de mise en forme des publications (avec LaTeX) et de dépôt des préprints sur ArXiv.