L’administration Trump a agi vite. Quelques semaines après l’investiture du président américain, plusieurs milliers de pages web relatives à différentes agences scientifiques ont été supprimées. Dans ce contexte, des mouvements de protestation se font jour pour demander une sauvegarde de la recherche et de ses données. Ce qui s’avère difficile, mais pas impossible.
* * *
D
ES GUIDES à propos de la maladie d’Alzheimer, des messages de prévention face au virus de l’immunodéficience humaine (VIH), des statistiques sur la violence des mineurs, ou encore des études scientifiques. En tout, ce sont près de 8 000 pages web qui ont été supprimées en quelques jours, début février, par l’administration Trump. Le nouveau président est bien décidé à bannir des agences fédérales tout ce qui a trait au changement climatique, à la lutte pour l’égalité, l’inclusion ou la diversité.
Depuis, certaines sont revenues, parfois avec quelques modifications pour gommer les références à la transidentité, au genre, ou parfois tout simplement à l’égalité entre les femmes et les hommes. Une décision de justice a aussi imposé, le 11 février, un retour de nombreuses pages du Center for Disease Control (CDC), l’agence en charge de la lutte contre les maladies. Certaines pages mises en ligne par le ministère de la santé ont aussi fait leur retour.
Il n’empêche que dans ce climat, les scientifiques sont inquiets. De nombreuses études publiées sont aujourd’hui indisponibles, concernant notamment la santé publique, mais aussi en sociologie ou en économie. Il est difficile d’en savoir le nombre exact, car certaines reviennent temporairement et d’autres devraient suivre. Mais, selon le New York Times, cela concernerait plusieurs milliers d’études. Et toutes ne sont pas archivées.
PLUSIEURS MILLIERS D’ÉTUDES CONCERNÉES
« Tous les scientifiques ne sont pas sensibilisés au fait de sauvegarder leurs travaux, confie Mariannig Le Béchec, chercheuse en sciences de l’information et de la communication à l’Université de Lorraine. Des pratiques ont commencé à se développer avec l’essor des outils informatiques dans les années 2000, mais rien de centralisé. »
En 2022, elle publie une étude dans laquelle 1 089 scientifiques sont interrogés sur leurs pratiques autour de la préservation de leurs études. Ils sont 46 % à déclarer qu’ils ne pratiquent pas l’archivage, avec le risque qu’ils ne soient bien plus en réalité : les personnes sensibilisées à ces questions étant par définition plus enclines à répondre.
En tout, ce sont près de 8 000 pages web qui ont été supprimées en quelques jours par l’administration Trump.
Mais comment faire pour archiver ses études afin qu’elles ne disparaissent pas dans les limbes du web, ou à la faveur d’un gouvernement peu attaché à ces données ? « Les méthodes sont nombreuses, résume Mariannig Le Béchec. Pour certains chercheurs, il s’agit juste de garder leurs travaux sur un disque dur externe à leur domicile, ce qui n’est pas de l’archivage à proprement parler. Mais ils sont assez nombreux, plus du tiers, à se tourner plutôt vers les solutions institutionnelles. »
En France, cela est permis via le ministère de l’enseignement supérieur et de la recherche, qui met à disposition des chercheurs une page dédiée à déposer leurs données. Au-delà de ce dispositif, le mouvement de la science ouverte qui a grandi dans les années 2000 avec la démocratisation de l’internet, a permis l’émergence de toute une myriade de solutions. HAL en France, Zenodo au niveau européen, ou encore le serveur ArXiv dédié aux recherches pas encore publiées. Les scientifiques ont l’embarras du choix pour poster et mettre à disposition leurs études, ou même leurs données brutes lorsque cela est possible. Par exemple, cette pratique est interdite pour les études médicales au risque de perdre l’anonymisation des participants.
LA SCIENCE COMME
UN PATRIMOINE À DÉFENDRE
Cela dit, même malgré cette multitude d’outils, les scientifiques ne sont pas toujours bien conscients des possibilités qui leur sont offertes. « Nous faisons de la sensibilisation dans les laboratoires de recherche, détaille Anne-Sophie Rozay, chargée de mission pour le programme de la Mission nationale de sauvegarde du patrimoine scientifique et technique. Il s’agit de voir ce qui pourrait être sauvegardé d’un point de vue patrimonial. »
Portée par le Conservatoire national des arts et métiers (CNAM), cette mission défend la production scientifique en tant que marqueur aussi important que l’héritage artistique ou industriel. Il ne s’agit pas ici d’archiver la totalité de la science, mais plutôt de la conserver, comme une sorte de musée en ligne. « Les chercheurs peuvent être surpris qu’on s’intéresse à leurs travaux, poursuit Anne-Sophie Rozay, mais c’est pourtant un héritage qui mérite d’être diffusé au plus grand nombre, même lorsque c’est complexe. »
Dans l’étude de Mariannig Le Béchec, un autre constat apparaît : les chercheurs qui ont davantage tendance à pratiquer l’archivage de leurs travaux sont ceux qui travaillent en groupe, dans de grandes structures où l’on encourage l’accès à ces différentes plateformes. Dans les équipes moins nombreuses et plus isolées, l’habitude est bien moins diffusée. « Il y a aussi des variations selon la spécialité, précise la chercheuse. Par exemple, en astronomie c’est très pratiqué car il y a, depuis des décennies, une difficulté d’accès à certains télescopes par exemple. Les astronomes avaient donc déjà l’habitude de partager les données obtenues avec le reste de la communauté. »
Une organisation est née en 2017, le Data Rescue Project, destinée à archiver le maximum de données au cas où celles-ci viendraient à être la cible de mouvements d’extrême-droite.
Aux États-Unis, le mouvement de la science ouverte a fait des émules. L’avènement de l’internet a laissé croire que tout pouvait être mis en commun sur le web. Il persiste néanmoins quelques résistances, notamment de la part de certains éditeurs de revues qui ne souhaitent pas toujours que les articles chèrement payés finissent accessibles gratuitement. Mais même elles tolèrent une mise en ligne des archives passé un certain temps.
Aujourd’hui, aux États-Unis, les hébergeurs institutionnels semblent peu fiables, comme l’ont montré les attaques de la nouvelle présidence, mais les activistes s’organisent autrement. Comme le raconte Le Monde, une organisation est née en 2017, le Data Rescue Project, qui est destinée à archiver le maximum de données au cas où celles-ci viendraient à être la cible de mouvements d’extrême-droite. Le quotidien ajoute : « Les lecteurs et participants sont incités à envoyer des ensembles de données sur des plateformes. »
Heureusement, là aussi, les solutions ne manquent pas pour mettre ses études à l’abri. Outre les plateformes institutionnelles déjà listées, les scientifiques font appel à d’autres tiers de confiance. Ainsi, le CDC a placé la totalité de ses données sur la plateforme Internet Archive dès le 31 janvier : 98,5 Gigas de documents, de PDF, de bases de données… Le tout désormais accessible à tout le monde. Sur Radio-Canada, la chercheuse Angela Rasmussen, qui a œuvré à cet archivage inopiné, raconte avoir contacté un ami informaticien dans l’urgence : « Je lui ai demandé s’il pouvait cloner tout le site. Il pensait que je faisais des blagues. Mais j’étais très sérieuse. »
Sur le site du Data Rescue Project, les visiteurs peuvent trouver toute une liste de plateformes qui proposent de sauvegarder des pages web, ainsi que des extensions pour navigateur qui donnent accès aux pages supprimées. Le site affiche la couleur avec une dénonciation claire : « Notre but est de servir de centre d’échange pour rassembler les efforts autour de la sauvegarde de données et de la mise à disposition du public américain, ce qui est actuellement menacé. »
LA FORCE DE LA DÉCENTRALISATION
« Ce que nous avons noté également, ajoute Mariannig Le Béchec, c’est que les scientifiques avaient tendance à choisir la solution la plus simple pour eux. Ainsi, ils sont nombreux à avoir posté leurs données sur Github, où elles peuvent être traitées. En plus, Github est lié à Zenodo, ce qui facilite encore leur travail. »
Cette dimension n’est pas à prendre à la légère : le confort. Si aujourd’hui, l’archivage n’est pas systématique pour tous les scientifiques, c’est aussi parce que c’est une tâche qui peut être fastidieuse, parfois pour des raisons très triviales. Là aussi, les équipes isolées sont un peu défavorisées puisque les chercheurs écrivent avant tout « pour eux », avec leurs propres tableaux, leurs petites habitudes… « Parfois, c’est la manière de présenter les données, ou même simplement d’écrire la date qui change, assure Mariannig Le Béchec. Dans ces conditions, sans harmonisation générale, c’est difficile d’aller plus loin. »
Pour résumer, l’archivage des études et des données scientifiques se fait un peu au cas par cas, sur différentes plateformes, sans réelle stratégie d’ensemble… Et c’est un peu ce qui fait sa force !
Même dans le cas où un gouvernement totalitaire voudrait mettre fin à un grand pan de la science moderne, il n’aurait aucun pouvoir face à un réseau tentaculaire et décentralisé.
Avec autant de solutions à disposition, l’archivage des données scientifiques est tellement décentralisé qu’il est difficile, voire impossible, de le supprimer, même avec tous les efforts du monde. « Ce qui se passe aux États-Unis est extrêmement préoccupant, il ne faut pas le nier, insiste Mariannig Le Béchec. Mais ça l’est davantage pour les études à venir qui pourraient être entravées. Celles qui ont déjà été publiées ne pourront pas disparaître totalement. »
Petite consolation : même dans le cas où un gouvernement totalitaire voudrait mettre fin à un grand pan de la science moderne, il n’aurait aucun pouvoir face à un réseau tentaculaire et décentralisé. Un bémol tout de même : toute cette masse de connaissances déjà assez obscure pour le commun des mortels sera encore plus inaccessible. D’où l’intérêt de certaines initiatives comme celle que mène Anne-Sophie Rozay avec le CNAM. Les informations sauvegardées sont ensuite mises en ligne sur la plateforme Patstec.
On y trouve des expositions consacrées aux prototypes d’appareils scientifiques, mais aussi des dizaines d’années d’archives de Météo-France, ou des fiches techniques de sous-marins. « C’est un peu comme un musée numérique de la science, résume la spécialiste. Ce patrimoine aussi a une vocation culturelle. » Donald Trump a peut-être tout un appareil bureaucratique à son service. Mais il n’a pas accès à tout ce que le web fait de mieux en termes de préservation de ce patrimoine.
Hugo Ruher, journaliste / Sciences Critiques.
> Photo de Une : Darth Trump Vader (Pixabay/Kirill_makes_pics)
> Illustration « 404 Page Not found » (Capture d’écran de pages web gouvernementales supprimées)
> Illustration « Trump Warrol » (Pixabay/tiburi)
* * *
* * *
D
ES GUIDES à propos de la maladie d’Alzheimer, des messages de prévention face au virus de l’immunodéficience humaine (VIH), des statistiques sur la violence des mineurs, ou encore des études scientifiques. En tout, ce sont près de 8 000 pages web qui ont été supprimées en quelques jours, début février, par l’administration Trump. Le nouveau président est bien décidé à bannir des agences fédérales tout ce qui a trait au changement climatique, à la lutte pour l’égalité, l’inclusion ou la diversité.
Depuis, certaines sont revenues, parfois avec quelques modifications pour gommer les références à la transidentité, au genre, ou parfois tout simplement à l’égalité entre les femmes et les hommes. Une décision de justice a aussi imposé, le 11 février, un retour de nombreuses pages du Center for Disease Control (CDC), l’agence en charge de la lutte contre les maladies. Certaines pages mises en ligne par le ministère de la santé ont aussi fait leur retour.
Il n’empêche que dans ce climat, les scientifiques sont inquiets. De nombreuses études publiées sont aujourd’hui indisponibles, concernant notamment la santé publique, mais aussi en sociologie ou en économie. Il est difficile d’en savoir le nombre exact, car certaines reviennent temporairement et d’autres devraient suivre. Mais, selon le New York Times, cela concernerait plusieurs milliers d’études. Et toutes ne sont pas archivées.
PLUSIEURS MILLIERS D’ÉTUDES CONCERNÉES
« Tous les scientifiques ne sont pas sensibilisés au fait de sauvegarder leurs travaux, confie Mariannig Le Béchec, chercheuse en sciences de l’information et de la communication à l’Université de Lorraine. Des pratiques ont commencé à se développer avec l’essor des outils informatiques dans les années 2000, mais rien de centralisé. »
En 2022, elle publie une étude dans laquelle 1 089 scientifiques sont interrogés sur leurs pratiques autour de la préservation de leurs études. Ils sont 46 % à déclarer qu’ils ne pratiquent pas l’archivage, avec le risque qu’ils ne soient bien plus en réalité : les personnes sensibilisées à ces questions étant par définition plus enclines à répondre.
En tout, ce sont près de 8 000 pages web qui ont été supprimées en quelques jours par l’administration Trump.
Mais comment faire pour archiver ses études afin qu’elles ne disparaissent pas dans les limbes du web, ou à la faveur d’un gouvernement peu attaché à ces données ? « Les méthodes sont nombreuses, résume Mariannig Le Béchec. Pour certains chercheurs, il s’agit juste de garder leurs travaux sur un disque dur externe à leur domicile, ce qui n’est pas de l’archivage à proprement parler. Mais ils sont assez nombreux, plus du tiers, à se tourner plutôt vers les solutions institutionnelles. »
En France, cela est permis via le ministère de l’enseignement supérieur et de la recherche, qui met à disposition des chercheurs une page dédiée à déposer leurs données. Au-delà de ce dispositif, le mouvement de la science ouverte qui a grandi dans les années 2000 avec la démocratisation de l’internet, a permis l’émergence de toute une myriade de solutions. HAL en France, Zenodo au niveau européen, ou encore le serveur ArXiv dédié aux recherches pas encore publiées. Les scientifiques ont l’embarras du choix pour poster et mettre à disposition leurs études, ou même leurs données brutes lorsque cela est possible. Par exemple, cette pratique est interdite pour les études médicales au risque de perdre l’anonymisation des participants.
LA SCIENCE COMME
UN PATRIMOINE À DÉFENDRE
Cela dit, même malgré cette multitude d’outils, les scientifiques ne sont pas toujours bien conscients des possibilités qui leur sont offertes. « Nous faisons de la sensibilisation dans les laboratoires de recherche, détaille Anne-Sophie Rozay, chargée de mission pour le programme de la Mission nationale de sauvegarde du patrimoine scientifique et technique. Il s’agit de voir ce qui pourrait être sauvegardé d’un point de vue patrimonial. »
Portée par le Conservatoire national des arts et métiers (CNAM), cette mission défend la production scientifique en tant que marqueur aussi important que l’héritage artistique ou industriel. Il ne s’agit pas ici d’archiver la totalité de la science, mais plutôt de la conserver, comme une sorte de musée en ligne. « Les chercheurs peuvent être surpris qu’on s’intéresse à leurs travaux, poursuit Anne-Sophie Rozay, mais c’est pourtant un héritage qui mérite d’être diffusé au plus grand nombre, même lorsque c’est complexe. »
Dans l’étude de Mariannig Le Béchec, un autre constat apparaît : les chercheurs qui ont davantage tendance à pratiquer l’archivage de leurs travaux sont ceux qui travaillent en groupe, dans de grandes structures où l’on encourage l’accès à ces différentes plateformes. Dans les équipes moins nombreuses et plus isolées, l’habitude est bien moins diffusée. « Il y a aussi des variations selon la spécialité, précise la chercheuse. Par exemple, en astronomie c’est très pratiqué car il y a, depuis des décennies, une difficulté d’accès à certains télescopes par exemple. Les astronomes avaient donc déjà l’habitude de partager les données obtenues avec le reste de la communauté. »
Une organisation est née en 2017, le Data Rescue Project, destinée à archiver le maximum de données au cas où celles-ci viendraient à être la cible de mouvements d’extrême-droite.
Aux États-Unis, le mouvement de la science ouverte a fait des émules. L’avènement de l’internet a laissé croire que tout pouvait être mis en commun sur le web. Il persiste néanmoins quelques résistances, notamment de la part de certains éditeurs de revues qui ne souhaitent pas toujours que les articles chèrement payés finissent accessibles gratuitement. Mais même elles tolèrent une mise en ligne des archives passé un certain temps.
Aujourd’hui, aux États-Unis, les hébergeurs institutionnels semblent peu fiables, comme l’ont montré les attaques de la nouvelle présidence, mais les activistes s’organisent autrement. Comme le raconte Le Monde, une organisation est née en 2017, le Data Rescue Project, qui est destinée à archiver le maximum de données au cas où celles-ci viendraient à être la cible de mouvements d’extrême-droite. Le quotidien ajoute : « Les lecteurs et participants sont incités à envoyer des ensembles de données sur des plateformes. »
Heureusement, là aussi, les solutions ne manquent pas pour mettre ses études à l’abri. Outre les plateformes institutionnelles déjà listées, les scientifiques font appel à d’autres tiers de confiance. Ainsi, le CDC a placé la totalité de ses données sur la plateforme Internet Archive dès le 31 janvier : 98,5 Gigas de documents, de PDF, de bases de données… Le tout désormais accessible à tout le monde. Sur Radio-Canada, la chercheuse Angela Rasmussen, qui a œuvré à cet archivage inopiné, raconte avoir contacté un ami informaticien dans l’urgence : « Je lui ai demandé s’il pouvait cloner tout le site. Il pensait que je faisais des blagues. Mais j’étais très sérieuse. »
Sur le site du Data Rescue Project, les visiteurs peuvent trouver toute une liste de plateformes qui proposent de sauvegarder des pages web, ainsi que des extensions pour navigateur qui donnent accès aux pages supprimées. Le site affiche la couleur avec une dénonciation claire : « Notre but est de servir de centre d’échange pour rassembler les efforts autour de la sauvegarde de données et de la mise à disposition du public américain, ce qui est actuellement menacé. »
LA FORCE DE LA DÉCENTRALISATION
« Ce que nous avons noté également, ajoute Mariannig Le Béchec, c’est que les scientifiques avaient tendance à choisir la solution la plus simple pour eux. Ainsi, ils sont nombreux à avoir posté leurs données sur Github, où elles peuvent être traitées. En plus, Github est lié à Zenodo, ce qui facilite encore leur travail. »
Cette dimension n’est pas à prendre à la légère : le confort. Si aujourd’hui, l’archivage n’est pas systématique pour tous les scientifiques, c’est aussi parce que c’est une tâche qui peut être fastidieuse, parfois pour des raisons très triviales. Là aussi, les équipes isolées sont un peu défavorisées puisque les chercheurs écrivent avant tout « pour eux », avec leurs propres tableaux, leurs petites habitudes… « Parfois, c’est la manière de présenter les données, ou même simplement d’écrire la date qui change, assure Mariannig Le Béchec. Dans ces conditions, sans harmonisation générale, c’est difficile d’aller plus loin. »
Pour résumer, l’archivage des études et des données scientifiques se fait un peu au cas par cas, sur différentes plateformes, sans réelle stratégie d’ensemble… Et c’est un peu ce qui fait sa force !
Même dans le cas où un gouvernement totalitaire voudrait mettre fin à un grand pan de la science moderne, il n’aurait aucun pouvoir face à un réseau tentaculaire et décentralisé.
Avec autant de solutions à disposition, l’archivage des données scientifiques est tellement décentralisé qu’il est difficile, voire impossible, de le supprimer, même avec tous les efforts du monde. « Ce qui se passe aux États-Unis est extrêmement préoccupant, il ne faut pas le nier, insiste Mariannig Le Béchec. Mais ça l’est davantage pour les études à venir qui pourraient être entravées. Celles qui ont déjà été publiées ne pourront pas disparaître totalement. »
Petite consolation : même dans le cas où un gouvernement totalitaire voudrait mettre fin à un grand pan de la science moderne, il n’aurait aucun pouvoir face à un réseau tentaculaire et décentralisé. Un bémol tout de même : toute cette masse de connaissances déjà assez obscure pour le commun des mortels sera encore plus inaccessible. D’où l’intérêt de certaines initiatives comme celle que mène Anne-Sophie Rozay avec le CNAM. Les informations sauvegardées sont ensuite mises en ligne sur la plateforme Patstec.
On y trouve des expositions consacrées aux prototypes d’appareils scientifiques, mais aussi des dizaines d’années d’archives de Météo-France, ou des fiches techniques de sous-marins. « C’est un peu comme un musée numérique de la science, résume la spécialiste. Ce patrimoine aussi a une vocation culturelle. » Donald Trump a peut-être tout un appareil bureaucratique à son service. Mais il n’a pas accès à tout ce que le web fait de mieux en termes de préservation de ce patrimoine.
Hugo Ruher, journaliste / Sciences Critiques.
> Photo de Une : Darth Trump Vader (Pixabay/Kirill_makes_pics)
> Illustration « 404 Page Not found » (Capture d’écran de pages web gouvernementales supprimées)
> Illustration « Trump Warrol » (Pixabay/tiburi)
* * *
