Le célèbre serveur de prépublication scientifique arXiv a décidé de sévir fermement contre les chercheurs qui soumettent des articles contenant des références générées par l’intelligence artificielle. Désormais, toute soumission comportant des citations « hallucinées » par l’IA ou d’autres signes manifestes d’une relecture négligente pourra entraîner une interdiction de publication sur la plateforme pendant un an.
Cette nouvelle politique, qui suscite de vifs débats au sein de la communauté scientifique, a été détaillée par Thomas Dietterich, informaticien et président de la section informatique d’arXiv. Selon lui, la plateforme ne peut plus faire confiance aux auteurs qui ne vérifient pas les résultats fournis par les grands modèles de langage (LLM). Parmi les indices rédhibitoires figurent non seulement des références inexistantes, mais aussi des commentaires typiques de l’IA, comme des résumés automatiques non relus.
Jusqu’à présent, arXiv appliquait déjà des pénalités pour diverses infractions, mais aucune norme spécifique n’existait pour l’usage inapproprié de l’IA. Désormais, les sanctions sont claires et rendues publiques afin de dissuader les comportements abusifs. Une fois l’interdiction d’un an levée, le chercheur ne pourra à nouveau publier que si ses travaux ont été acceptés par une revue à comité de lecture réputée.
Cette décision a été saluée par certains scientifiques. Valeri Kremnev, cofondateur d’une start-up d’IA à Berlin, a ainsi applaudi l’initiative tout en suggérant d’étendre la lutte à toutes les erreurs, pas seulement celles issues de l’IA.
D’autres voix s’élèvent pour dénoncer une approche trop punitive. Natalie Khalil, fondatrice de Reviewer3, estime qu’arXiv attaque les symptômes plutôt que les causes profondes. Selon elle, un chercheur banni de la plateforme continuera ses travaux ailleurs, sans que le problème fondamental soit résolu. Thomas Dietterich lui rétorque que cela ne justifie pas de laisser ces publications polluer arXiv, et qu’une coopération entre plateformes serait idéale pour endiguer ce fléau.
Un phénomène qui touche l’ensemble des serveurs de prépublication
La contamination par l’IA ne se limite pas à arXiv. D’autres plateformes comme PsyArXiv ou SocArXiv prennent également des mesures radicales, allant jusqu’à l’exclusion permanente des auteurs récidivistes. À l’inverse, les serveurs bioRxiv et medRxiv privilégient une approche technologique, en développant des outils de détection des références erronées.
Pour Dietterich, la prolifération des erreurs générées par l’IA est particulièrement marquée dans le domaine de l’informatique, où l’adoption des LLM est massive. Il craint qu’à l’avenir, ces outils deviennent plus sophistiqués et ne produisent plus de références fantômes, rendant la détection des fraudes beaucoup plus complexe. Il envisage déjà la nécessité de mettre en place des systèmes de preuve d’expérimentation réelle.
L’affaire illustre un enjeu croissant pour la communauté scientifique : concilier l’usage légitime de l’IA comme outil d’assistance avec la nécessité de garantir l’intégrité et la fiabilité de la recherche publiée.

