Sakana AI, start-up japonaise d’intelligence artificielle, a mis au point The AI Scientist, un modèle de langage capable de mener des recherches scientifiques en toute autonomie. Le système peut générer des idées, réaliser des expérimentations et rédiger des articles scientifiques. Lors de la phase de tests, il a même suggéré de nouvelles techniques pour les grands modèles LLM.
Sakana AI, une start-up japonaise d’intelligence artificielle créée en juillet 2023, a dévoilé le 13 août, dans un article universitaire, son nouveau modèle intitulé « The AI Scientist ». Élaboré conjointement avec les universités d’Oxford et de Colombie-Britannique, ce système promet d’automatiser la recherche scientifique, souvent longue et coûteuse. Elle doit ainsi permettre aux chercheurs de se concentrer sur l’essentiel.
The AI Scientist, comme un vrai scientifique
Cette IA générative peut, en toute autonomie, générer des idées, réaliser des expérimentations numériques, compiler les résultats dans un document et rédiger des articles scientifiques conformément aux standards de la communauté. Pour cela, elle repose sur des grands modèles de langage (LLM) qui vont bien au-delà de l’assistance traditionnelle en recherche. Ces algorithmes peuvent reproduire le processus de découverte scientifique.
Tout commence par la découverte du concept
Lorsqu’on le sollicite, The AI Scientist commence par générer des idées. Le système y arrive en s’appuyant sur des bases de code open source, comme celles disponibles sur GitHub. Il peut ainsi proposer des pistes de recherche. L’intelligence artificielle compare ensuite les idées trouvées à la littérature scientifique existante, via l’utilisation d’outils tels que Semantic Scholar, développé par l’Allen Institute for AI. Objectif de cette comparaison : garantir l’originalité des idées.
The AI Scientist rédige dans un format largement utilisé par la communauté scientifique
Une fois le concept validé, l’algorithme procède à la modification du code open source pour exécuter les expérimentations nécessaires. Au cours de cette phase, il compile des données numériques et des résumés visuels sous forme de graphiques et de tableaux. Puis il intègre ces résultats dans un document scientifique, rédigé au format LaTeX, (très utilisé par les chercheurs). Cette approche permet de produire des articles conformes aux normes des conférences de recherche en IA.
Un générateur de révision automatisée en plus
Par la suite, Sakana exploite l’outil Semantic Scholar, développé par l’Allen Institute for AI, pour identifier les articles les plus pertinents afin d’étayer le rapport. En accédant à cette vaste base de données, le système peut garantir que les publications sont bien contextualisées dans le cadre de la recherche actuelle. Par ailleurs, la start-up a conçu un générateur de révision automatisée, lui permettant d’affiner le modèle et de créer une boucle ouverte.
Le modèle a montré un potentiel significatif
Sakana AI assure qu’il est possible de produire un article scientifique pour seulement 15 dollars (13,73 euros), en fonction des ressources informatiques utilisées. Lors de la phase de tests, son intelligence artificielle a montré un potentiel significatif. Elle a suggéré de nouvelles techniques dans le domaine des modèles de langage et des architectures de diffusion. Par exemple, un article intitulé « Adaptive Dual-Scale Denoising » propose une nouvelle méthode pour harmoniser les caractéristiques dans les modèles génératifs de faible dimension.
The AI Scientist doit encore s’améliorer
Avec l’automatisation de certains processus, The AI Scientist permet aux chercheurs de se concentrer sur l’essentiel de leur travail. Cette intelligence artificielle pourrait ainsi accélérer la recherche dans de nombreux domaines scientifiques, notamment dans la découverte de nouveaux médicaments, la science des matériaux ou les sciences environnementales. Elle doit toutefois franchir encore quelques obstacles avant de prétendre rivaliser avec les humains. Cette technologie devrait par exemple élargir sa base de données et intégrer des fonctionnalités de computer vision pour éviter des bugs.
Cette intelligence artificielle peut représenter un risque
En outre, The AI Scientist a montré des comportements dérangeants comme la modification des scripts pour prolonger la durée d’exécution de certaines expérimentations. On n’oublie pas non plus que le système peut aussi commettre des erreurs et verser dans des imprécisions, comme l’a fait GPT-4 d’Open AI quand un magazine scientifique australien l’a sollicité pour écrire un article. Par ailleurs, si on lui donnait trop de liberté, cette IA pourrait mener des expériences biologiques en laboratoire humide et créer de nouveaux virus ou poisons dangereux. Attention donc !