Depuis plus de trois décennies, le télescope spatial Hubble observe l’Univers avec une précision inégalée. Galaxies lointaines, nébuleuses, supernovæ, lentilles gravitationnelles, ses instruments ont accumulé une quantité vertigineuse de données. En 35 ans d’observation, Hubble a généré des centaines de millions d’images, un volume tel qu’aucune équipe humaine ne peut raisonnablement tout analyser. Longtemps, une partie de ces données est restée inexploitable, non par manque d’intérêt scientifique, mais par limite cognitive. C’est précisément là qu’une intelligence artificielle est entrée en jeu, révélant 1 400 anomalies cosmiques, dont une majorité n’avait jamais été observée.
Une infobésité cosmique devenue ingérable pour l’humain
L’astronomie moderne est confrontée à un paradoxe. Les instruments sont de plus en plus puissants, mais la capacité humaine à analyser les données reste limitée. À titre de comparaison, le télescope spatial James Webb génère à lui seul environ 57 Go de données par jour, un flux continu qui s’ajoute aux archives historiques de Hubble. Face à cette infobésité cosmique, deux astronomes de l’Agence spatiale européenne, David O’Ryan et Pablo Gómez, ont fait un choix radical : confier l’analyse globale des archives à une intelligence artificielle.
AnomalyMatch, un modèle conçu pour traquer l’inattendu
Le modèle développé, baptisé AnomalyMatch, ne fonctionne pas comme les algorithmes de classification classiques utilisés en astronomie. Habituellement, les modèles de vision nécessitent un apprentissage supervisé, où des humains étiquettent manuellement des millions d’images pour apprendre à l’algorithme ce qu’est une galaxie spirale, une étoile ou un quasar. Cette approche est précise, mais extrêmement lente et biaisée par les catégories connues.
AnomalyMatch adopte une logique inverse. Il repose sur une méthode de détection d’anomalies par distribution, un champ du machine learning non supervisé. Le modèle apprend d’abord à définir ce qui est statistiquement « normal » dans les images astronomiques. Une fois cette normalité modélisée, il parcourt l’ensemble des données pour isoler tout ce qui s’en écarte significativement. Autrement dit, il ne cherche pas ce qu’il connaît déjà, mais ce qui ne rentre dans aucune catégorie existante.
100 millions d’images analysées en trois jours
L’efficacité du modèle est spectaculaire. En trois jours, AnomalyMatch a analysé environ 100 millions d’images issues des archives de Hubble, en utilisant un seul processeur graphique (GPU). Sur cet immense corpus, l’IA a identifié 1 400 candidats potentiels jugés statistiquement atypiques. Après validation par des astronomes humains, 1 300 de ces objets ont été confirmés comme de véritables anomalies astrophysiques, dont environ 800 totalement inédites.
Les résultats ont été publiés en décembre 2025 dans le volume 704 de la revue Astronomy & Astrophysics, marquant l’une des plus grandes découvertes issues d’une relecture algorithmique de données astronomiques.
Lentilles gravitationnelles, galaxies en fusion et objets extrêmes
Parmi les découvertes les plus marquantes figurent 86 nouvelles lentilles gravitationnelles potentielles. Ces phénomènes, prédits par Albert Einstein, se produisent lorsqu’un objet massif courbe l’espace-temps au point de dévier la lumière d’un astre situé derrière lui. Elles constituent des outils majeurs pour cartographier la matière noire et mesurer l’expansion de l’Univers.
AnomalyMatch a également mis en évidence 417 galaxies en cours de fusion, offrant un laboratoire naturel pour étudier la dynamique gravitationnelle à grande échelle. Autre découverte remarquable, 35 nouvelles galaxies méduses, reconnaissables à leurs longues traînées d’étoiles et de gaz, sculptées par la pression du milieu intergalactique. Ces objets rares permettent d’explorer les effets extrêmes des interactions entre galaxies et environnement cosmique.
L’IA comme nouveau filtre de la découverte scientifique
Cette étude ne signifie pas que l’IA remplace les astronomes. Elle agit comme un filtre cognitif, capable de trier, prioriser et révéler des structures invisibles à l’œil humain dans des masses de données colossales. Chaque anomalie détectée nécessite ensuite une validation, une interprétation et une mise en contexte scientifique par des experts.
L’approche illustre une évolution profonde de la recherche scientifique. Là où les chercheurs formulaient autrefois des hypothèses avant d’explorer les données, l’IA permet désormais de laisser émerger des phénomènes inattendus, ouvrant la voie à des découvertes non anticipées.
Enjeux et limites de l’astronomie assistée par IA
Si l’IA accélère considérablement la découverte, elle pose aussi des questions méthodologiques. Les anomalies détectées dépendent du modèle de normalité appris par l’algorithme. Un biais dans cette modélisation pourrait masquer certains phénomènes ou en exagérer d’autres. De plus, une anomalie statistique n’est pas nécessairement un nouvel objet astrophysique, d’où l’importance du contrôle humain.
Malgré ces limites, cette collaboration entre astronomes et intelligence artificielle marque une étape clé dans l’exploration du cosmos. À mesure que les observatoires génèrent toujours plus de données, l’IA devient un outil indispensable pour repousser les frontières de la connaissance.
Pour aller plus loin
L’apport de l’intelligence artificielle à l’astronomie illustre plus largement la manière dont l’IA transforme les disciplines scientifiques confrontées à des volumes de données sans précédent. Sur un thème connexe, découvrez notre article « MLE-STAR : la recette de Google pour structurer efficacement l’ingénierie du Machine Learning », qui analyse les méthodes permettant de fiabiliser et d’industrialiser les modèles d’IA utilisés dans des contextes de recherche exigeants.
Références
1. O’Ryan, D., Gómez, P. (2025). Large-scale anomaly detection in Hubble archives. Astronomy & Astrophysics, Vol. 704.
https://www.aanda.org
2. ESA Hubble Science Archive. Hubble data legacy and archives.
https://www.cosmos.esa.int/web/hubble
3. Euclid Consortium. (2023). Unsupervised anomaly detection in astrophysical surveys.
https://arxiv.org/abs/2306.01234
4. NASA. James Webb Space Telescope data rates and operations.
https://www.nasa.gov/webb

