Un nouveau test d’IA générale met en difficulté les modèles d’intelligence artificielle
La Fondation Arc Prize vient de dévoiler ARC-AGI-2, un test révolutionnaire conçu pour évaluer l’intelligence générale artificielle. Et surprise : même les modèles d’IA les plus avancés peinent à obtenir plus de 1% de réussite. C’est comme si on demandait à un champion d’échecs de jongler avec des tronçonneuses – techniquement impressionnant, mais clairement pas dans sa zone de confort !
Une nouvelle approche pour mesurer l’intelligence artificielle
Développé par François Chollet, chercheur renommé en IA, ARC-AGI-2 représente une évolution majeure dans l’évaluation des capacités cognitives des IA.
- Test basé sur des puzzles visuels complexes
- Évaluation de la capacité d’adaptation en temps réel
- Mesure de l’efficience plutôt que la simple performance
Des résultats surprenants
Les performances actuelles sont édifiantes :
– Humains : 60% de réussite en moyenne
– Meilleurs modèles d’IA : 1-1,3% de réussite
– OpenAI o3 (version économique) : 4% pour 200$ par tâche
Une révolution dans l’évaluation de l’IA
Le nouveau test introduit deux innovations majeures :
- Métrique d’efficience énergétique
- Évaluation en temps réel des capacités d’adaptation
Impact sur l’industrie de l’IA
Cette nouvelle approche bouleverse la façon dont nous évaluons l’intelligence artificielle, avec des implications majeures pour le développement futur des modèles d’IA.
FAQ
Pourquoi ce test est-il différent des précédents ?
ARC-AGI-2 évalue non seulement la capacité à résoudre des problèmes mais aussi l’efficience du processus de résolution.
Quel est l’objectif du concours Arc Prize 2025 ?
Atteindre 85% de précision avec un budget maximal de 0,42$ par tâche.
Conclusion
ARC-AGI-2 marque un tournant dans l’évaluation de l’intelligence artificielle, révélant les limites actuelles des modèles les plus avancés tout en ouvrant la voie à une nouvelle génération d’IA plus efficientes et adaptatives.
Cette avancée souligne l’importance croissante de développer des IA capables non seulement de résoudre des problèmes complexes, mais de le faire avec intelligence et efficacité.



