OpenAI : Mathématiques, clé de l'AGI selon ses chercheurs

⚡

Key Takeaways

1Sebastian Bubeck et Ernest Ryu d'OpenAI expliquent pourquoi les mathématiques sont essentielles pour atteindre l'intelligence générale artificielle.

2Ernest Ryu a résolu un problème vieux de 42 ans sur la méthode de Nesterov grâce à ChatGPT, démontrant l'efficacité des modèles d'IA.

3Les mathématiques servent de critère de référence pour l'AGI, nécessitant un raisonnement long et cohérent, crucial pour le développement de systèmes intelligents.

💡Why it matters — Les avancées mathématiques par l'IA pourraient transformer d'autres sciences, accélérant la recherche et l'innovation.

L'importance des mathématiques pour l'AGI selon OpenAI

Les modèles d'intelligence artificielle ont connu une avancée spectaculaire, passant de simples calculs arithmétiques à des mathématiques de niveau olympique en seulement deux ans. Dans un podcast d'OpenAI, les chercheurs Sebastian Bubeck et Ernest Ryu ont discuté de la manière dont les mathématiques sont devenues un test crucial sur la route vers l'intelligence générale artificielle (AGI).

Il y a quatre ans, Bubeck était impressionné par le modèle Minerva de Google, capable de tracer une ligne à travers des points sur un système de coordonnées. Aujourd'hui, il affirme que ces systèmes assistent même les lauréats de la Médaille Fields dans leur travail quotidien. Lors d'une conférence il y a 18 mois, 80 % des mathématiciens présents pensaient qu'il était impossible que des modèles de langage de grande taille puissent résoudre des problèmes de recherche.

Les modèles de raisonnement n'existaient pas il y a deux ans, ce qui souligne l'ampleur des progrès réalisés. Les méthodes de formation d'OpenAI ne sont pas spécifiques aux mathématiques, mais générales, ce qui signifie que des progrès dans d'autres sciences devraient suivre. Les chercheurs construisent un "chercheur automatisé" capable de travailler sur des problèmes de manière autonome sur de longues périodes.

Un exploit mathématique avec ChatGPT

Ernest Ryu, ancien professeur de mathématiques à UCLA, a utilisé ChatGPT pour résoudre un problème ouvert en théorie de l'optimisation, vieux de 42 ans, concernant la méthode de Nesterov. En seulement douze heures réparties sur trois soirées, il a réussi là où il avait échoué après plus de 40 heures de travail sans l'aide de l'IA. Ryu a agi en tant que vérificateur, corrigeant les erreurs et guidant l'IA vers des solutions prometteuses.

Les mathématiques comme critère de référence pour l'AGI

Pour Bubeck, les mathématiques sont devenues un critère de référence pour l'AGI car elles nécessitent un raisonnement long et cohérent. Une seule erreur peut invalider une preuve entière, ce qui oblige les systèmes à repérer et corriger leurs propres erreurs. Cette rigueur est transférable à d'autres domaines scientifiques, de la biologie à la science des matériaux.

Les mathématiques offrent également des avantages pratiques : les problèmes sont clairement énoncés, les réponses vérifiables, et les résultats incontestés. Bubeck parle de "temps AGI", où les modèles peuvent simuler la pensée humaine sur des périodes prolongées. Le prochain objectif est d'étendre cette capacité à des semaines, voire des mois.

Les défis des problèmes d'Erdős

Bubeck et Ryu se sont également intéressés aux problèmes d'Erdős, une collection de questions ouvertes laissées par le mathématicien hongrois. Bubeck a initialement tweeté que les modèles internes avaient trouvé des solutions à dix problèmes marqués comme ouverts, ce qui a déclenché une querelle publique avec le PDG de Google, Demis Hassabis. Beaucoup ont interprété cela comme une affirmation qu'OpenAI avait produit de nouvelles preuves. Bubeck clarifie maintenant que ChatGPT et les modèles internes ont réellement produit plus de dix solutions nouvelles dignes de publication.

Ce qui semblait être une affirmation irréaliste est désormais une réalité, et le rythme s'accélère. Bubeck considère cela comme une preuve que les modèles font le saut de la recombinaison des connaissances existantes à la production de nouvelles mathématiques.

Les risques d'une utilisation superficielle de l'IA

Les chercheurs mettent en garde contre une utilisation superficielle de ces outils. L'expertise humaine est plus importante que jamais, car seuls des mathématiciens formés peuvent utiliser les modèles de manière productive. Les non-mathématiciens qui publient de longues preuves générées par l'IA sur les réseaux sociaux se trompent généralement. Ryu observe le même schéma en programmation, où toute une génération perd la capacité d'utiliser des débogueurs.

Bubeck affirme que les affirmations selon lesquelles les scientifiques ne sont plus nécessaires sont dangereuses. Les institutions académiques doivent activement reprendre leur rôle. En même temps, l'IA peut accélérer la vérification des preuves - un processus qui prend actuellement des années - et signaler les problèmes dans les articles publiés.