Tu suis la course aux modèles IA ?
Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
ChatGPT 5.5 Pro : une avancée sans précédent en mathématiques
Le mathématicien britannique Timothy Gowers, lauréat de la médaille Fields, a récemment mis en lumière les capacités impressionnantes du modèle ChatGPT 5.5 Pro d'OpenAI. Gowers, qui occupe la chaire de combinatoire au Collège de France et est membre du Trinity College de Cambridge, a utilisé ce modèle pour s'attaquer à des problèmes ouverts en théorie des nombres. En moins de deux heures, l'intelligence artificielle a produit des articles scientifiques complets, sans aucune intervention humaine. Selon Gowers, la qualité des résultats atteint un niveau doctoral, avec des améliorations significatives des bornes mathématiques existantes.
Isaac Rajagopal, un jeune chercheur impliqué dans cette initiative, a qualifié l'idée clé du modèle de "complètement originale", une réalisation dont un mathématicien humain serait fier après des semaines de réflexion. Gowers a souligné que sa propre contribution mathématique était nulle, le modèle ayant réalisé tout le travail en un temps record. "Je n'ai même pas fait quelque chose d'intelligent avec les prompts," écrit-il sur son blog.
Résolution rapide de problèmes complexes
Gowers a fourni à ChatGPT 5.5 Pro des problèmes issus d'un article du théoricien des nombres Mel Nathanson. Cet article examine les tailles possibles de certains ensembles de sommes entières et l'efficacité de la construction d'ensembles avec des propriétés prescrites. Nathanson avait prouvé une borne exponentielle pour l'un des problèmes et s'était demandé si elle pouvait être améliorée. L'IA a résolu ce problème mathématique ouvert en seulement 17 minutes et 5 secondes, améliorant une borne exponentielle à une borne quadratique. L'idée centrale : le modèle a remplacé un composant dans la preuve de Nathanson par une variante plus efficace, bien connue en combinatoire, mais dont l'application à ce problème particulier n'était pas évidente.
Lorsqu'on lui a demandé, ChatGPT a réécrit l'argument sous forme de prépublication LaTeX en 2 minutes et 23 secondes. Gowers a vérifié sa justesse, puis a demandé au modèle de résoudre une variante connexe, ce qu'il a fait sans problème. Les deux résultats sont disponibles sous forme de prépublication.
Une collaboration homme-machine en évolution
Une version généralisée du problème s'est révélée beaucoup plus difficile. Ici, il y avait un travail préalable d'Isaac Rajagopal, un étudiant du MIT qui avait prouvé une dépendance exponentielle. Gowers a donné à ChatGPT l'article de Rajagopal et a demandé une amélioration. Ce qui a suivi a été une escalade progressive : après 16 minutes et 41 secondes, le modèle a fourni une première amélioration. Rajagopal a jugé cette étape correcte mais l'a qualifiée de "modification routinière" de son propre travail. Gowers a ensuite été, comme il le dit, "avide" et a demandé à ChatGPT d'essayer d'obtenir une borne beaucoup plus forte.
Après 13 minutes et 33 secondes, le modèle a signalé de l'optimisme mais a indiqué que deux déclarations techniques devaient encore être vérifiées. 9 minutes et 12 secondes plus tard, la vérification était terminée. La prépublication finale était prête en 31 minutes et 40 secondes. Le modèle avait amélioré la borne d'exponentielle à polynomiale. Selon Gowers, Rajagopal a déclaré que les résultats étaient "presque certainement corrects", tant au niveau des étapes de preuve individuelles que des idées sous-jacentes.
"Le genre d'idée dont je serais très fier d'avoir eu après une ou deux semaines de réflexion"
Rajagopal qualifie l'idée clé du modèle de "plutôt ingénieuse". Elle a trouvé un moyen contre-intuitif de compresser certaines structures algébriques afin qu'elles s'insèrent dans une plage de nombres beaucoup plus petite sans perdre leurs propriétés combinatoires cruciales. "C'est le genre d'idée dont je serais très fier d'avoir eu après une ou deux semaines de réflexion, et il a fallu à ChatGPT moins d'une heure pour la trouver et la prouver, en utilisant des méthodes similaires à celles de ma propre preuve," écrit Rajagopal. Pour autant qu'il puisse en juger, l'idée était "complètement originale".
Gowers place le résultat au niveau "d'un chapitre parfaitement raisonnable dans un doctorat en combinatoire", affirmant que ce n'est pas un "résultat incroyable", car il s'appuie fortement sur les idées de Rajagopal, mais c'est "définitivement une extension non triviale". Pour un étudiant en doctorat, cela aurait pris un temps considérable pour parcourir l'article de Rajagopal, identifier les faiblesses et adapter les techniques, dit Gowers.
Il tire des conclusions de grande portée : "La barre pour contribuer aux mathématiques sera désormais de prouver quelque chose que les LLM ne peuvent pas prouver, plutôt que simplement de prouver quelque chose que personne n'a prouvé jusqu'à présent et que quelqu'un trouve au moins intéressant." Il précise cependant que les étudiants en doctorat pourraient utiliser les LLM comme un outil. La véritable tâche consistera alors à créer quelque chose en collaboration avec les LLM que les modèles ne peuvent pas faire seuls.
Gowers propose une expérience de pensée : "Supposons qu'un mathématicien résolve un problème majeur en ayant un long échange avec un LLM dans lequel le mathématicien joue un rôle de guide utile mais où l'LLM a fait tout le travail technique et avait les idées principales. Considérerions-nous cela comme une grande réalisation du mathématicien ? Je ne pense pas."
Cependant, il voit de la valeur dans la lutte pour faire des mathématiques soi-même. Ceux qui ont résolu des problèmes difficiles par eux-mêmes acquièrent des insights sur le processus de résolution de problèmes que l'on ne peut tout simplement pas obtenir en lisant. "Tout comme les très bons codeurs sont meilleurs en codage intuitif que les codeurs moins bons," écrit Gowers. Sa prédiction : quiconque commence un doctorat aujourd'hui et termine au plus tôt en 2029 verra la recherche mathématique "transformée au-delà de toute reconnaissance" d'ici là.
Cela fait écho à la vision du mathématicien vedette Terence Tao, qui a décrit une "mathématique à échelle industrielle" propulsée par des outils d'IA, où de grandes équipes soutenues par l'IA mènent des recherches larges plutôt que des solitaires travaillant sur des problèmes étroits pendant des années.
À l'époque, cependant, Tao comparait les modèles d'IA à des assistants de recherche "médiocres, mais pas complètement incompétents". L'expérience de Gowers avec ChatGPT 5.5 Pro suggère que cette évaluation pourrait déjà être dépassée. Les derniers commentaires de Tao ont également été beaucoup plus positifs.
L'IA générative continue de s'enfoncer plus profondément dans les mathématiques
Un exemple précoce de l'IA dans la recherche mathématique a été l'utilisation de GPT-5 comme outil de recherche. Les chercheurs d'OpenAI ont affirmé qu'un modèle GPT avait "trouvé" la solution à un problème d'Erdős. En réalité, l'IA avait simplement retrouvé une solution existante dans la littérature et n'avait pas développé sa propre preuve.
Un saut clair a eu lieu lorsque GPT-5.2 Pro a résolu le problème d'Erdős n° 728 "plus ou moins de manière autonome", selon Tao. Aucune solution correspondante ne pouvait être trouvée dans la littérature existante. Ensuite, GPT-5.4 Pro est allé plus loin, résolvant un problème d'Erdős ouvert depuis longtemps.
Des progrès ont également été observés dans d'autres domaines. En décembre 2025, un physicien a publié un article dont l'idée centrale provenait de GPT-5. L'auteur s'attend à ce que les collaborations hybrides homme-IA deviennent la norme en mathématiques, en physique et dans d'autres sciences formelles avant longtemps. À mesure que les modèles de langage deviennent plus précis, ils pourraient de plus en plus fonctionner comme des agents de recherche autonomes.
Pourquoi tirer des conclusions hâtives est risqué
Google DeepMind a connu à la fois des percées et des taux d'échec préoccupants avec son agent d'IA Aletheia. Le système, construit sur Gemini Deep Think, a indépendamment écrit un article mathématique, réfuté une hypothèse vieille de plusieurs décennies et découvert une erreur dans un article de cryptographie. Mais lorsque les chercheurs l'ont testé systématiquement sur 700 problèmes mathématiques ouverts, seulement 6,5 % de ses réponses se sont révélées utilisables.
Tao a fait un point similaire de manière cohérente. Les problèmes d'Erdős varient en difficulté de "plusieurs ordres de grandeur", note-t-il. Ce n'est pas parce qu'un problème a 50 ans et qu'une IA le résout qu'il a résisté à tous les efforts humains pendant un demi-siècle. Souvent, personne ne s'y est sérieusement attaqué.



