Durante el fin de semana, Neel Somani, ingeniero de software program, ex investigador cuantitativo y fundador de una startup, estaba probando las habilidades matemáticas del nuevo modelo de OpenAI cuando hizo un descubrimiento inesperado. Después de pegar el problema en ChatGPT y dejarlo pensar durante 15 minutos, encontró una solución completa. Evaluó la prueba y la formalizó con una herramienta llamada Harmonic, pero todo salió bien.
“Tenía curiosidad por establecer una línea de base para saber cuándo los LLM son efectivamente capaces de resolver problemas matemáticos abiertos en comparación con aquellos en los que tienen dificultades”, dijo Somani. La sorpresa fue que, utilizando el último modelo, la frontera empezó a avanzar un poco.
ChatGPT cadena de pensamiento es aún más impresionante, al recitar axiomas matemáticos como La fórmula de Legendre., El postulado de Bertrandy el teorum de la estrella de david. Finalmente, el modelo encontró una publicación de Math Overflow de 2013donde el matemático de Harvard Noam Elkies había dado una elegante solución a un problema related. Pero la prueba last de ChatGPT difería del trabajo de Elkies en aspectos importantes y proporcionó una solución más completa a una versión del problema planteado por el legendario matemático Paul Erdős, cuya vasta colección de problemas sin resolver se ha convertido en un campo de pruebas para la IA.
Para cualquiera que sea escéptico respecto de la inteligencia synthetic, se trata de un resultado sorprendente… y no es el único. Las herramientas de IA se han vuelto omnipresentes en matemáticas, desde LLM orientados a la formalización como Aristóteles de Harmonic hasta herramientas de revisión de literatura como la investigación profunda de OpenAI. Pero desde el lanzamiento de GPT 5.2, que Somani describe como “anecdóticamente más hábil en razonamiento matemático que iteraciones anteriores”, el gran volumen de problemas resueltos se ha vuelto difícil de ignorar, lo que plantea nuevas preguntas sobre la capacidad de los grandes modelos de lenguaje para ampliar las fronteras del conocimiento humano.
Somani estaba analizando los problemas de Erdős, un conjunto de más de mil conjeturas del matemático húngaro que son mantenido en línea. Los problemas se han convertido en un objetivo tentador para las matemáticas impulsadas por la IA y varían significativamente tanto en el tema como en la dificultad. El primer lote de soluciones autónomas llegó en noviembre de un modelo impulsado por Gemini llamado AlphaEvolve – pero más recientemente, Somani y otros han descubierto que GPT 5.2 es notablemente hábil con las matemáticas de alto nivel.
Desde Navidad, 15 problemas han pasado de “abiertos” a “resueltos” en el sitio internet de Erdős, y 11 de las soluciones han acreditado específicamente a los modelos de IA como involucrados en el proceso.
El venerado matemático Terence Tao tiene una visión más matizada del progreso en su página de GitHubcontando ocho problemas diferentes en los que los modelos de IA lograron avances autónomos significativos en un problema de Erdős, con otros seis casos en los que se lograron avances localizando y aprovechando investigaciones previas. Está muy lejos de que los sistemas de IA puedan hacer matemáticas sin intervención humana, pero está claro que los modelos grandes tienen un papel importante que desempeñar.
Evento tecnológico
san francisco
|
13-15 de octubre de 2026
En mastodonteTao conjeturó que la naturaleza escalable de los sistemas de IA los hace “más adecuados para ser aplicados sistemáticamente a la ‘larga cola’ de oscuros problemas de Erdős, muchos de los cuales en realidad tienen soluciones sencillas”.
“Como tal, muchos de estos problemas más fáciles de Erdős ahora tienen más probabilidades de resolverse mediante métodos puramente basados en IA que por medios humanos o híbridos”, continuó Tao.
Otra fuerza impulsora es un reciente cambio hacia la formalización, una tarea que requiere mucha mano de obra y que hace que el razonamiento matemático sea más fácil de verificar y ampliar. La formalización no requiere el uso de IA ni siquiera computadoras, pero una nueva generación de herramientas automatizadas ha hecho el proceso mucho más fácil. El “asistente de pruebas” de código abierto Lean, que fue desarrollado en Microsoft Analysis en 2013, se ha vuelto ampliamente utilizado dentro del campo como una forma de formalizar pruebas, y herramientas de inteligencia synthetic como Aristóteles de Harmonic prometen automatizar gran parte del trabajo de formalización.
Para el fundador de Harmonic, Tudor Achim, el repentino salto en los problemas resueltos de Erdő es menos importante que el hecho de que los más grandes matemáticos del mundo están empezando a tomar esas herramientas en serio. “Me importa más el hecho de que los profesores de matemáticas e informática estén utilizando [AI tools]”, dijo Achim. “Estas personas tienen reputaciones que proteger, así que cuando dicen que usan Aristóteles o ChatGPT, eso es evidencia actual”.













