IA

Una IA de Google resolvió problemas matemáticos sin respuesta desde hace 56 años

Susan Hill

Un sistema de investigación de Google DeepMind generó demostraciones completas y verificadas por computadora para nueve problemas abiertos que planteó el matemático Paul Erdős, dos de ellos sin resolver durante 56 años. El mismo sistema cerró 44 conjeturas tomadas de la Enciclopedia en Línea de Secuencias de Enteros, resolvió una pregunta de geometría algebraica que llevaba 15 años abierta y afinó una cota conocida en optimización convexa. El número llamativo importa menos que el método. Cada una de estas demostraciones la verificó una computadora, no solo la afirmó.

Erdős, que murió en 1996, dejó cientos de preguntas precisas y tercas, muchas fáciles de enunciar y brutalmente difíciles de cerrar. Con los años se volvieron una especie de examen permanente para la disciplina. Las conjeturas de secuencias salen de una base de datos pública que los matemáticos revisan en busca de patrones, donde una fórmula intuida puede quedar sin probar durante años. No son pruebas de laboratorio hechas para halagar a un modelo. Son el verdadero atraso de la matemática abierta.

Esa distinción lo es todo. El sistema, llamado AlphaProof Nexus, escribe sus argumentos en Lean, un lenguaje formal cuyo compilador rechaza cualquier paso que no pueda confirmar. Una demostración pasa o no pasa, sin lugar para un párrafo seguro que después resulta falso. Para quien intente juzgar si un ‘descubrimiento’ de IA es real, esa es la frontera entre un boletín de prensa y un resultado.

Por dentro, el demostrador corre sobre Gemini 3.1 Pro, con un modelo más liviano a cargo de las tareas de clasificación. El ciclo es casi aburrido. El modelo redacta una prueba en Lean, el compilador devuelve los errores y esos errores alimentan el siguiente intento. Lo que sostiene la honestidad es la retroalimentación simbólica, no la prosa fluida. El equipo armó cuatro versiones de complejidad creciente, una capaz de generar y ordenar bocetos de demostración rivales. Y aun así, la versión más simple, un mero ciclo de modelo y compilador, resolvió sola los nueve problemas de Erdős.

La economía es la parte silenciosamente asombrosa. Cada problema resuelto costó unos cientos de dólares en tiempo de cómputo. Preguntas que habían consumido carreras enteras se cerraron por casi el precio de una escapada de fin de semana. Esto no jubila al matemático. Alguien todavía tiene que elegir qué problemas vale la pena atacar, plantearlos en una forma que el sistema pueda leer y decidir qué significa una respuesta. Lo que cambia es la aritmética de lo que vale la pena intentar.

Las advertencias pesan más que el título. Nueve resueltos de 353 problemas de Erdős intentados es una tasa de acierto cercana al 2,5 por ciento. La cifra de secuencias, 44 de 492, queda por debajo del nueve por ciento. Los autores admiten sin rodeos que la mayoría de estos problemas sigue fuera de alcance, y más todavía los que piden teoría nueva y extensa, y que los aciertos se concentran donde la biblioteca matemática de Lean ya es profunda. Sin ese andamiaje hecho por humanos y sin la lista curada de objetivos, al sistema le queda poco piso firme.

La cautela está justificada. En un episodio muy burlado, un laboratorio rival anunció que su modelo había resuelto diez problemas de Erdős, hasta que los matemáticos advirtieron que las respuestas ya estaban en la literatura publicada. El modelo las había encontrado, no demostrado. AlphaProof Nexus está diseñado para ser inmune a ese error. Una demostración en Lean de un resultado conocido sigue siendo válida, y una demostración en Lean de algo genuinamente nuevo no se puede fingir. Demis Hassabis, al frente de DeepMind, insistió en aclarar que el trabajo no es inteligencia artificial general, una nota poco común de prudencia en una empresa rara vez tímida con sus modelos.

Hay una recompensa más sutil que destacan los investigadores. Incluso los fracasos sirvieron. Como cada prueba parcial se comprueba de forma rigurosa, los matemáticos pudieron ver con exactitud qué submetas lograba cerrar el sistema y cuáles no, sin revisar a mano todo el argumento. La máquina deja de ser un oráculo y se vuelve un colaborador incansable que muestra su trabajo y señala dónde sigue escondida la parte difícil.

El resultado no llega solo. Coincide con otra afirmación de un modelo de razonamiento rival, que según se informó refutó una conjetura de Erdős de unos 80 años en geometría discreta, un hallazgo que matemáticos en activo refinaron y respaldaron. Dos laboratorios, dos métodos, uno apoyado en la verificación formal y el otro en cadenas de razonamiento en bruto, llegaron a la misma frontera con semanas de diferencia. La competencia ya no se trata de chatbots que suenan ingeniosos.

El trabajo se detalló en un artículo que se publicó este mes, y los métodos se apoyan en herramientas abiertas, en concreto Lean y su biblioteca construida por la comunidad, así grupos externos pueden inspeccionar y volver a correr las demostraciones en lugar de creerle a un blog corporativo. DeepMind no dijo si el sistema llegará a investigadores fuera de la empresa. La cifra que conviene vigilar no es nueve. Es si ese 2,5 por ciento se convierte en diez, y después en veinte, porque el día en que pase, la discusión sobre para qué sirven estas máquinas tendrá que empezar de cero.

Discussion

There are 0 comments.