IA

LongCat 2.0 venció a GPT-5.5 en código sin usar chips Nvidia — y lo creó una app de delivery

Susan Hill

LongCat 2.0 tiene 1,6 billones de parámetros, una ventana de contexto de un millón de tokens, y le ganó a GPT-5.5 en el benchmark más usado para medir ingeniería de software en el mundo real. Lo construyó Meituan, una empresa que fuera de China la mayoría conoce, si la conoce, como app de delivery.

El modelo obtuvo 59,5 en SWE-bench Pro contra 58,6 de GPT-5.5. La diferencia parece chica, pero lo que hace importante el resultado es cómo se logró: Meituan entrenó LongCat 2.0 en más de 50.000 aceleradores de IA chinos, sin hardware de Nvidia, que China no puede importar en cantidad desde 2022. El fabricante no fue confirmado, pero los analistas apuntan al Huawei Ascend 910B. Si es correcto, sería la primera vez que un modelo entrenado con chips Huawei alcanza rendimiento de frontera en benchmarks públicos.

LongCat 2.0 usa arquitectura Mixture-of-Experts: solo activa entre 33.000 y 56.000 millones de parámetros por consulta, lo que lo mantiene rápido sin requerir hardware de alta gama. La ventana de contexto de un millón de tokens permite leer toda una base de código en una sola sesión. En SWE-bench Multilingual sacó 77,3; en Terminal-Bench, que evalúa la navegación en entornos Unix reales, llegó a 70,8.

Antes del anuncio oficial, el modelo operó en OpenRouter con el nombre “Owl Alpha” por dos meses. Los desarrolladores que lo usaron notaron su capacidad inusual en código pero no sabían de dónde venía. Meituan confirmó después que Owl Alpha era LongCat 2.0 en etapa de evaluación.

La licencia MIT no cuenta todo. Los pesos del modelo todavía no están disponibles: el repositorio de GitHub y la ficha en Hugging Face dicen “próximamente”. Por ahora solo hay acceso mediante API alojada, sin posibilidad de descargarlo, ajustarlo ni ejecutarlo localmente.

Meituan procesa más de 50 millones de pedidos diarios y desarrolló en silencio un modelo interno llamado Zhichi antes de salir al mercado externo. LongCat 2.0 es su primer modelo público y, por rendimiento, uno de los más capaces disponibles con licencia abierta.

Cuando lleguen los pesos, LongCat 2.0 competirá directamente con Llama 4.1 de Meta y DeepSeek-V4 Pro por ser el modelo de código abierto más potente para descargar. La confirmación de qué chips domésticos lo hicieron posible tendrá consecuencias mucho más allá del mundo de la IA.

Etiquetas: , , , , ,

Discussion

There are 0 comments.