Líderes Empresariales

Liang Wenfeng creó el modelo de IA que nadie creyó posible, y después desapareció

Penelope H. Fritz
Liang Wenfeng
Liang Wenfeng
Nacimiento1 de enero de 1985
Zhanjiang
OcupaciónEmprendedor tecnológico e investigador en IA
PremiosTime 100 u00b7 Nature’s 10

El mes de enero de 2025 fue complicado para los grandes de Silicon Valley. DeepSeek-R1 llegó al primer lugar de la App Store de iOS en Estados Unidos, desplazó a ChatGPT y borró cerca de un billón de dólares del valor bursátil de las empresas de tecnología en cuestión de días. El modelo fue entrenado con cinco punto seis millones de dólares. Sus competidores habían gastado cientos de millones. Liang Wenfeng fue quien hizo posible eso. Y desde que se reunió con el presidente Xi Jinping en febrero de 2025, no ha dicho nada.

Creció en Wuchuan, una ciudad de la provincia de Guangdong. Sus padres eran maestros de primaria. Desde joven mostró una habilidad fuera de lo común para las matemáticas: aprendió cálculo avanzado por su cuenta en secundaria y fue el mejor de su región en el examen de ingreso a la universidad. Entró a la Universidad de Zhejiang a los diecisiete años. Estudió ingeniería de información electrónica y luego hizo una maestría en ingeniería de información y comunicaciones. Su tesis era sobre algoritmos para rastrear objetos con cámaras de bajo costo. No parecía el punto de partida de una revolución global en inteligencia artificial.

Cuando la crisis de 2008 sacudió los mercados financieros, comenzó a explorar el uso del aprendizaje automático en operaciones de trading. Años después, en 2016, cofundó High-Flyer Capital Management (幻方量化) en Hangzhou con dos compañeros de universidad. El fondo se convirtió en uno de los más exitosos de China: más de setenta mil millones de yuanes administrados, rentabilidades promedio superiores al cincuenta por ciento en 2025. Lo que diferenciaba a High-Flyer de la competencia era la infraestructura computacional. Desde 2021 Liang compró miles de chips Nvidia A100 para entrenar modelos de aprendizaje profundo. Nadie pensó que estaba preparando otra cosa.

En julio de 2023 fundó DeepSeek como una derivación de High-Flyer. El propósito declarado era investigación básica en inteligencia artificial, sin productos comerciales ni hojas de ruta trimestrales. El equipo tenía unos ciento sesenta ingenieros e investigadores de distintas disciplinas. El presupuesto era una fracción de lo que gastaban OpenAI o Google. DeepSeek-V3, publicado a finales de 2024, costó aproximadamente seis millones de dólares en entrenamiento. DeepSeek-R1, publicado el 20 de enero de 2025, fue aún más eficiente en términos de costo y superó en descargas a ChatGPT en el mercado estadounidense.

El relato inmediato —que DeepSeek demostró que gastar miles de millones en IA era un error— fue más simple que la realidad. La infraestructura de GPU de High-Flyer fue construida antes de las sanciones más estrictas de exportación. La ingeniería que permitió hacer más con menos requería conocimiento muy especializado. Lo que DeepSeek sí demostró fue que la innovación arquitectónica puede bajar el costo marginal de entrenar un modelo poderoso. No que cualquiera puede hacerlo con poco dinero, sino que quienes saben qué están haciendo pueden hacerlo de manera mucho más eficiente.

Después de reunirse con Xi Jinping en febrero de 2025, Liang Wenfeng desapareció de la escena pública. No dio entrevistas. No asistió a conferencias. Su empresa siguió publicando modelos: DeepSeek-V4 en abril de 2026, mientras la compañía buscaba trescientos millones de dólares en nueva inversión. Él no explicó nada de esto.

Sobre su vida privada no hay información verificada. No hubo cónyuge ni hijos confirmados en ningún medio. Nunca tuvo redes sociales.

DeepSeek seguirá lanzando modelos. La empresa no muestra señales de detenerse. La pregunta que queda abierta es si Liang Wenfeng volverá a hablar en algún momento, o si dejará que el trabajo siga respondiendo por él.

Etiquetas: , , , , ,

Discussion

There are 0 comments.