Skip to content
GitHub Twitter
Volver al blog

La sorpresa de DeepSeek

3 min de lectura

DeepSeek es una empresa de IA china, fundada en julio de 2023, que de repente apareció como el Sputnik chino de la IA con un modelo de lenguaje sorprendente.

Desarrollan modelos de lenguaje (LLMs) open-source, potentes y baratos, muy baratos en comparación con otros modelos occidentales como GPT, Gemini o Claude, e incluso rivalizando con otros modelos chinos como Kimi, GLM...

¿Demasiado bonito para ser verdad, ¿no?

Liang Wenfeng (梁文峰), un millennial chino nacido en 1985 en una zona rural de Guangdong, es un hedge fund quant (inversor cuantitativo). Cofundó High-Flyer Capital (o 幻方量化) alrededor de 2015-2016, un fondo de inversión que usa IA para tradear en la bolsa china y que supuestamente amasó una fortuna de cientos de miles de millones de yuanes. Liang viene de Ingeniería Electrónica en la Universidad de Zhejiang y siempre estuvo obsesionado con la IA.

Vamos, que no tiene nada que ver con los típicos ingenieros y científicos de Silicon Valley.

Ahora bien, ¿es realmente todo cierto? Pues si bien diría que no están tan «inteligentes» como dicen, DeepSeek V4 Pro es suficientemente capaz para hacer cualquier tarea, pero lo que realmente me ha sorprendido es la versión flash. Su capacidad de razonamiento y de realizar tareas no muy complejas es de 10, a una velocidad más que aceptable y a un precio...

DeepSeek

Sí, a un precio que deja a otros modelos como Claude y la pesadilla de sus tokens (hoy a 10 de mayo de 2026 han duplicado la cuota) a la altura del betún. Se acabó el estar pensando en llegar a la cuota horaria o semanal solo con decirle hola. Aquí por unos cuantos céntimos tienes horas de trabajo, quizás no de la mayor calidad, pero sí trabajo eficiente y rápido.

¿Teorías de la conspiración? Sobre DeepSeek se ha hablado de todo: troyanos, puertas traseras (backdoors), etc. Personalmente, yo no daría la información de mis clientes, API keys, etc., a un modelo como este en el que no tienes soberanía sobre los datos (si es que alguien te garantiza este punto), pero lo que está claro es que están subvencionando el modelo para que lo entrenemos, y hasta cierto punto no me parece un mal intercambio. Ellos ofrecen servicio barato, nosotros ofrecemos horas y cientos de líneas de código para entrenar al modelo. Win-win.

Veremos si la geopolítica no acaba entrando en el juego, pero de momento es un modelo muy recomendable para tareas pesadas.

Visítalos en platform.deepseek.com