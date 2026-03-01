El mundo de la inteligencia artificial está a punto de recibir otro golpe directo desde China. DeepSeek, la startup de IA que ya sacudió a Silicon Valley con sus modelos R1 y V3, se prepara para lanzar su próximo gran modelo, el V4, y todo apunta a que el lanzamiento podría ocurrir durante esta semana que comienza el 2 de marzo de 2026. Si las filtraciones y los reportes se confirman, estaríamos frente a uno de los modelos de inteligencia artificial más poderosos que el mundo haya visto.

DeepSeek V4 llega con capacidades multimodales

El Financial Times fue el primer medio en reportar que DeepSeek lanzará su nuevo modelo multimodal V4 “la próxima semana”. Eso nos pone directamente en la primera semana de marzo. El modelo no solo procesará texto como sus antecesores, sino que soportará de forma nativa generación de imágenes, videos y texto, lo que lo convierte en un competidor directo de herramientas como DALL-E, Sora y los modelos más avanzados de Google.

La comunidad en Reddit y X también ha ido convergiendo hacia una misma predicción, con muchos apuntando al 3 de marzo como la fecha más probable de lanzamiento. DeepSeek no ha confirmado nada oficialmente, lo cual es completamente consistente con su estilo de operación, una empresa que casi nunca anuncia nada con anticipación y simplemente aparece con el modelo listo.

Además, según Reuters, DeepSeek ya le dio acceso anticipado a proveedores domésticos chinos, incluyendo a Huawei, mientras que deliberadamente lo retuvo de fabricantes de chips estadounidenses como Nvidia. Eso dice bastante sobre la dirección estratégica que está tomando la empresa.

Benchmarks que ponen a temblar a OpenAI y Anthropic

Aquí viene lo que más ruido está haciendo en la industria. Los reportes internos y las filtraciones sugieren que DeepSeek V4 podría superar tanto a GPT-4 de OpenAI como a Claude de Anthropic en tareas de programación, que es precisamente el campo donde la IA tiene el impacto económico más tangible en este momento.

En el benchmark HumanEval, que mide la capacidad de los modelos para escribir código funcional, se reportan los siguientes resultados estimados para V4:

DeepSeek V4 — 90% de precisión



— 90% de precisión Claude (Anthropic) — 88%



— 88% GPT-4 (OpenAI) — 82%

Más allá del código, el modelo incorpora la arquitectura Engram, una innovación publicada por el fundador de DeepSeek, Liang Wenfeng, en enero de 2026. Esta arquitectura cambia fundamentalmente cómo los modelos de lenguaje gestionan la memoria, separando el almacenamiento de conocimiento del cómputo de inferencia. El resultado práctico es que el modelo puede manejar contextos de más de un millón de tokens sin los costos de GPU que normalmente implicaría esa escala

Otro componente técnico clave es la arquitectura mHC (multiHead Convergence), que resuelve problemas históricos de estabilidad en el entrenamiento de modelos extremadamente anchos, permitiendo que el modelo escale horizontalmente sin degradar la calidad de las respuestas. Todo esto se logra con un enfoque que no depende de tener miles de chips Nvidia de última generación, lo cual es precisamente la filosofía que ha definido a DeepSeek desde sus inicios.

Por qué este lanzamiento importa más allá de los benchmarks

Lo que hace realmente interesante a DeepSeek V4 no es solo que pueda superar a los modelos americanos en papel, sino el modelo de negocio que lo acompaña. DeepSeek históricamente ha lanzado sus modelos como open source, lo que significa que cualquier desarrollador, empresa o investigador en el mundo puede usarlo, modificarlo e integrarlo sin pagar las tarifas que cobra OpenAI o Anthropic.

Esto tiene implicaciones enormes. En un mercado donde el acceso a modelos de frontera cuesta miles de dólares al mes para empresas medianas, un modelo de código abierto que iguala o supera a GPT-4 democratiza el acceso a la IA de una manera que ninguna empresa americana ha estado dispuesta a hacer. Los desarrolladores que trabajan en industrias reguladas, como salud o finanzas, además celebran la posibilidad de correr el modelo localmente sin enviar datos sensibles a servidores externos.

El lanzamiento también llega en un momento de tensión geopolítica. DeepSeek entrenó su nuevo modelo usando los chips más avanzados de Nvidia disponibles, pero al mismo tiempo está priorizando a proveedores chinos para el acceso anticipado, lo cual refleja una estrategia calculada de independencia tecnológica que va mucho más allá de simplemente competir en benchmarks.

Si DeepSeek V4 cumple con lo que prometen los reportes filtrados, el mapa de la inteligencia artificial en 2026 va a lucir muy diferente al de hace apenas doce meses. OpenAI y Anthropic tendrán que responder, y el resto del mundo tendrá acceso gratuito a uno de los modelos más poderosos jamás creados.

Sigue leyendo:

• China roba IA de Estados Unidos: Anthropic denuncia ataque masivo

• DeepSeek, el chatbot barato con el que China desafía a ChatGPT y que genera un terremoto en el mercado de las tecnológicas

• Quién es Liang Wenfeng, el discreto multimillonario chino que creó el revolucionario chatbot de IA DeepSeek