DeepSeek engañó al mercado de IA: su costo real no fue de 6 millones de dólares

DeepSeek sacudió los cimientos de la IA porque, en teoría, se trataba de un LLM muy avanzado que había tenido un coste total de solo 6 millones de dólares. Suena bien, quizá demasiado bien para ser verdad, y los datos de un estudio compartido por SemiAnalysis han confirmado que todo ha sido una mentira que nos hemos querido creer.

El verdadero coste del entrenamiento de DeepSeek

El estudio que han elaborado parte de una clave tan básica como importante, el coste del hardware necesario para entrenar a DeepSeek. Para sacar adelante ese entrenamiento se utilizaron GPUs NVIDIA, concretamente bloques de modelos H800 y H100, cuyo coste total es de unos 1.600 millones de dólares. A esto debemos sumar el coste operativo de mantener y utilizar esos bloques, que sería de unos 944 millones de dólares.

La magnitud del proyecto

En total, para entrenar a DeepSeek se habrían utilizado alrededor de 60.000 GPUs NVIDIA, y el coste final acumulado habría sido, según los datos de SemiAnalysis, de 2.573 millones de dólares. A todo esto debemos sumar algo muy importante, y es el coste relacionado con los datos necesarios para poder «alimentar» a un modelo como este.

Controversias y desafíos éticos

Según las últimas informaciones los responsables de esta IA podrían haber robado datos a OpenAI, y habrían entrenado a DeepSeek utilizando lo que se conoce como destilación de resultados. Este tipo de prácticas violan las políticas de uso de de la API OpenAI, aunque permiten reducir significativamente los costes de entrenamiento de una IA.

El mito de los 6 millones de dólares

Esos 6 millones de dólares se atribuye únicamente al coste a nivel GPU de la ronda de pre-entrenamiento de la IA, que representa únicamente una pequeña parte del coste total del modelo, y que deja fuera del coste total cosas tan importantes como los gastos necesarios para el proceso de I+D y el coste total de propiedad del hardware.

Políticas de restricción y acceso a tecnología

Por otro lado, que DeepSeek haya sido capaz de tener acceso a un bloque de GPUs tan impresionante para entrenar IA confirma que algo está mal en la aplicación de las políticas de restricción de este tipo de hardware a China, un tema que ya está siendo objeto de una investigación.

¿Realmente es DeepSeek tan impresionante?

No hay duda de que a nivel técnico representa un avance importante en el mundo de la inteligencia artificial, pero también depende de con qué lo comparemos. En relación coste por millón de tokens ofrece un valor muy buen frente a determinados modelos, como GPT-4o-0513, pero queda por detrás de GPT-4o-mini y de Llama 3.2 70B.

Iremos viendo cómo sigue evolucionando este tema, y cómo termina toda la polémica que se ha generado alrededor de este modelo, pero una cosa podemos tener clara, y es la llegada de DeepSeek al final será muy beneficiosa de cara a incrementar la competencia entre modelos de IA avanzada, y esto debería tener un impacto positivo en el sector.

Imagen de portada generada con IA.

artículo original de: https://www.muycomputer.com/2025/02/03/deepseek-ha-enganado-al-mercado-de-la-ia-su-coste-real-no-fue-de-6-millones-de-dolares/

El verdadero coste del entrenamiento de DeepSeek

La magnitud del proyecto

Controversias y desafíos éticos

El mito de los 6 millones de dólares

Políticas de restricción y acceso a tecnología

¿Realmente es DeepSeek tan impresionante?

Deja una respuesta Cancelar la respuesta

Conoce al Haaland de San Mamés: vasco, hijo de marroquíes y una «bestia física»

Ryan García, Devin Haney y Teófimo López destacan en la cartelera del 2 de mayo

Contraloría ajusta normas de gastos reservados tras caso Monsalve

Conoce al Haaland de San Mamés: vasco, hijo de marroquíes y una «bestia física»

Ryan García, Devin Haney y Teófimo López destacan en la cartelera del 2 de mayo

Contraloría ajusta normas de gastos reservados tras caso Monsalve

El verdadero coste del entrenamiento de DeepSeek

La magnitud del proyecto

Controversias y desafíos éticos

El mito de los 6 millones de dólares

Políticas de restricción y acceso a tecnología

¿Realmente es DeepSeek tan impresionante?

Deja una respuesta Cancelar la respuesta

Noticias relacionadas

Sobre el Grupo Guardado y su fundador José Buenaventura Guardado

Lanzamiento de las Radeon RX 9060 previsto entre abril y junio

Lanzamiento de las Radeon RX 9060 previsto entre abril y junio