DeepSeek sacudió los cimientos de la IA porque, en teoría, se trataba de un LLM muy avanzado que había tenido un coste total de solo 6 millones de dólares. Suena bien, quizá demasiado bien para ser verdad, y los datos de un estudio compartido por SemiAnalysis han confirmado que todo ha sido una mentira que nos hemos querido creer.
El verdadero coste del entrenamiento de DeepSeek
El estudio que han elaborado parte de una clave tan básica como importante, el coste del hardware necesario para entrenar a DeepSeek. Para sacar adelante ese entrenamiento se utilizaron GPUs NVIDIA, concretamente bloques de modelos H800 y H100, cuyo coste total es de unos 1.600 millones de dólares. A esto debemos sumar el coste operativo de mantener y utilizar esos bloques, que sería de unos 944 millones de dólares.
La magnitud del proyecto
En total, para entrenar a DeepSeek se habrían utilizado alrededor de 60.000 GPUs NVIDIA, y el coste final acumulado habría sido, según los datos de SemiAnalysis, de 2.573 millones de dólares. A todo esto debemos sumar algo muy importante, y es el coste relacionado con los datos necesarios para poder «alimentar» a un modelo como este.
Controversias y desafíos éticos
Según las últimas informaciones los responsables de esta IA podrían haber robado datos a OpenAI, y habrían entrenado a DeepSeek utilizando lo que se conoce como destilación de resultados. Este tipo de prácticas violan las políticas de uso de de la API OpenAI, aunque permiten reducir significativamente los costes de entrenamiento de una IA.
El mito de los 6 millones de dólares
Esos 6 millones de dólares se atribuye únicamente al coste a nivel GPU de la ronda de pre-entrenamiento de la IA, que representa únicamente una pequeña parte del coste total del modelo, y que deja fuera del coste total cosas tan importantes como los gastos necesarios para el proceso de I+D y el coste total de propiedad del hardware.
Políticas de restricción y acceso a tecnología
Por otro lado, que DeepSeek haya sido capaz de tener acceso a un bloque de GPUs tan impresionante para entrenar IA confirma que algo está mal en la aplicación de las políticas de restricción de este tipo de hardware a China, un tema que ya está siendo objeto de una investigación.
¿Realmente es DeepSeek tan impresionante?
No hay duda de que a nivel técnico representa un avance importante en el mundo de la inteligencia artificial, pero también depende de con qué lo comparemos. En relación coste por millón de tokens ofrece un valor muy buen frente a determinados modelos, como GPT-4o-0513, pero queda por detrás de GPT-4o-mini y de Llama 3.2 70B.
Iremos viendo cómo sigue evolucionando este tema, y cómo termina toda la polémica que se ha generado alrededor de este modelo, pero una cosa podemos tener clara, y es la llegada de DeepSeek al final será muy beneficiosa de cara a incrementar la competencia entre modelos de IA avanzada, y esto debería tener un impacto positivo en el sector.
Imagen de portada generada con IA.
artículo original de: https://www.muycomputer.com/2025/02/03/deepseek-ha-enganado-al-mercado-de-la-ia-su-coste-real-no-fue-de-6-millones-de-dolares/