Cómo DeepSeek superó a los gigantes de Silicon Valley con su IA

EL PAÍS

La Revolución de DeepSeek

La revolución de los modelos de inteligencia artificial (IA) de la china DeepSeek se basa en un motivo clave: hacen lo mismo pero más barato. Su funcionamiento en general es igual de bueno que los líderes del mercado de Silicon Valley, pero son mucho menos costosos de crear y de usar. OpenAI, Anthropic y Google, creadores de los modelos más célebres, y Nvidia, al cargo de los sofisticados chips que emplean esas compañías, han visto derrumbarse toda su aparente ventaja en apenas unos días. Hoy hay menos expertos que crean que entrenar y usar un modelo de IA requiera la potencia de un gigante tecnológico. La monumental caída en bolsa de Nvidia es la ilustración de esa creencia.

Funcionamiento de los Chatbots de DeepSeek

Los chatbots de la china DeepSeek funcionan igual que todos. El usuario se da de alta con un email y una contraseña en la página de la compañía y puede empezar a preguntarle lo que quiera. A veces tarda algo más de responder, no contesta siempre a preguntas políticas delicadas sobre Tiananmen o Taiwan y funciona bastante bien en español. Lo mejor, sin embargo, es que es gratis. El modelo de negocio de DeepSeek se basa en cobrar a usuarios que requieren un uso profesional.

Modelos Recientes y su Impacto

R1 es el modelo más reciente de la compañía china, el que ha provocado el derrumbe del edificio de la IA occidental. Razona igual que la creación más avanzada de OpenAI, el o1. Pero en plenas fiestas navideñas, los chinos lanzaron su modelo V3, equivalente al más común ChatGPT-4, que ya incluía los avances técnicos que han generado el revuelo.

Reducción de Costos en el Entrenamiento

DeepSeek ha logrado que entrenar un modelo nuevo, que costaba más de 100 millones de dólares en el caso de ChatGPT-4, haya pasado a menos de 6 millones. Andrei Karpathy, cofundador de OpenAI, exdirector de IA en Tesla y uno de los expertos más respetados del sector, describió ese presupuesto como “de broma” y añadió: “Hay que asegurarse de que no somos derrochadores con lo que tenemos y este modelo parece una buena demostración de que hay mucho que revisar tanto en datos como en algoritmos”. El último modelo de DeepSeek es tan eficiente que requirió una décima parte del poder informático del modelo comparable de Meta.

Técnicas Innovadoras de DeepSeek

Estos modelos de IA son extremadamente caros tanto de entrenar como luego de usar. DeepSeek ha logrado rebajar costes en ambos casos. Para entrenarlos, ha logrado que su modelo aprenda de otros anteriores. Esto es algo que los términos de servicio de estas empresas no permiten, pero es muy difícil de detectar y de evitar. Igual que los modelos originales de OpenAI tomaron todos los datos de internet sin pagar por ellos, ahora un modelo chino emplea los modelos cerrados con un coste mínimo. Esto se logra con una técnica llamada destilación, que permite hacer preguntas al modelo anterior y guardar las respuestas y así ir aprendiendo y entrenándose. Esta técnica implica que los modelos pueden aprender unos de otros, lo que nos arroja a otro escenario de evolución aún más rápido y desconocido.

Sistema de Expertos

La otra técnica que usa DeepSeek para rebajar costes es un sistema llamado de “expertos”. Cada vez que el usuario hace una pregunta, el modelo decide si debe activar a su experto médico, traductor, abogado o físico. Los modelos clásicos activan a todos de golpe, lo que supone un despilfarro de energía y computación. Es como necesitar una enorme planta propia de electricidad para poner en marcha una cadena de montaje elaboradísima. DeepSeek ha hecho lo mismo conectando su pequeña fábrica a un enchufe y un puñado de generadores.

Impacto en el Mercado Global

De repente, los usuarios que hasta ahora pagan unos 20 euros por usar los modelos de OpenAI ven cómo pueden obtener casi los mismos resultados gratis. La expansión de la IA está llegando más rápido de lo previsto a su etapa de comoditización, cuando la nueva tecnología se convierte en un producto común y accesible a todos.

Respuesta de China a las Restricciones de EE.UU.

Todo esto ha ocurrido además en una empresa de Hangzhou, una ciudad china cercana a Shanghai. La administración Biden vetó la exportación de los chips más nuevos para limitar la competencia china. La respuesta del gigante asiático ha sido simple: no los necesitamos. Y lo han logrado con código abierto, enseñando las tripas de sus logros con documentación publicada en internet. Hacer de la necesidad, virtud.

Implicaciones para la Industria Tecnológica

El fin de esta etapa inicial de la IA parece ser una mala noticia para los gigantes pioneros, que ven como una buena parte de su ventaja desaparece. Pero el resto de grandes compañías, como Amazon o Apple, que no estaban al frente de esta competición de la inteligencia artificial, pueden claramente beneficiarse y ofrecer los mismos beneficios que el resto a una porción del coste.

artículo original de: https://elpais.com/tecnologia/2025-01-28/por-que-deepseek-ha-tumbado-con-su-ia-a-los-gigantes-de-silicon-valley.html

Deja una respuesta