Tabla de contenido
La reciente revelación de DeepSeek, una innovadora ‘startup’ de inteligencia artificial desarrollada por científicos chinos, ha dejado boquiabiertos a analistas y expertos internacionales, desafiando la comprensión en Occidente sobre la dinámica global y el futuro de esta tecnología.
Diseñada para llevar la IA a un nivel de capacidad cognitiva más cercano al de los humanos, DeepSeek tomó por sorpresa a los países occidentales que, con gigantes de renombre como Google, Amazon y Microsoft, compiten por el dominio en este prometedor mercado, donde por el momento triunfa OpenAI con su Chat GPT. Sin embargo, además de demostrar sólidos avances tecnológicos, DeepSeek superó a su rival al convertirse este lunes en la aplicación gratuita más descargada de App Store en Estados Unidos.
¿Por qué destaca DeepSeek?
El chatbot chino apareció en las tiendas de aplicaciones de Apple y Google a principios de este año y uno de los rasgos principales que lo distinguen de competidores como las herramientas de OpenAI es que sus modelos son de código abierto, con lo que cualquiera puede acceder a sus componentes y modificarlos, aunque la compañía no ha revelado los datos utilizados para su entrenamiento.
Entrenados sobre la base de los chips Nvidia H800, que no son del rendimiento más alto, los modelos de DeepSeek supusieron una nueva revelación: tal vez no sea necesario el ‘hardware’ más sofisticado y costoso para el desarrollo de una IA de vanguardia.
La semana pasada, el equipo de la ‘startup’ china presentó su último modelo, R1, con habilidades avanzadas de “razonamiento” y capacidad de repensar su propio enfoque. “En lugar de enseñar explícitamente al modelo cómo resolver un problema, simplemente le proporcionamos los incentivos adecuados, y él desarrolla estrategias avanzadas de resolución de problemas de forma autónoma“, explicaron sus creadores.
La capacidad para realizar aprendizaje autónomo contextual, es decir, aprender de manera más eficiente a partir de la experiencia y adaptarse con rapidez a nuevos entornos utilizando su propio tren de pensamiento para un entrenamiento adicional sin una intervención humana constante y la necesidad de alimentarlo con nuevas fuentes de datos, es otro importante rasgo distintivo de DeepSeek en comparación con otras plataformas de IA, que le permite operar con un alto grado de flexibilidad y autonomía.
El ‘Sputnik’ de la IA
Gracias al éxito de DeepSeek, China ha logrado un gran salto tecnológico en un área que hasta ahora se consideraba esencialmente monopolio de las potencias occidentales.
“DeepSeek R1 es el momento Sputnik de la IA“, escribió en X el capitalista de riesgo Marc Andreessen, quien ha asesorado a Donald Trump sobre política tecnológica, advirtiéndole sobre los obstáculos que supondría la sobrerregulación de la industria de la IA por parte del Gobierno estadounidense.
Al igual que el lanzamiento del icónico satélite soviético en 1957 que desató la carrera espacial entre la URSS y EE.UU., DeepSeek se ha erigido como una seria competencia en el mercado de la IA, donde tiene posibilidades reales de tomar la delantera.
Además, su entrenamiento salió muy barato para los estándares de la industria. Se reportó que costó tan solo 5,58 millones de dólares, 89 veces menos que el presupuesto para el entrenamiento del modelo o1 de OpenAI, que, según rumores, rondó los 500 millones.
Nirgunan Tiruchelvam, de la consultora Aletheia Capital, con sede en Singapur, señaló que el producto de DeepSeek plantea serias dudas para la tesis de que “el importante gasto de capital y los gastos operativos en los que ha incurrido Silicon Valley es la forma más adecuada de abordar la tendencia de la IA”.
Según apuntan en JP Morgan, el potente mensaje de DeepSeek para la industria de la inteligencia artificial es que “más inversiones no equivalen a más innovación“.
Qué más tiene China
Al igual que EE.UU., China invierte miles de millones de dólares en el desarrollo de la inteligencia artificial, y DeepSeek no es su única apuesta para ganarse un lugar sólido en ese mercado. Estos son algunos de los otros modelos de IA que se crearon en el gigante asiático:
- Qwen-2.5-Max, de Alibaba Cloud
Alibaba Cloud lanzó Qwen-2.5-Max, que logró superar el modelo anterior de DeepSeek, V3. Los desarrolladores trabajan en mejorar sus capacidades de razonamiento.
Los modelos de Alibaba Cloud de la serie Qwen2.5 están destinados principalmente para desarrolladores y clientes empresariales como fabricantes de automóviles, bancos, creadores de videojuegos y minoristas, como parte del desarrollo de productos y la configuración de experiencias para los clientes. También está disponible el chatbot Qwen, conocido en China como Tongyi Qianwen.
Ernie Bot 4.0, creado por Baidu, fue el primer chatbot de IA hecho en China disponible para el público. La compañía dijo que lanzó el modelo públicamente para poder recopilar sus enormes datos de ‘feedback’ humano y aumentar así su capacidad. Para junio de 2024, Ernie Bot 4.0 tenía más de 300 millones de usuarios.
- Doubao 1.5 Pro, de ByteDance
El modelo Doubao 1.5 Pro fue lanzado la semana pasada por la empresa matriz de TikTok. Actualmente, es uno de los chatbots más populares en China, con 60 millones de usuarios activos mensuales.
ByteDance afirma que Doubao 1.5 Pro es mejor que ChatGPT-4o en retención de conocimiento, programación, razonamiento y procesamiento del idioma chino. Según la empresa, el modelo también es rentable y supone costos de ‘hardware’ más bajos en comparación con otros modelos de lenguaje gracias a su arquitectura optimizada, que equilibra el rendimiento con demandas computacionales reducidas.
- Kimi k1.5, de Moonshot AI
Kimi k1.5, de Moonshot AI, es una ‘startup’ con sede en Pekín valorada en más de 3.000 millones de dólares después de su última ronda de recaudación de fondos. Sus creadores aseguran que supera al modelo o1 de OpenAI en matemáticas, programación y capacidad para comprender tanto entradas de texto como visuales, como fotos y videos.
Con información de AP