La inteligencia artificial está en constante evolución y la reciente irrupción de un nuevo contendiente, de origen chino, ha sacudido su mercado. A continuación, te explicamos lo que recientemente ha pasado con DeepSeek, ChatGPT y Silicon Valley.
DeepSeek es una empresa china de inteligencia artificial que ha desarrollado el modelo de lenguaje de gran tamaño (LLM) del mismo nombre, que consume menos recursos computacionales que otros modelos similares. Esto ha generado un gran interés en la comunidad de usuarios de IA, ya que ha demostrado que es posible lograr resultados de vanguardia sin necesidad de grandes inversiones en hardware.
¿Por qué DeepSeek ha sacudido el mercado de las IA?
Para entender lo que ha pasado con DeepSeek en el mercado de las IA, debemos analizarlo desde tres diferentes aristas: la tecnología, el modelo de negocio y la geopolítica.
¿Qué ha pasado con Deepseek en la tecnología IA?
Desde el punto de vista tecnológico, DeepSeek destaca por hacer más con menos, es decir, por demandar menos recursos computacionales que ChatGPT y otros modelos similares. Esto lo ha logrado empleando un conjunto de innovaciones, que incluyen:
- Trabajar con precisión de 8 bits en vez de 16 o 32 como otros modelos. Esto implica menor uso de memoria y menor consumo de energía, además de que se pueda emplear en dispositivos con microprocesadores de baja tecnología.
- Procesar frases completas en lugar de palabra por palabra, lo que le permite una mayor comprensión del texto, emplear un análisis semántico profundo y la reducción de errores de interpretación.
- Emplear menos parámetros por tarea. Esto le consiente centrarse en aprender patrones más generales y relevantes de los datos, en lugar de detalles específicos que pueden no ser relevantes.
La eficiencia de DeepSeek se refleja en el costo que se requiere para entrenar sus modelos que, según sus mismos creadores, ronda los 5,5 millones de US$. Una fracción de lo requerido para entrenar un modelo similar en OpenAI, que promedia los 100 millones US$.
¿Qué ha pasado con Deepseek en el modelo de negocio?
En la arista comercial, DeepSeek ha causado una revolución, impactando directamente al modelo de negocio de IA de Silicon Valley. El modelo chinoha demostrado que no hacen falta GPUs supercostosas para que las empresas incorporen a sus negocios inteligencia artificial.
Para muchas empresas de Silicon Valley, la comercialización de la IA se basa parcialmente en el desarrollo de hardware especializado para el entrenamiento y uso de la inteligencia artificial, u ofrecer el servicio de entrenamiento con hardware propio. Y dicho negocio se tambaleó al surgir DeepSeek, que con una fracción de los recursos puede ofrecer resultados similares a los brindados por ellos.
La reacción del mercado no se hizo esperar: Nvidia, líder mundial en el desarrollo de hardware para inteligencia artificial, perdió 18% de su valor en un día. El índice de tecnología Nasdaq fue a la baja, y las acciones de gigantes tecnológicos de Silicon Valley como OpenAI y Google sufrieron la depreciación de sus acciones.
Por otra parte, DeepSeek es un lenguaje de código abierto, lo que implica que ofrece transparencia y fomenta la colaboración entre la comunidad de usuarios de la IA. Esto está obligando a ChatGPTarepensar su política de código cerrado o de propietario que actualmente mantiene, para no perder aún más competitividad.
¿Qué ha pasado con Deepseek en el aspecto geopolítico?
El lanzamiento de DeepSeek coincidió con el anuncio del presidente Donald Trump del proyecto Stargate, cuyo objetivo es posicionar a los Estados Unidos como el líder en inteligencia artificial del mundo. Con un presupuesto de 500 mil millones de US$ y la participación de gigantes tecnológicos como OpenAI, Oracle y Softbank, esta noticia originalmente impactó positivamente al mercado tecnológico norteamericano.
Sin embargo, a pocas semanas del lanzamiento de DeepSeek, muchos expertos ponen en duda que el proyecto Stargate tenga una orientación adecuada. Estos indican que será el modelo chino de código abierto, demandante de pocos recursos, el que se terminará imponiendo en el mundo.
Ahora bien, que China tomara la delantera en el campo de la IA tiene importantes implicaciones geopolíticas. Significaría que Estados Unidos seguiría perdiendo su hegemonía tecnológica a manos de su principal rival comercial. Y no en cualquier ramo, sino en aquel llamada a dominar durante las próximas décadas el desarrollo comercial y militar de las naciones.
Quizás por el miedo que genera el panorama antes indicado, ya han comenzado a surgir campañas de desprestigio contra DeepSeek, hasta ahora, todas ellas basadas en especulaciones y no en pruebas. Se le acusa de ser una herramienta de espionaje, de emplear sin consentimiento los modelos de IA desarrollados en Silicon Valley para su adiestramiento, de mentir sobre su real coste de entrenamiento y un largo etcétera.
Más allá de los aspectos antes señalados, para los usuarios comunes, DeepSeek es una bendición. Hay varias iniciativas europeas de modelos de IA, como el desarrollado en España que, aunque consumen pocos recursos, dan resultados extremadamente deficientes. Con esos mismos escasos recursos, DeepSeek es capaz de brindar resultados que igualan o superan a los de OpenAI. Y todo ello en un código abierto y con un modelo de IA mucho más barato de entrenar.
Imagen cortesía de Pexels
Fuente: https://www.pexels.com/photo/macbook-with-deepseek-ai-interface-displayed-30530416/
Metadescripción: