China ha lanzado la IA open source DeepSeek-V3, un modelo de lenguaje de gran tamaño de código abierto. Dicho modelo de inteligencia artificial está demostrando ser un competidor formidable, superando a ChatGPT en ciertas tareas específicas. Por ello, la carrera por desarrollar una IA más avanzada tiene a un nuevo competidor, que promete revolucionar el mercado.
DeepSeek es una empresa de inteligencia artificial con sede en Hangzhou, República Popular China. Está respaldada por el fondo de cobertura High-Flyer, con sede en el señalado país. La primera versión de su IA fue lanzada en noviembre de 2023, y un año después lanzó su tercera versión.
Con DeepSeek-V3 y otros modelos propios de IA, la República Popular China pretende democratizar el desarrollo de la inteligencia artificial en su país mediante el uso de un modelo de código abierto. También evitar la dependencia de modelos y productos de IA foráneos. Y mejorar la traducción de textos profundos de otros idiomas al mandarín, sin emplear el inglés como idioma de enlace.
¿Qué hace especial la IA open source DeepSeek-V3?
DeepSeek-V3 destaca por su capacidad, ya que maneja 671 mil millones de parámetros totales con 37 mil millones activados para cada token. Dicha capacidad le permite procesar información y generar texto de una manera más compleja y sofisticada que muchos otros modelos de IA.
Adicionalmente, DeepSeek-V3 emplea significativamente menos recursos durante su entrenamiento en comparación con sus pares. Esto se traduce en un menor tiempo y menor coste de adiestramiento, lo que lo hace un modelo de IA muy rentable.
Por otra parte, se diferencia de muchos otros modelos de IA por su condición de código abierto. Esto permite que cualquier investigador o desarrollador pueda acceder a su código fuente, modificarlo y utilizarlo para crear nuevas aplicaciones. Esta es una característica que fomenta la colaboración y acelera el desarrollo de la IA.
¿Cómo se compara ChatGPT con DeepSeek-V3?
La comparación entre ChatGPT de OpenAI y DeepSeek-V3 se ha realizado empleando diferentes pruebas. Una de ellas es la AlpacaEval 2.0, una herramienta de evaluación diseñada específicamente para medir el desempeño de modelos de lenguaje de gran tamaño. Dicho instrumento proporciona una forma estandarizada y objetiva de comparar diferentes modelos y medir su progreso.
Según pruebas realizadas con AlpacaEval 2.0, el rendimiento de la IA open source DeepSeek-V3 en pruebas de conversación en el idioma inglés supera casi en un 40% al de ChatGPT 4o-0513. En la misma prueba, la versión anterior DeepSeek-V2 equipara el desempeño de ChatGPT. Esto deja en evidencia el significativo avance logrado en la nueva versión de la IA de código abierto de China.
En resumen, las pruebas comparativas realizadas con diferentes herramientas permiten concluir que:
- DeepSeek-V3 supera a ChatGPT en tareas que involucran múltiples idiomas y en la traducción de idiomas al mandarín, excepto quizás el inglés. Esto es debido a que la segunda ha sido entrenada principalmente en datos en inglés, mientras que la primera lo ha sido en una variedad más amplia de idiomas.
- DeepSeek-V3 posee una mayor capacidad que ChatGPT para realizar tareas más técnicas, como la generación de código y la resolución de problemas matemáticos complejos.
- DeepSeek-V3 ha demostrado ser especialmente bueno en tareas que requieren un profundo entendimiento del lenguaje y la capacidad para generar texto creativo. Por otra parte, ChatGPT posee mejor rendimiento en la generación de texto conversacional.
Más allá de los resultados de las pruebas, esta comparación no está completa sin incluir un aspecto importante. ChatGPT está disponible como un servicio en la nube, mientras que DeepSeek-V3 es de código abierto. Entre otras cosas, esto permite a los usuarios ejecutar DeepSeek-V3 en sus propios ordenadores.
¿Cómo probar DeepSeek-V3?
Si es de tu interés probar el modelo de inteligencia artificial de código abierto DeepSeek-V3, puedes hacerlo de forma gratuita. Usa este enlace para chatear con DeepSeek o este para ingresar a la plataforma DeepSeek. En ambos casos, deberás completar el proceso de admisión en el respectivo portal, consintiendo sus términos de uso.