La Ballena de IA de la que Todo el Mundo Habla

Portada

Estos últimos días he visto millones de publicaciones sobre DeepSeek, la nueva ballena de IA de código abierto que está causando sensación. Así que, después de ejecutar un par de Pruebas de Concepto (PoC), aquí está mi opinión sincera.

Nombre, ¿quizás?

Creo que el nombre «DeepSeek» refleja la misión de la compañía de explorar y profundizar en el campo de la inteligencia artificial. «Deep» se refiere a las técnicas de aprendizaje profundo (deep learning) que utilizan para desarrollar sus modelos avanzados, mientras que «Seek» sugiere la búsqueda constante de conocimiento y soluciones innovadoras. Esta combinación subraya su enfoque en crear tecnologías que puedan analizar y comprender datos complejos de manera eficiente. DeepSeek, a menudo denominada la «Ballena de IA», ha estado causando olas significativas en la industria tecnológica. Fundada en 2023 por Liang Wenfeng, esta empresa china de IA ha ganado rápidamente atención por su enfoque innovador en inteligencia artificial. Los modelos insignia de DeepSeek, como DeepSeek-V3 y DeepSeek-R1, han establecido nuevos puntos de referencia en rendimiento y eficiencia de costes. A diferencia de muchas de sus contrapartes occidentales, DeepSeek enfatiza la transparencia y accesibilidad, haciendo que sus modelos de IA de alto rendimiento sean de código abierto y estén disponibles para uso público y colaboración. Esta democratización de la tecnología de IA avanzada es un cambio radical, permitiendo que más investigadores y desarrolladores contribuyan y se beneficien de estas herramientas de vanguardia. La combinación de métricas de rendimiento impresionantes y un compromiso con la apertura es lo que hace de DeepSeek la ballena de IA de la que todo el mundo habla.

¿Realmente es Tan Barato?

Una de las cosas que me llamó la atención es el supuesto coste de desarrollo. La gente dice que se construyó con un presupuesto sorprendentemente bajo, pero si consultas el artículo de investigación, verás la gran cantidad de investigadores y recursos involucrados. ¿Realmente fue tan barato? Tengo mis dudas.

Código Abierto… ¿Pero Por Cuánto Tiempo?

Sí, DeepSeek es de código abierto, y eso es una gran victoria. Pero la pregunta real es: ¿seguirá siendo así? Vivimos en una época donde, seamos sinceros, nosotros somos el producto. Si no me crees, sigue leyendo.

¿Qué Pasa con la Privacidad?

DeepSeek te permite ejecutar modelos localmente, lo cual es fantástico. Pero aquí está el problema:

Si lo ejecutas localmente, tus datos permanecen bajo tu control.

Si lo usas en línea, su política de privacidad entra en juego (ya sabes, ese documento largo que nadie lee nunca). Pero si realmente lo lees, verás que DeepSeek recopila datos y los envía a China.

Toda la información aquí: https://platform.deepseek.com/downloads/DeepSeek%20Privacy%20Policy.html

Política privacidad 1

Política privacidad 2

Con eso aclarado, pasemos a las pruebas reales que hice en Azure

PoC 1: Ejecutando DeepSeek en una VM sin GPU

Para mi primera prueba, decidí ejecutar DeepSeek en una VM de serie B, específicamente una B2ms (2 vCPUs, 8GB RAM), que es una máquina bastante básica sin GPU.

🔹 SO: Linux

🔹 Ollama instalado → Inmediatamente obtuve una advertencia: «Ollama solo se ejecutará en modo CPU.» Pero por curiosidad, continué de todos modos.

Advertencia Ollama

Advertencia de Ollama

Después de descargar el modelo DeepSeek-R1, realmente funcionó—aunque, como era de esperar, el rendimiento estaba lejos de ser ideal en una CPU.

Modelo descargado

Modelo descargado

🔹 Bienvenido a DeepSeek-r1

Bienvenida DeepSeek

🔹 Rendimiento

Rendimiento VM

Rendimiento dentro de la VM

PoC 2: Desplegando DeepSeek-R1 en Azure Container Apps

Aquí es donde las cosas se pusieron interesantes: desplegando DeepSeek en Azure Container Apps. Este enfoque me intrigó porque aprovecha el poder de los contenedores y la escalabilidad de la nube.

¿Por Qué Azure Container Apps?

🔹 Escalado automático: Azure Container Apps escala dinámicamente según la demanda.

🔹 Costes optimizados: Pago por segundo con arranque en frío optimizado.

🔹 Infraestructura segura: Integración perfecta con Azure con GPUs serverless (Nota: aún en versión preliminar y disponible solo en ciertas regiones).

Proceso de Despliegue:

  • Despliegue del contenedor
  • Seleccionar origen de la imagen
  • Registrar servidor de login
  • Especificar etiqueta de imagen
  • Configurar parámetros (perfil de trabajo, GPU)
  • Comenzar consumo

Container Apps configuración

Container Apps despliegue

Conclusión y Evaluación Crítica

Enfatizo que «la tecnología debería ser un facilitador», mientras planteo preocupaciones:

  • Rendimiento Técnico: DeepSeek demuestra capacidades competitivas con los principales modelos de IA
  • Problemas de Seguridad y Transparencia: Las afirmaciones de código abierto entran en conflicto con «respuestas evasivas» y aspectos opacos del desarrollo/políticas
  • Riesgo de Privacidad: El uso en línea presenta preocupaciones de recopilación de datos; «los datos se recopilan y envían a China»
  • Pregunta Central: «¿Tenemos el control de la tecnología, o la tecnología está empezando a controlarnos?»

Postura Final: DeepSeek en Azure Container Apps demuestra ser eficiente y escalable, pero los desarrolladores deben priorizar la responsabilidad y el control del usuario sobre la explotación.

Reflexión Final

DeepSeek representa tanto la promesa como los peligros de la IA de código abierto moderna. Si bien ofrece capacidades técnicas impresionantes y accesibilidad sin precedentes, plantea preguntas importantes sobre privacidad, transparencia y el verdadero coste del «software gratuito». Como profesionales de la tecnología, debemos evaluar críticamente estas herramientas no solo por su rendimiento técnico, sino también por sus implicaciones éticas y de privacidad.