DeepSeek es una empresa china emergente en el campo de la inteligencia artificial, fundada en julio de 2023 por Liang Wenfeng en Hangzhou. Su principal producto es el modelo de lenguaje de código abierto DeepSeek-R1, lanzado en enero de 2025. Este modelo ha ganado notoriedad por su rendimiento competitivo y su enfoque económico y accesible .(Wikipedia, Wikipedia, la enciclopedia libre, Cadena SER)
Código abierto y accesibilidad: DeepSeek-R1 está disponible bajo la licencia MIT, lo que permite a desarrolladores e investigadores modificar y adaptar el modelo según sus necesidades.
Eficiencia en costos y recursos: A diferencia de otros modelos de gran escala, DeepSeek ha logrado entrenar su modelo con solo 2.000 unidades de procesamiento gráfico (GPU), reduciendo significativamente los costos y el consumo energético .(Wikipedia, la enciclopedia libre)
Desempeño competitivo: En evaluaciones estándar, DeepSeek-R1 ha mostrado un rendimiento comparable al de modelos como GPT-4-Turbo, especialmente en tareas relacionadas con programación y razonamiento matemático .(Arxiv)
Censura y sesgo: El modelo implementa mecanismos de censura que limitan las respuestas sobre temas políticamente sensibles, como las protestas de Tiananmen o el estatus de Taiwán. Aunque la versión de código abierto permite cierta personalización, las versiones oficiales mantienen restricciones alineadas con la política del gobierno chino .(Wikipedia, la enciclopedia libre, Wikipedia)
Reacciones internacionales: La rápida adopción de DeepSeek-R1 ha generado preocupaciones en Occidente sobre la privacidad, la ética y la competencia en el ámbito de la inteligencia artificial.
DeepSeek-Coder: Lanzado en noviembre de 2023, este modelo está diseñado específicamente para tareas de programación. Es de código abierto y ha demostrado un rendimiento superior al de modelos como Codex y GPT-3.5 en tareas de codificación .(Arxiv)
DeepSeek-Coder-V2: Una versión mejorada que amplía el soporte a 338 lenguajes de programación y aumenta la longitud del contexto a 128.000 tokens. En evaluaciones estándar, ha superado a modelos como GPT-4-Turbo en tareas de codificación y razonamiento matemático .(Arxiv)
DeepSeek representa una propuesta innovadora en el panorama de la inteligencia artificial, destacándose por su enfoque económico, accesible y de código abierto. Sin embargo, las preocupaciones sobre la censura y el sesgo político son aspectos a considerar al evaluar su adopción y uso.(ElHuffPost)
Video explicando como instalar: https://youtu.be/2hzahtWdYVo?list=PL72PRJG_GvYjDL4xzJDnem77DGu2Fa9hC