La Innovación Multimodal de ChatGPT: Transforma Textos y Fotos en Imágenes de alta Calidad
La Innovación Multimodal de ChatGPT: Transforma Textos y Fotos en Imágenes de alta Calidad
Vicerrectorado de Enseñanza Virtual 01/04/2025 ⏱️ 3 min
OpenAI ha dado un nuevo paso en la integración de funcionalidades multimodales al anunciar la incorporación del modelo de generación de imágenes basado en GPT4o directamente en ChatGPT, una herramienta que ya está disponible de forma gratuita para todos los usuarios. Con esta actualización, el popular chatbot no solo responde preguntas en texto, sino que también puede crear imágenes a partir de descripciones detalladas o editar fotografías subidas por los usuarios.
Entre los múltiples casos de uso, destacan la creación de infografías, logotipos, carteles publicitarios y la posibilidad de transformar fotografías personales en ilustraciones inspiradas en el estilo del Studio Ghibli, tendencia que ya se ha vuelto viral en redes sociales. Además, la tecnología de GPT4o no solo ofrece resultados visuales de alta calidad, sino que también permite una interacción con la herramienta: si el resultado inicial no cumple las expectativas, se pueden realizar ajustes en tiempo real a través del chat, facilitando un proceso iterativo de mejora y personalización.
A continuación, os mostramos un ejemplo que ha generado a partir del siguiente prompt:
“Crea una infografía con todos los lenguajes de programación más populares, incluyendo su logo y un texto que indique casos de uso de cada uno”.
Infografía de los lenguajes de programación más populares
OpenAI. (2025). ChatGPT (versión del 1 de abril) [Modelo de lenguaje de gran tamaño]. https://chat.openai.com/chat
Esta innovación se suma a la estrategia de OpenAI para expandir el uso de la inteligencia artificial en diversas áreas creativas y profesionales, rompiendo barreras entre el texto y lo visual, y posicionándose como una herramienta indispensable para diseñadores, publicistas y docentes.
En conclusión, la nueva función de generación de imágenes en ChatGPT no solo simplifica la creación de contenido visual, sino que también demuestra el rápido avance de la inteligencia artificial en la convergencia de múltiples medios visuales.