DALL-E Mini: qué es, cómo funciona y cómo se usa la inteligencia artificial online que crea imágenes con solo palabras

DALL-E Mini: qué es, cómo funciona y cómo se usa la inteligencia artificial online que crea imágenes con solo palabras
2 comentarios

A principios de 2021 OpenAI presentó una inteligencia artificial capaz de crear imágenes a partir de asociaciones entre conceptos visuales y textuales utilizando una gran cantidad de parámetros. Ahora, su hermano menor "DALL-E Mini" trae para todos los usuarios lo que la versión 1 y 2 de DALL-E no lograron, llevar su acceso a un gran número de usuarios.

Gracias a esta versión mini, que también funciona como una opción recortada de las originales, cualquier usuario puede probar las capacidades de DALL-E, en unos contenidos que quizá no son tan realistas como los producidos por las alternativas más potentes, pero que es capaz de generar imágenes bastante exactas a partir de los parámetros ingresados.

Qué es y cómo funciona DALL-E mini

DALL-E mini es un generador de código abierto desarrollado por el programador Boris Dayma, mismo que desarrolló la aplicación como parte de una competencia de Google y Hugging Face en julio de 2021.

Dia De Muertos
La diferencia de resultados al buscar en inglés "Día de muertos" (Izquierda) y "Día de Muertos Catrina" en español (derecha)

Su intención es poder crear imágenes de una forma parecida a como lo hace DALLE de Google, pero utilizando menos recursos de hardware, así como una infraestructura menor.

Al momento de escribir lo que se quiere ver, la IA analiza las palabras, hace una búsqueda rápida en línea e identifica imágenes asociadas y rasgos clave  para luego generar una composición de nueve partes tomando como referencia sus resultados, intentando que se "vea" lo más realista posible, cosa que no siempre logra correctamente, principalmente en los rostros y animales.

Checos Perez
Checo Pérez a la izquierda y el chiste de F1 como "Checo Pérez" Ministro de Defensa a la derecha

Sin embargo es importante saber que la inteligencia recopila información sin hacer filtros antes, por lo que las composiciones que arroje pueden incluir algún tipo de estereotipo o imágenes que no representan la postura de su creador.

De momento Dayma señala que DALL-E mini continúa en entrenamiento, aunque va mejorando sus resultados mientas más se está utilizando. Esto hace que en ocasiones genere contenido que parece extraño o hasta perturbador, pero que esto se irá corrigiendo poco a poco.

Kaliman Resultado
Hicimos la prueba con "Kalimán" (izquierda) un personaje de un programa de radio y de historietas en México y este fue el resultado (derecha), un poco alejado de la referencia

Así puedes utilizar DALL-E mini

Para poder utilizarla, deberemos ingresar a la página donde está disponible la demo para todo el mundo en este link, donde tendremos que ubicar un cajón de texto, justo antes de una ventana en blanco.

En esta sección es donde deberemos escribir en inglés lo que queremos la IA nos genere. Dependiendo de la cantidad de palabras que ingresemos, el programa tendrá más parámetros para poder arrojar un contenido preciso.

Resultado Vocho

Una vez que tengamos los términos, lo único que debemos hacer es hacer clic en el botón "Run" para que comience el proceso, que puede tardar unos minutos y que en ocasiones puede arrojar una leyenda de que el sistema está saturado, pero solo tenemos que seguir intentando hasta que inicie correctamente.

Tras un par de minutos se mostrará el resultado, una composición de nueve imágenes, tal y como en los resultados que incluimos en este post, donde veremos que hay situaciones donde la IA se acerca bastante y otras donde falla totalmente en lo que puede generar.

Temas
Inicio