Stability AI lanza una nueva IA de imagen y texto con una arquitectura única

5/5 - (1 vote)

Stability AI presenta un nuevo modelo de creación de imágenes impulsado por inteligencia artificial: Stable Cascade. Esta IA introduce un enfoque innovador y ofrece a los usuarios soluciones aún más flexibles y eficientes.

Una arquitectura en cascada innovadora

Stable Diffusion se destaca como uno de los generadores de imágenes a partir de texto más populares en su categoría. Desarrollado por Stability AI, ha recibido muchas actualizaciones importantes desde su creación. La última, SDXL Turbo, fecha noviembre 2023.

La cascada estable adopta una arquitectura diferente de Difusión Estable. Su nombre también evoca su Configuración en cascada que incluye tres fases. : A, B y C. Esta arquitectura mejora significativamente el entrenamiento del modelo.

El proceso comienza con el paso C que convierte descripciones de texto proporcionado en latentes compactas de 24×24 píxeles. Luego, los pasos A y B se hacen cargo decodificando estas latentes para generar imágenes de alta definición.

Inspirado de la arquitectura Würstcheneste innovador enfoque de tres pasos revoluciona la IA de texto e imagen al hacerla mucho más rápida y eficiente.

Requisitos informáticos significativamente reducidos

La arquitectura innovadora de Cascada estable reduce significativamente sus requisitos computacionales. Según Stability AI, solo la fase de ajuste fino del paso C permite reducir los costos en 16 veces comparado con el de un solo modelo de tamaño equivalente a Difusión Estable.

Esta espectacular caída de los recursos necesarios promueve la democratización de esta tecnología de punta. Stable Cascade ya no se limita a máquinas ultrapotentes. Ahora incluso computadoras menos eficientes puede aprovechar su poder. ¿Qué lo hace? accesible a un público mucho más amplio Artistas, creadores y entusiastas de la IA. Luego, todos pueden hacer realidad sus ideas.

Esta mayor accesibilidad de Stable Cascade también estimula la innovación en el campo de la generación de imágenes de IA basada en texto.

Un modelo flexible que ofrece resultados de calidad

Aunque consume muchos menos recursos, Stable Cascade sigue siendo no menos eficiente en términos de calidad de la imagen generada. Las imágenes producidas son fieles a las indicaciones y de alta calidad. Muchos usuarios lo han probado y los resultados son impresionantes:

La IA tiene una excelente comprensión de las consultas:

Según otros usuarios, Stable Cascade incluso supera a la versión 6 de Midjourney:

Además, el diseño modular del modelo permite a los usuarios expertos personalízalo ajustando cada uno de los tres pasos en cascada según sus necesidades específicas. De este modo podrán explorar más a fondo su potencial. Estabilidad La IA también tiene publicó sus códigos de entrenamiento e inferencia en GitHub.

Entre otras ventajas, Stable Cascade permite, a partir de una imagen inicial, para generar variaciones. Desde traducciones de imagen a imagen también son posibles. Por el momento el modelo está destinado a uso no comercial.

Nuestro blog está impulsado por lectores. Cuando compra a través de enlaces en nuestro sitio, podemos ganar una comisión de afiliado.