Ideograma, ¡un azul que se hace pasar por rey!

Vota este post

Entre Midjourney, Stable Diffusion y DALL-E, es difícil elegir qué IA generativa de imágenes utilizar. Cada uno de ellos tiene sus fortalezas y debilidades. Pero sólo podría lucir la corona. Cuál ? Tal es la cuestión ! Y, sin embargo, todavía no estamos en la fase en la que la IA generadora de imágenes esté en su apogeo. Luego, una startup decide participar en la carrera y lanza Ideogram. Quién sabe, tal vez sea ella quien llegue a lo más alto de la lista.

Esto es totalmente posible porque detrás de Ideogramm se encuentran antiguos ingenieros de Google DeepMind y otros miembros de algunos institutos de renombre. Incluyendo expertos de la Universidad Carnegie Mellon, UC Berkeley y la Universidad de Toronto. Según sus palabras, El ideograma representa la IA generativa más avanzada. El modelo incluso permite activar la función “Mensaje mágico”, una característica especial que ofrece la posibilidad de tener los mejores mensajes para generar una imagen. En cualquier caso, sin más demora analizaremos esta IA generativa y veremos qué tiene realmente en su vientre. Después veremos si es así. verdaderamente digno de llevar la corona y competir con DALL-E 3.

Versatilidad bastante sorprendente en comparación con otras IA generadoras de imágenes

Ideogram AI es una inteligencia artificial innovadora que tiene como objetivo abordar un desafío importante al que se enfrentan los sistemas de generación de imágenes de texto descriptivo. Notablemente la integración coherente de palabras y textos en las imágenes creadas.

A diferencia de sus competidores, incluidos DALL-E y Midjourney, que a menudo tienen dificultades para reproducir fielmente palabras o marcas conocidas, Ideogram ha sido Diseñado específicamente para ofrecer una dimensión textual relevante. a las imágenes generadas.

Como usuario, podrás proporcionar una descripción detallada de la imagen deseada. Por ejemplo palabras o frases específicas que quieres que aparezcan allí. El ideograma AI luego interpreta estas indicaciones semánticas y produce creaciones visuales teniendo en cuenta el significado real de los textos mencionados. Aunque esta tecnología aún es nueva e imperfecta, nuestras pruebas revelaron resultados sorprendentemente consistentes y visualmente atractivos.

En resumen, el verdadero potencial de Ideogram reside en su capacidad para integrar textos de forma natural en diversos estilos, contextos y medios visuales. Así podemos crear Imágenes en 3D de nombres o incluso incrustar logotipos en las pantallas. Esta IA generativa también permite reproducir caligrafía legible en manuscritos, o incluso crear portadas de álbumes o carteles de películas de ficción que incorporan texto coherente.

Aunque todavía contiene imperfecciones, especialmente en temas más complejos que los retratos, Ideogram parece Ofrece versatilidad y funcionalidad única. en términos de integración semántica de textos en imágenes generadas por IA.

Opciones y funciones disponibles en Ideogram

El ideograma AI es un herramienta completa que ofrece varias funcionalidades para la generación de imágenes basadas en descripciones textuales. Su principal uso radica en la generación de imágenes a partir de un mensaje escrito por el usuario, al que se le ofrecerán cuatro visuales correspondientes.

Al escribir el mensaje, varias opciones le permiten guiar el estilo visual de la generación. Es decir, el renders cinematográficos, ilustraciones, fotografías, dibujos animados o incluso renders 3D. Una opción tipográfica dedicada también tiene como objetivo facilitar la integración de texto legible en las imágenes, aunque esta funcionalidad aún debe perfeccionarse.

El usuario también puede elegir formato de imagen (cuadrado, horizontal o vertical), así como cargar una imagen existente además del mensaje de texto para influir aún más en el resultado generado.

Más allá de la creación, Ideogram también incluye un componente comunitario con un galería que le permite explorar creaciones recientes, usuarios populares o seguidos. Luego se pueden consultar las creaciones públicas y recuperar sus indicaciones para remezclarlas.

Con sus numerosas opciones de estilos, formatos y su dimensión participativa, Ideogram se posiciona como una herramienta rica y versátil para la generación de imágenes visualmente atractivas integrando texto de manera coherente.

Retratos más realistas con Ideogram, un punto para el azul

Producir imágenes realistas de personas. Desde entonces ha representado un gran desafío para los generadores de imágenes. basado en inteligencia artificial. Debido a la complejidad del cuerpo humano y al fenómeno conocido como efecto valle perturbador, a estos sistemas automatizados les resulta difícil crear representaciones convincentes.

Sin embargo, esta herramienta en particular parece sobresalir en esta área. Durante nuestras primeras pruebas, nos sorprendió la calidad excepcional del resultado obtenido.

De hecho, Ideogram parece haber sido diseñado específicamente para producir retratos humanos de alta fidelidad. Entonces imágenes libre de defectos comúnmente observados en imágenes generadas por inteligencia artificial. Esto incluye manos distorsionadas, rostros arrugados u otros artefactos no deseados.

Menos eficiente en la generación de un grupo de personas y animales, ¡qué pena!

Aunque el rendimiento de Ideogram a la hora de generar retratos humanos realistas es impresionante, esta herramienta tampoco está exenta de defectos. Dado que la tecnología de generación de imágenes de inteligencia artificial aún se encuentra en una etapa temprana, Los errores y las imperfecciones siguen siendo comunes.. Ideogram, como recién llegado en este campo, no es una excepción a esta tendencia general.

De hecho, tan pronto como pasamos de los simples retratos a abordar temas más complejos, como grupos de personas o animales, la calidad de las imágenes producidas por Ideogram se deteriora considerablemente. Fotos de grupo A menudo presentan rostros sorprendentemente distorsionados.. En cuanto a las representaciones de animales, oscilan entre ligeras imperfecciones y resultados completamente irreales. Incluso las imágenes de comida tienen un acabado extrañamente artificial que las hace parecer poco apetecibles.

Sin embargo, considerando los errores flagrantes cometidos por otros generadores de imágenes de IA, los defectos de Ideogram se vuelven evidentes. relativamente menor. Por lo tanto, no podemos considerarlo excesivamente severo.

¿Gratis o de pago?

Se puede acceder a Ideogram a través de una versión gratuita que le permite generar hasta 25 mensajes por día, con descarga de imágenes en formato JPG sin restricción de derechos de uso.

También hay dos planes pagos disponibles para los usuarios que deseen acceder a funciones ampliadas:

  • La suscripción de $8 por mes ofrece generación prioritaria de hasta 400 mensajes mensuales (100/día), descarga en calidad original en formato PNG, así como acceso al editor de imágenes.
  • El plan premium a $20 por mes incluye todas las funciones anteriores, con 1000 mensajes de prioridad por mes, generación ilimitada en modo no prioritario, así como la capacidad de cargar sus propias imágenes para influir en la generación y crear imágenes en modo privado.

Como interfaz web, Ideogram le permite generar imágenes a partir de descripciones textuales, sin requerir la instalación de una aplicación o el uso de Discord. Después de un registro rápido con su cuenta de Google, accederá directamente a una interfaz similar a Pinterest. La única diferencia es que las imágenes provienen de descripciones textuales y no de los artistas. Estas imágenes, creadas de forma gratuita y sin derechos de autor, son generadas por IA según tus instrucciones.

Una característica especial de Ideogram es la posibilidad de ver las creaciones de otros usuarios. Sin embargo, a diferencia de otras plataformas, el filtrado parece menos estricto, con la posible presencia de contenido ofensivo o ilegal.

Al igual que ChatGPT y Midjourney, la calidad de los resultados depende de la precisión de su mensaje descriptivo. Aunque Ideogram ofrece algunos botones de estilo gráfico, depende de usted describir con precisión la escena que desea. Pero también su estilo y las palabras a integrar. En cuanto al renderizado predeterminado, es un cuadrado de 1024 x 1024 píxeles. Pero también están disponibles los formatos 10:16 y 16:10..

Aunque funciona en francés, obtendrás resultados más detallados en inglés. En este caso, nosotros recomiendo usar DeepLun traductor basado en IA, por su rendimiento superior al de Google Translate.

¿Podremos algún día esperar una IA generativa impecable?

Para los generadores de imágenes de inteligencia artificial en la fase de desarrollo, incluido Ideogram, todavía es difícil definir indicaciones textuales o indicaciones. Pero como cualquier tecnología nueva, estas herramientas seguirán evolucionando. Ideograma hecho por cierto. figura pionera al lograr ya gestionar mejor la generación de tomas humanas realista que muchas soluciones actuales en el mercado.

Sin embargo, la idea de que estos generadores de IA algún día puedan alcanzar la perfección absoluta sigue siendo difícil de imaginar. A fin de cuentas, todavía tienen dificultades con muchos tipos de imágenes básicos, y reproducir un realismo verdaderamente fiel será a la vez arduo e inquietante.

Para aprovechar al máximo estas herramientas, la clave está en la redacción de las indicaciones. Para ello, lo invitamos a leer nuestra guía sobre las mejores indicaciones para usar con servicios de inteligencia artificial generadores de imágenes. Podrás explotar plenamente su potencial ahora.

    Comparte el artículo: