Llega OpenAI Sora: una IA que genera vídeos realistas a partir de texto

4/5 - (1 vote)

Después de un comienzo de año dominado por Google y sus múltiples anuncios, OpenAI vuelve a la palestra con Sora, un prometedor generador de vídeos con IA. Aún en fase de desarrollo, ya es capaz de producir vídeos ultrarrealistas a partir de simples descripciones textuales. La start-up californiana da un paso de gigante con esta revolucionaria tecnología.

Fotorrealismo prodigioso para vídeos de alta calidad

Durante un tiempo, OpenAI pareció alejarse de la IA que generaba vídeos utilizando descripciones de texto. Además, muchos de sus competidores se aprovecharon para revelar sus proyectos de inteligencia artificial de texto y video. Ya existen muchas herramientas generadoras de videos con IA disponibles en la actualidad. El 15 de febrero finalmente se corrigió este error con La presentación de Sora..

Por ahora, la herramienta sólo está disponible para unos pocos creadores seleccionados. Sin embargo, los comentarios ya muestran sorprendentemente fotorrealista lo que lo diferencia de otros modelos de IA en el campo. Mejor aún, Sora tiene la capacidad de hacer vídeos de un minuto. En comparación, sus competidores todavía producen sólo extractos muy cortos. Además, es posible editar el vídeo generado y perfeccionarlo agregando o eliminando elementos hasta lograr el resultado deseado.

El surgimiento de una comprensión de la gramática cinematográfica.

Si Sora destaca por su fotorrealismo y su capacidad de producción, impresiona más por su forma de proceder. De hecho, el nuevo modelo de IA generativa de vídeo de OpenAI no se limita a transformar indicaciones en clips. Muestra alguna forma de comprensión emergente de gramática cinematográfica.

Como prueba, Sora desarrolló un verdadero talento para contar historias, punto para el que no estaba entrenado. Al cambiar de toma, la sincronización y los ángulos de la cámara son simplemente impresionantes. Además, la herramienta genera en un solo chorro. En otras palabras, no se producen en lotes y aún requieren ensamblaje.

Restricciones de contenido para evitar el riesgo de deslizamiento

Para acelerar el desarrollo de Sora y optimizar sus capacidades, OpenAI confió sobre el modelo de difusión de DALL-E 3. También se beneficia de un motor basado en un transformador GPT-4. Para mejorar aún más las capacidades narrativas de su herramienta, la firma estadounidense está explorando vías como generando videos a partir de una imagen.

Sin embargo, OpenAI no pretende desarrollar Sora sin etiquetas. Por lo tanto, los usuarios deben esperar Mismas restricciones que con DALL-E 3. para la creación de contenidos. Por ejemplo, la IA se negará a generar escenas de violencia y pornografía. Además, prohibirá la apropiación de estilos de artistas o el uso de personas reales.

Sin duda, OpenAI mejorará el rendimiento de esta IA. Una innovación tan revolucionaria podría tener un impacto significativo en muchas profesiones relacionados con la creación de contenidos de vídeo.