Desastre en OpenAI, Sora acumula críticas negativas

Vota este post

Una de las figuras emblemáticas de la IA dio recientemente su opinión sobre Sora, la IA generadora de vídeos de OpenAI. Según él, el proyecto OpenAI es una causa perdida.

La tecnología de generación de vídeos con inteligencia artificial sigue avanzando a pasos agigantados, para bien y para mal. Recientemente, OpenAI presentó Sora, capaz de producir vídeos impresionantes que son bastante realistas a partir de una simple descripción textual. Pero por parte de los expertos en IA, existen algunas reservas.

Demasiado esfuerzo para resultados irrelevantes

Yann LeCun, eminente especialista francés en IA y responsable de este campo en Meta, acaba de formular críticas incisivas al enfoque tecnológico utilizado por OpenAI. Según él, la ambición mostrada por el editor ChatGPT de modelar con precisión la complejidad del mundo real es condenado a fracasar.

En una publicación de Twitter, LeCun sostiene que el método de generación píxel por píxel a partir de variables latentes es fundamentalmente ineficiente. Modelos como Sora de OpenAI dedicar demasiado esfuerzo a deducir detalles irrelevantes. Este exceso de energía puede producir resultados sorprendentes a la hora de generar vídeos artificiales, pero resulta ineficaz para captar fielmente la realidad en su infinita riqueza.

Mientras se debate entre los expertos para determinar los enfoques de IA más prometedores, una certeza permanece. Avances espectaculares pero también surgen peligros de estas IA generadoras de videos. Depende de nosotros garantizar que la IA del mañana se desarrolle de forma ética, en beneficio de todos.

La solución propuesta por LeCun para levantar a Sora y sacar a OpenAI del abismo

Con 30 años de experiencia en aprendizaje automático y aprendizaje profundo, Yann LeCun es una autoridad en el campo de la IA. Por su parte, el titular de este sector del Meta advierte de ciertos límites de enfoques generativos en ChatGPT.

Según él, modelar con precisión el mundo real es mucho más difícil que generar texto. Donde este último sólo moviliza un conjunto finito de símbolos, simulando fielmente la complejidad de la realidad. Requiere capturar una variedad infinitamente más amplia de conceptos..

Sin embargo, el trabajo de Meta en IA sigue en gran medida eclipsado por el aura de las herramientas revolucionarias de OpenAI. En las sombras, Facebook trabaja solo tecnología de generación de video llamada V-JEPA. Esta arquitectura se distingue radicalmente por su deseo de centrarse en lo esencial en lugar de deducir cada píxel.

Según LeCun, este enfoque ofrecería Ganancias de eficiencia de 1,5 a 6 veces mayores que la competencia.. Queda por ver si sus críticas y esta alternativa tecnológica podrán influir en las direcciones de los gigantes tecnológicos en términos de IA generativa.