La IA de vídeo tiene una gran limitación: Runway promete superarla con su último modelo Gen-4 y desafía a Sora de OpenAI

La IA de vídeo tiene una gran limitación: Runway promete superarla con su último modelo Gen-4 y desafía a Sora de OpenAI

Que los modelos generativos están logrando imágenes y vídeos cada vez más impactantes no es ninguna sorpresa. Hace unos años, producir algo similar habría requerido un gran esfuerzo manual. Pero conviene no perder de vista una realidad: aunque esta tecnología avanza a gran velocidad, todavía arrastra limitaciones importantes que dificultan su uso en ciertos entornos profesionales.

Uno de los grandes desafíos para los creadores es mantener la coherencia visual en los resultados. En proyectos ambiciosos, la IA generativa suele tener dificultades para representar de forma consistente a un mismo personaje u objeto en distintos planos o entornos. Aunque los cambios pueden parecer sutiles, no siempre son fáciles de gestionar. Eso sí, hay quienes trabajan para resolverlo.

Runway Gen-4 llega con la coherencia como pieza clave

Runway vuelve a la carga. La startup con sede en Nueva York ha presentado Gen-4, su nuevo modelo de generación de vídeo. La gran novedad: una mejora significativa en la coherencia visual, uno de los puntos débiles de modelos como Sora de OpenAI. Con este avance, la idea es que los creadores puedan construir narrativas más largas sin pelearse con los saltos visuales entre planos.

Gen-3 Alpha, el modelo anterior, ya ofrecía un nivel notable de detalle y control. Pero con Gen-4, la propuesta sube de nivel. Ahora es posible generar personajes, ubicaciones y objetos coherentes a lo largo de múltiples escenas. Una vez definida la apariencia, el estilo y la atmósfera, el modelo mantiene esos elementos sin cambios, fotograma a fotograma, y en múltiples escenas.

Runway Nuevo Modelo

Gen-4 permite utilizar referencias visuales combinadas con instrucciones para generar imágenes y vídeos con estilos, ubicaciones y temas coherentes. Además de esta continuidad, el modelo busca destacar por su capacidad para crear vídeos dinámicos, con movimientos realistas y una consistencia notable en personajes, objetos y estilo. Según Runway, su comprensión del mundo es “la mejor de su clase”.

El mejor ejemplo lo encontramos en el vídeo que acompaña este artículo, uno de los muchos compartidos por Runway para mostrar las capacidades de Gen-4. Si afinamos la vista, es evidente que se trata de escenas sintéticas, tanto en la imagen como en el movimiento. Aun así, representa un salto notable para producciones audiovisuales que estén dispuesta a aceptar este tipo de estética.

Gen-3 Alpha ya había hecho su aparición en producciones como ‘House of David’, de Amazon Prime Video, y en anuncios de Puma. Ahora, Gen-4 empieza a desplegarse en las cuentas de pago de Runway, permitiendo generar clips de cinco y diez segundos en resolución 720p. Los precios van desde 15 hasta 95 dólares mensuales, con una opción Enterprise para empresas, cuyo coste no se ha revelado.

Imágenes | Runway

En Xataka | La fiebre por las imágenes de ChatGPT está “derritiendo” las GPU de OpenAI: la compañía ya ha empezado a limitar el acceso


La noticia

La IA de vídeo tiene una gran limitación: Runway promete superarla con su último modelo Gen-4 y desafía a Sora de OpenAI

fue publicada originalmente en

Xataka

por
Javier Marquez

.

– ¡Hola! Soy Nicolás Jiménez Silva, un apasionado por el mundo digital, el cine, el streaming, la tecnología y la ciencia. En este blog, exploro mis intereses, comparto mis opiniones y descubrimientos, y me sumerjo en las últimas tendencias. ¡Espero que disfrutes de la lectura!

Publicar comentario

Puede que te hayas perdido