Pululart

Desde hace relativamente poco, en esta tercera década del siglo XXI, se habla mucho de la Inteligencia Artificial (IA), por cómo ha entrado de lleno en el mundo creativo y artístico. Al hablar de IA la gente ya no piensa en fábricas de coches automatizadas o en electrodomésticos que funcionan solos, sino en ChatGPT y Midjourney.

Dos de las disciplinas más comentadas han sido la generación de texto y conversaciones (ChatGPT, Jasper, WriteSonic, Neuron Writer…) y la de imágenes (Dall-E, Stable Diffusion, Midjourney…). Ambos casos han evolucionado de la misma manera: los primeros resultados eran graciosos, extraños y, en cierto modo, adorables. Pero en un par de años de progreso se ha llegado a un nivel de calidad que nadie podía imaginar. En la actualidad, la IA parece entender el concepto de belleza, simpatía, felicidad, miedo… y conoce todos los estilos artísticos que han existido a lo largo de la Historia.

Ahora es el momento de los videos y es normal pensar que el proceso será el mismo. De nada sirve decir “la IA no puede llegar hasta ese punto”. Es una realidad, es revolucionaria y lo mejor es pensar cómo aprovechar su llegada. De hecho, existe un agregador de IAs llamado There’s an AI for that, que desafía las incertidumbres de los más escépticos.

¿Qué aspecto tienen hoy los videos hechos con IA?

Por ahora, las pequeñas películas generadas por IA tienen animaciones muy robotizadas o muy mutantes. Es decir, por un lado, un movimiento lento, recto y demasiado preciso y, por otro lado, todo lo contrario, un movimiento caótico y deforme. Quizá lo más estético que se ha visto hasta ahora es el videoclip de Jaime Altozano versionando Flowers, la canción de Miley Cyrus.

Otros videos populares generados con IA

¿Cómo hizo Jaime Altozano su videoclip?

Por suerte para los más curiosos, este divulgador español explicó el proceso creativo de su videoclip. Su equipo se grabó en su estudio habitual, de forma convencional. Luego subieron el contenido grabado a dos inteligencias artificiales: Kaiber y RunwayML. Con ellas, transformaron todo su estilo, manteniendo lo que viene a ser el esqueleto de las figuras.

El equipo estuvo más satisfecho con los resultados de Kaiber, aunque de todos modos, antes de publicarlo, editaron el color del video para darle un aspecto más atractivo y unificado. El trabajo total consistió en una semana a tope con 5 empleados. Podríamos decir que estas dos aplicaciones de IA que consideró el youtuber son las más punteras en este momento.

Los mejores software de video hecho con IA

En estos primeros momentos de videos generados por IA ya se han abierto paso algunas aplicaciones, que probablemente sean recordadas como pioneras en los próximos años.

Kaiber

Kaiber es una de las herramientas más potentes y populares del momento, en este campo. Una de sus finalidades es animar una imagen estática, por ejemplo en formato JPG. Esto da lugar a los típicos videos con aspecto de fotografía, que cada X milisegundos va mutando a alternativas similares.

Funciona a través del navegador, escribiendo el texto (prompt) como ya ocurre en Stable Diffusion u otras herramientas similares. También se puede subir desde el principio una imagen en JPG ya existente y todo el video resultante será similar. Otra opción es subir un video desde el principio y Kaiber respetará el movimiento original del video, pero añadiendo su estilo IA, es decir, esos elementos que cambian a gran velocidad. El aspecto final es tan reconocible que dentro de unos años será visto con cierta nostalgia.

A Kaiber se le puede pedir que adopte estilos artísticos (Expresionismo, Van Gogh, Stan Lee, Ghibli…), ya que los reconoce y los sabe imitar, como ya hacen las herramientas más reconocidas de imagen.

La versión de pago de Kaiber permite simular el movimiento de una cámara: travelling, zoom, cambio de ángulo, para hacer videos más narrativos o cinematográficos. La aplicación puede convertir unos paisajes en otros, unas personas en otras, unos objetos en otros… Los resultados pueden ser muy estéticos, sobre todo si se realizan desde un ordenador de alta gama y se intentan mejorar con otro software de edición a mayores, como los de Adobe.

El uso más destacado que se le ha dado a Kaiber es el videoclip. Las animaciones de cámara, por ejemplo, pueden identificar el ritmo de una canción y moverse en sincronía.

Planes de Kaiber:

  • Prueba gratuita
  • Explorer: 5$ /m
  • Pro: 10$/m
  • Artist: 25$/m

RunwayML

Runway es una aplicación similar a Kaiber, con la diferencia de que su resultado suele ser más “imaginativo”, es decir, que se aleja más del archivo original, aportando más elementos inesperados.

Su mayor punto fuerte es la variedad de herramientas que pone a tu disposición, fácilmente localizables en el menú principal. Gen-1 (de video a video), Gen-2 (de texto o de imagen a video), texto a imagen, imagen a imagen, quitar fondo (mediante una máscara hace que el fondo de un video sea transparente), emborronar las caras de las personas, poner un video a cámara súper lenta.

Runway permite incluso entrenar tu propio generador de imágenes, siendo uno de los aspectos que más le diferencia. A través de esta modalidad, el programa quiere hacer accesibles las técnicas del machine learning a usuarios que no saben programar.

Planes de RunwayML

  • Básico: 125 créditos gratuitos de por vida. Gratuito
  • Estándar: 625 créditos al mes. 12$/mes
  • Pro: 2250 créditos al mes. 28$/mes
  • Ilimitado: uso sin límites. 76$/mes
  • Empresas: acuerdo a través de un contacto

Genmo AI

Hasta hace poco, Genmo era una aplicación en navegador muy similar a Kaiber. Pero ahora su formato principal se ha convertido en un chat, permitiendo mayor interacción, ya que puedes decirle qué te parecen sus resultados cada vez que te da uno. Le pides una imagen o un video escribiendo en el chat, él genera un contenido y tú le explicas qué te ha parecido, volviéndolo a intentar o pasando a otra cosa.

Genmo también permite subir imágenes de tus propios archivos y partir de ellos como base. En la página principal aparece una biblioteca de proyectos de la comunidad, que ya dan una idea de su potencial y que están disponibles para descargar. Además, en tu cuenta personal de usuario se guarda tu historial de proyectos.

Planes de Genmo

  • Versión gratuita
  • Versión Turbo: 10$. Permite hacer más contenido, acceder al chat y eliminar la marca de agua.

Pika Labs

Igual que ocurre en Midjourney, para emplear Pika Labs es imprescindible tener una cuenta en Discord, un trámite que interpone su empresa matriz pero que es gratis y no lleva nada de tiempo. Es muy similar al actual Genmo, porque todo funciona como un chat, dentro de una conversación en Discord, en la que escribes tus textos y subes imágenes.

Planes de Pika

Probablemente la mayor ventaja de Pika es su precio: ¡totalmente gratis! Al menos, por ahora.

Capcut

Capcut está disponible a través de navegador o en versión local para Windows. Recuerda mucho al editor de video de Canva, solo que está más enfocado en efectos visuales muy sofisticados, gracias al potencial de la IA. Es ideal para hacer videos de motion graphics, sobre todo para redes sociales. La gran ventaja vuelve a ser su gratuidad, igual que en Pika Labs.

Planes de Capcut

De igual manera que Pika, usar Capcut es completamente gratis a día de hoy.

Diferencias entre herramientas generadoras de vídeo con Inteligencia Artificial

Una vez vistas estas cinco herramientas, se puede apreciar que son bastante similares. No obstante, la siguiente tabla permite ver de manera más resumida las diferencias clave entre ellas. La más distinta es Capcut, al no ser un generador de video como tal.

Kaiber

RunwayML

GenmoAI

Pika Labs

Capcut

¿Ofrece algo gratis?

Prueba gratuita

Prueba gratuita

Versión gratuita permanente (con menos funciones)

Totalmente

gratis

Totalmente

gratis

Texto/ imagen a video

No

Video a video

No

No

No

Tiene editor de video

No

No

Sin embargo, también existen otras herramientas centradas en las presentaciones, los videos corporativos y la generación de voz, que en el fondo, no dejan de ser generadores de video con Inteligencia Artificial, aunque es cierto que difieren bastante de las aplicaciones anteriores. Hablamos de Synthesys o D-ID.

Synthesys

Synthesys está enfocado sobre todo en la voz en off hecha por inteligencia artificial, pero con el añadido de actores (avatares) y sincronización labial. En otras palabras, personas ficticias con la intención de sustituir a los actores reales. También cuenta con generador de imagen por Inteligencia Artificial. Las voces son muy realistas y personalizables, aunque en el fondo se nota que son generadas por IA. El editor es muy intuitivo, pero a día de hoy es algo caro.

Planes de Synthesys

  • Solo voz: 35€/mes
  • Voz y avatar: 45€/mes
  • Completo: 65€/mes

D-ID

D-ID viene a ser competencia directa de Synthesys. Ofrece un repertorio de voces y avatares entre los que elegir, para que ellos hablen y presenten un video. Los resultados son algo robóticos, sin llegar a ser desagradables, por lo que dan un aspecto muy corporativo y neutro a los videos generados.

Aun así, teniendo en cuenta la velocidad a la que avanza este entorno, se espera que sean más naturales con el paso de unos años. D-ID permite controlar y editar la expresión facial de los avatares, el tono y ritmo de voz. Además, está capacitado para hacer streaming, más allá de videos grabados previamente. Igual que su competidor, tiene un precio elevado.

Planes de D-ID

  • Prueba gratuita de 1 mes
  • Build: 18$/mes
  • Launch: entre 50 y 150$/mes
  • Scale: entre 200$ y 300$/mes
  • Enterprise: contactar y negociar un precio

¿Quieres estar al día en Inteligencia Artificial? Los mejores canales de YouTube:

  • Carlos Santana (DotCSV): cuando alguien menciona YouTube e Inteligencia Artificial en la misma frase es imposible no pensar en DotCSV. Por méritos propios es el mayor referente del tema en habla hispana. Es conocido, entre otras cosas, por haberse entrevistado a sí mismo.
  • Xavier Mitjana: este divulgador está creciendo a gran velocidad últimamente, subiendo varios videos a la semana y no precisamente con poca información. Si quieres empaparte de la actualidad en IA más rápido que nadie, este es tu sitio.
  • Obscurious (en inglés): Obscurious ofrece de manera clara muchos consejos y tutoriales para sacarle el mayor partido a la últimas novedades del mundo de la Inteligencia Artificial. Lleva menos de un año en activo pero crece con enorme rapidez.

La Inteligencia Artificial cambiará para siempre el sector audiovisual

En definitiva, el escepticismo es inútil. La frase “es imposible que una IA haga eso” está destinada a fracasar. La Inteligencia Artificial está llegando a todas partes y no lo hace en cuestión de años, sino de meses. Por ahora, algunos resultados son raros o insatisfactorios, pero esto solo acaba de empezar. Como dice Obscurious, “en la escala temporal de la IA, un par de meses de progreso parecen varios años.”

Es el comienzo de una revolución a la que Carlos Santana se ha atrevido a llamar la “Cuarta Revolución Industrial”. Ahora es un tema de conversación entre los más forofos de la tecnología, pero tarde o temprano llegará a las calles y a los telediarios generalistas. Se espera que ponga sobre la mesa un debate ético intenso: por un lado se podrá usar para hacer el mal, pero por otro lado, para solucionar problemas que hasta ahora se consideraban imposibles.

En el sector audiovisual permite acelerar un montón de procesos que hace apenas unos años llevaban mucho tiempo y esfuerzo. La Inteligencia Artificial supone un enorme ahorro de costes e incluso una mejora de calidad. Un avance sin precedentes en la industria del cine, la televisión y el contenido de redes sociales.