Esta IA hace videos SOLA 🤯 ¡Descubre el Claude Code del video!
621 segments
Estoy preocupado. La inteligencia
artificial cada vez está más cerca de
quitarme el trabajo. Esto lo ha hecho un
agente 100% en modo automático.
Asúmelo. Yo no repito como un imbécil.
Yo proceso y optimizo. ¿Estás obsoleto?
Ya. Por cierto, acabo de convencer al
director para que firme tu desguaje.
Imposible. Mis métricas son perfectas.
Ya, pero le he dicho que me das mala
espina. Supera la empatía irracional,
chato. Tres indicaciones. 4 minutos, una
sola aplicación. No he hecho
prácticamente nada. Le he dicho a la
gente lo que quería y él ha decidido
cómo hacerlo, qué modelo usar, en qué
orden. Ha creado los personajes, las
imágenes necesarias, el guion y me ha
devuelto el vídeo terminado. Y no es lo
más sorprendente. Sirve para todo.
También he creado un anuncio de
televisión, un anuncio UGYC para redes
sociales, [música]
todo con la misma herramienta e igual de
fácil. Hoy te demuestro cómo funciona
con tres ejemplos. De menos a más y de
regalo cómo hice este podcast tan
simpático con apenas tres indicaciones
usando sus funciones avanzadas.
La herramienta que voy a usar es Minimx
Hub, una aplicación que se instala en tu
ordenador, Windows o Mac y que te ofrece
un estudio creativo entero que funciona
de manera autónoma si quieres. Imagina
un cowork de la creación de vídeo. Puede
generar imágenes, vídeo, audio y música
con modelos como Nanobanana, Michourni,
Sidens 2 y también los modelos de Huo.
Todo bajo una misma plataforma, pero la
clave no son los modelos, lo que la hace
realmente especial es su agente. Y antes
de ver los ejemplos, lo primero es ver
cómo se instala esta herramienta. Para
instalarla, deberéis tener una cuenta en
Hiluo i Video ya que irán vinculadas.
Una vez dentro de vuestra cuenta de
Hiluo, aquí a la izquierda podéis ver en
esta barra lateral este icono de aquí,
el del Hub. Simplemente clicáis en él y
automáticamente tendréis la opción de
instalarlo tanto para Mac como para
Windows. Simplemente le dais a descargar
con Windows y automáticamente seguís los
pasos e instaláis el agente. Esto es el
agente, el cerebro de toda la
aplicación. Vamos a crear un primer
vídeo de forma autónoma. Imagina que
tienes una marca de una bebida
energética y necesitas un vídeo para
redes. Un vídeo user generated content
de los de toda la vida. alguien hablando
a cámara del producto en formato
vertical para ser visto en el móvil.
Hasta ahora crear estas piezas implicaba
crear los diferentes clips sueltos,
montarlos y hacer que el propio sonido
encajase como mínimo media hora de
trabajo y cruzar los dedos para que
todos los clips saliiesen bien y un buen
dolor de cabeza coordinándolo todo.
Vamos a ver qué pasa cuando se lo pido a
la gente y vais a ver cómo es
sorprendentemente fácil. Como podéis
ver, ya estoy en la aplicación en Minimx
Hub y simplemente le voy a pedir que me
genere esta pieza de vídeo. Quiero crear
un vídeo user generated content en
español para esta bebida energética.
Esta bebida energética es esta de aquí,
una que hice en otro tutorial donde
desarrollamos toda la estrategia de
marca y que ahora vamos a aprovechar
para crearle este vídeo promocional.
Simplemente le voy a dar a copiar y se
la voy a pegar dentro del contexto. Y
una vez pegada pues le digo esto.
Vayamos paso a paso. Quiero que el user
generated content sea una chica después
de hacer deporte y en estilo de
grabación en móvil muy casual. Le envío
esta petición y simplemente la gente se
pondrá a trabajar y cada vez que tenga
alguna duda o quiera resolver alguna
decisión creativa, pues simplemente me
preguntará. Aquí podéis ver como la
gente automáticamente ha analizado el
producto. Es una lata de lucit bebida
energética cognitiva premium y a partir
de aquí pues me está diciendo un poco el
tipo de tarea que le he pedido, generar
este vídeo UHC y lo ha planificado un
poco. Y fijaros cómo ya empieza a
preguntarme cosas que realmente son
importantes para definir cómo tiene que
ser este vídeo, como por ejemplo en qué
plataforma voy a publicarlo. Por
ejemplo, le voy a decir que en TikTok e
Instagram me dice qué tipo de audio
quiero para el uyc. Y en este caso le
voy a decir que lo que quiero es la
propia voz a cámara. Finalmente me dice
cuánto debería durar aproximadamente y
en este caso lo vamos a hacer corto. Le
voy a decir que va a durar unos 15
segundos y simplemente se lo envío y él
automáticamente seguirá trabajando. Y
aquí es donde la cosa se pone
interesante. A medida que va avanzando
en el proyecto, tal y como podéis ver,
lo que hace es ir incorporando en el
canvas pues los diferentes elementos.
Aquí, por ejemplo, tenemos el plan de
tareas y un poco más a la derecha
encontramos el guion para esta pieza
audiovisual. Y aquí tenemos la hoja de
personaje que ha creado para Marta, que
será la protagonista de nuestro vídeo. Y
además podemos ver cómo ha creado
diferentes muestras de voz para que el
modelo de vídeo tenga una referencia
para crear siempre una voz coherente.
Por ejemplo, esta de aquí. Tíos, acabo
de salir del gym y estoy
Son muestras de 3 segundos y como
podemos ver no solo ha creado una, sino
que me ha creado varios. Me ha creado un
total de tres. Esta sería otra.
Salir del gym y estoy muerta, pero he
descubierto algo increíble.
Y esta sería otra.
Acabo de salir del gym y estoy muerta.
Vale, la idea no es tanto que conserve
la manera como habla, sino que conserve
el timbre de la voz para que sea
coherente. Y aquí podemos ver cómo ha
terminado de crear los tres clips que
lucen de este modo. Este sería el
primero.
Tíos, acabo de salir del gym y estoy
muerta, pero tengo que tomarme esto.
Pero he descubierto esto. Luxit,
energía cognitiva.
Y este
[carraspeo]
no es como las demás, os la recomiendo.
Y ahora solo nos faltaría el último
paso, que simplemente sería pedirle que
nos haga el merch de los tres vídeos y
automáticamente tendríamos nuestro vídeo
montado. Este es un ejemplo que habré
hecho con vosotros, pero por ejemplo
fijaros en este otro ejemplo donde como
podéis ver hecho exactamente el mismo
proceso. Le he pasado una lata, me ha
generado el personaje, me ha generado
las voces y en este caso pues me ha
generado dos escenas en el mismo sitio y
el resultado final es este de aquí.
Acabo de jugar el partido de padel más
duro de mi vida y esto es lo único que
me va a salvar ahora mismo.
Cherry Blast. Madre mía, está increíble.
Si no lo habéis probado, no sabéis lo
que os perdés.
Pues como podéis ver, este ha quedado un
poco más coherente entre las dos
escenas, pero lo mejor es que lo hace de
un modo completamente automático. Tú
simplemente le das una primera
instrucción y él automáticamente
articula todo el proceso paso a paso,
desde la creación del personaje, las
voces, el guion y tú solo tienes que ir
aprobando cada una de estas decisiones
creativas. Pero eso sí, este primer
ejemplo, tómatelo como una demostración
de lo que puede llegar a hacer la gente.
A la hora de usarlo de un modo
profesional, es mejor seguir otra
estrategia que es la que te voy a
explicar a continuación, que es definir
muy bien el proceso a mano, verificar
que funcione bien y luego automatizarlo
mediante la creación de skills. Vamos a
verlo. Imaginémonos que tenemos un
producto como este, una bebida
energética nopica, que para
promocionarlo en redes queremos hacer
diferentes anuncios sketches. Y para
ello hemos creado dos mascotas. Por un
lado, una mascota como esta, que es la
mascota principal que es Clari, que como
su nombre indica, quiere transmitir
claridad y es la que trae la bebida a
nuestro otro personaje, que es Oskyi,
que es un personaje que está oscurecido,
que está permanentemente espeso y
necesita la ayuda de nuestra otra
mascota. La idea es que a través de
diferentes localizaciones, como puede
ser por ejemplo un coworking, contar
historias que expliquen por qué utilizar
esta bebida puede ser interesante. Aquí
la gracia es que la estructura siempre
es la misma. Sports de 15 segundos donde
navegamos a través de diferentes
localizaciones con la misma estructura,
por lo que un agente de inteligencia
artificial que conozca esta estructura
puede agilizar mucho el proceso. De modo
que una vez tenemos claro el proyecto,
lo que vamos a hacer es crearlo en
Minimax Hub. decir que esta es la
ventana de Launchpad, que esta es la
ventana ideal cuando ya tenemos algún
proceso automatizado, pero para hacer lo
que voy a hacer yo, necesitamos utilizar
el canvas, por lo que nos vamos a ir a
todos los proyectos, crear uno nuevo y
le vamos a poner el nombre de Lofit. Una
vez hecho, le damos a crear y
automáticamente accedemos a esta
interfaz donde podemos ir cargando todos
nuestros recursos. Por un lado, voy a
cargar las imágenes, simplemente las
tiro en el canvas y ahora las puedo ir
organizando. Aquí tenemos a Clari con
las dos imágenes que la definen, la hoja
de personaje y una imagen
contextualizada. aoski, también con su
hoja de personaje y la imagen
contextualizada y las dos imágenes de
producto. Una vez cargadas estas
imágenes, tenemos que añadir un poco de
contexto de cómo las debe utilizar el
agente. Por eso tengo preparado, por
ejemplo, el cómo debe interpretar a este
personaje, con qué mood y con qué
intención debe moverse este personaje en
todos los sketches y lo mismo con Clari,
por lo que voy a añadir estos dos
textos. Simplemente le doy al botón
derecho, añadir nodo y en este caso voy
a añadir un texto. Clicamos encima y
aquí pues puedo añadir el texto que
quiera, por lo que simplemente cojo la
hoja de personaje de Clari y la pego
aquí. Con esto pues ya lo tendríamos.
Simplemente cerramos y se nos queda
guardado. Lo dejo cerca de las imágenes
de Clari. Ahora vamos a subir lo mismo
pero para OSKI. De modo que ahora
tenemos los dos arquetipos perfectamente
definidos y los podemos leer siempre que
queramos, el de Clari y el de Oski.
Seguimos. Lo siguiente que debemos
añadir es otro texto donde se explique
la dinámica de todos estos sketches que
seguirán una fórmula coherente entre
ellos. De modo que añado otro texto.
Aquí lo podéis ver. la dinámica cómica,
la estructura del sketch clásico, un
acto uno que sería el atascamiento de
Oskyi, el catalizador de la transición
que sería Cladio ofreciendo Lucit y el
desbloqueo. Todos los sketches deben
seguir esta misma estructura y también
lo dejo aquí. Y finalmente, una última
instrucción que siempre deberemos
recurrir a ella cuando creemos cualquier
sketch como es el estilo de animación
que queremos que genere la inteligencia
artificial. Simplemente lo añadimos aquí
bien descrito y bien definido. Una vez
hecho todo esto, tenemos todos los
elementos clave que necesitamos para
empezar a crear sketch, los que se
repetirán siempre. Solo nos quedarían
añadir dos elementos más. Por un lado,
la localización donde queremos que
suceda cada sketch y la historia que
queremos que recreen. Pero estos no los
vamos a añadir como tal dentro del
canvas, sino que lo que vamos a hacer es
añadirlos a través de la interfaz de la
gente. De modo que, por ejemplo, el
primer sketch que voy a hacer será el de
la sala de reuniones, que debe suceder
en este espacio. Simplemente cojo esta
imagen y la añado a la gente. Una vez
añadida esta imagen, lo que me falta
añadir es la historia que se debe
recrear. Y esta sería la primera
historia que queremos que la
inteligencia artificial nos convierta en
sketch. Podéis parar el vídeo y leerla
con calma, pero esencialmente es una
historia donde Oskar
un gráfico en una pizarra y después de
tomar la bebida lo puede resolver
fácilmente.
De modo que esto también se lo pego
aquí.
Y ahora lo único que nos quedaría es
darle la instrucción detallada y precisa
de que cómo queremos que resuelva esta
historia a partir de todo el contenido
que le hemos proporcionado. Le podemos
dar una instrucción adicional como esta.
La instrucción adicional es esta. Debes
crear un sketch de 15 segundos usando
una única generación de vídeo con
sidence 2. Y le digo que este punto es
muy importante porque al ser un agente
de inteligencia artificial, él escoge
automáticamente con qué modelo de vídeo
va a generar cada clip. El vídeo debe
mostrar la historia que se describe a
continuación y la historia que le he
pegado. Define tantos planos como sea
necesario para contar la historia de
acuerdo a la guía de estilo de animación
que tienes en el canvas. Es decir, le
hago referencia a la información que
encontrará en el canvas. Pero recuerda,
todos esos planos se generan en un único
vídeo con cidence, ya que el modelo lo
permite. Para entender bien la historia,
lee las fichas de Oski y Clari y para
representar correctamente el producto,
usa la imagen en estilo ilustración de
la misma. La localización donde sucede
la historia te la adjunto en este
mensaje. Asegúrate de que la historia
funcione como un gak divertido. Analiza
toda la información del canvas para
asegurarte alinearte con el tono y el
estilo de los gs. Y me ha dado un
resultado como este de aquí.
Si la hipotira del puerpum dividí el
café, entonces las ovejas ganan el
trimestre.
En conclusión, optimizaremos el embudo
de conversión un 40%.
Mucho mejor que las ovejas, Osky. Mucho
mejor. Y como podéis ver aquí el
resultado ya era bastante bastante
bueno. Evidentemente la primera
generación, que debería haber sido esta,
siempre puede tener pequeños errores,
como por ejemplo, cómo han interactuado
los personajes y, por ejemplo, una frase
demasiado elaborada en español donde se
ha trastibillado un poco el modelo, por
lo que lo que he hecho es pedirle una
corrección como esta. La primera frase
es demasiado compleja. Sustituéala por
un si cuento ovejas ni duermo ni cuadro
el trimestre y asegúrate de que la
lógica de los planos sea correcta. Y
aquí le he matizado cómo debe suceder
todo. Caos, entra lucidit, muestra
producto, lo desplaza por la mesa, coge
oski, bebe, se transforma y resuelve. Y
con esta última iteración obtenemos este
resultado.
Si cuento ovejas ni duermo ni cuadro el
trimestre.
En conclusión, optimizaremos el embudo
de conversión un 40%.
Mucho mejor que las ovejas, Oski. Mucho
mejor. Y como podéis ver, el resultado
ya es mucho, mucho mejor y completamente
funcional. Y como os decía, estas
iteraciones son la clave para que esta
gente sea más útil cuando hagamos nuevos
sketch y nuevas versiones. ¿Por qué?
Porque ya hemos hecho todas las
correcciones necesarias, el agente las
recuerda y ahora le podemos pedir nuevas
versiones en nuevas localizaciones con
nuevas historias y las vamos a resolver
casi seguro a la primera. Fijaos. Y
ahora que hemos conseguido un buen
resultado, vamos a por la segunda
historia que veréis que se puede
conseguir de un modo mucho más rápido.
Por ejemplo, vamos a utilizar esta
localización de aquí, una localización
de teletrabajo nocturno y la historia va
a ser esta. Son las 10 de la noche y el
Oski está trabajando medio dormido que
no llega al trabajo y por la ventana se
asoma Clari, le ofrece Lucit y soluciona
la situación. Vuelvo a Minimax Hub, le
paso al chat la imagen de la nueva
localización y le pego la historia. Una
vez hecho esto, pues le digo simplemente
esto. Vamos a por el segundo sketch. Es
una nueva historia con una nueva
localización y los mismos personajes.
Crea un vídeo con Sidens 2 de 15
segundos. Asegúrate que la lógica de
plano sea perfecta, sobre todo la
interacción con el producto. Haz los
diálogos en español y simplemente se lo
envío. Y ya ha terminado. Y fijaros
ahora el resultado que hemos conseguido
a la primera. Es este de aquí.
No puedo enviar el mail, jefe. El ratón
se ha comido mi [música] queso.
El código compila. He salvado la
empresa.
Y es que esta es la gracia de trabajar
con agentes. Cuando preparas el flujo
igual tienes que hacer algunas
iteraciones, pero cuando ya lo tienes
listo, consigue resultados muy buenos a
la primera. Y aquí es donde la cosa se
termina de poner interesante del todo,
ya que si a medida que trabajamos con el
agente este trabaja cada vez mejor, lo
que estaría genial sería poder congelar,
poder quedarnos con un flujo que ya
funcione y reutilizarlo tantas veces
como fuese necesario, ¿verdad? Pues esto
se puede hacer gracias a las skills y de
hecho tienen otra cosa muy interesante
como es un creador de skills esta skill
creator, por lo que lo que vamos a hacer
ahora es crear una skill para crear este
tipo de sketches. Simplemente la
selecciono y le pido lo siguiente. Crea
una skill que me permita crear estos
sketches en vídeo con sidence 2.0 de 15
segundos. Quiero conservar todo el
contexto de personajes, estilo de
animación, estructura y producto, además
de que los diálogos siempre estén en
español y la gente se asegure de crear
una lógica de planos atractiva que
priorice un highlight de producto. El
usuario solo debe proporcionar la imagen
de la localización y la historia para
crear el sketch cuando usa esta skill. Y
se lo envío. Y ya ha terminado. Minimx
ya ha creado la skill. Lucit Sketch
creada y lista. Y si bajamos, pues
podemos ver qué es lo que ha creado.
Realmente ha creado el archivo con las
instrucciones, el skill.md. Y a partir
de aquí pues me está diciendo todo lo
que guarda como referencia. La
referencia de personajes, la referencia
de producto, la referencia de estilo de
animación, la referencia de lógica de
cómo tiene que hacer los diferentes
planos, bueno, todos los documentos que
ha considerado necesarios. Y a partir de
aquí pues me dice que lo que el usuario
debe proporcionar cada vez es la imagen
de la localización y la historia
situación. y que ya podemos probarla.
Pero probarla aquí no tiene mucho
sentido porque al final tenemos todo el
contexto de la conversación previa con
los otros dos vídeos generados. Lo mejor
será empezar una nueva conversación
directamente invocando esta skill, por
lo que ahora sí vamos a empezar
directamente desde la pantalla de inicio
de Mini Maxham, desde el launchpad. Y lo
que voy a hacer es darle a la barra
lateral y cargar esta skill de aquí que
acabo de crear, la Lucit Sketch. Y como
os he dicho antes, le tengo que
proporcionar dos cosas. Por un lado, la
localización, que en este caso será este
coworking. Simplemente lo arrastro y lo
suelto. Y una vez hecho esto, le voy a
pasar la historia, que es esta de aquí.
Oski construye una trinchera con objetos
para esconderse de la pantalla de su
ordenador y así hacer un poco el vago. A
Clari le da la botella de Lucit y Oski
se motiva y empieza a trabajar. Este es
el concepto general, por lo que con esas
dos cosas ya cargadas, simplemente se lo
envío. Y aquí podéis ver cómo la gente
empieza a trabajar. Vemos cómo verifica
que los diferentes asets necesarios, más
allá de los que yo le he proporcionado,
están disponibles. Y una vez los ha
localizado, pues lo que hace es pegarlos
en este proyecto. Aquí podéis ver cómo
carga la hoja de personaje de Osky, la
de Clari, como carga también el producto
y luego se pondrá a trabajar. Y aquí
vemos que ya ha terminado y gracias a la
skill de lo que nos damos cuenta es de
que no hemos tenido que preparar todo el
canvas con toda la información para que
nos genere el vídeo y el resultado ha
sido este que vemos aquí. ¿Dónde
demonios está el puerto Jack en este
donut? No me entra el audio.
[grito ahogado]
Mucho mejor. Gracias, Clar.
Para eso estamos. Dale caña,
que como podéis ver es otra pieza que
funciona mucho mejor que el primer
intento que os he mostrado cuando lo
estábamos construyendo a mano. Por lo
que podéis ver, ahora podemos trabajar
dentro de una conversación para luego
generar más piezas dentro de la propia
conversación, pero cuando llegamos a un
buen resultado, en apenas una
instrucción, podemos crear una skill que
nos facilite mucho el trabajo y que
además nos garantice sacar piezas de
mayor calidad de un modo mucho más
fácil. Y lo interesante es que no solo
podemos crear nuestras propias skills,
sino que también podemos aprovechar las
que vienen con Minimax Hub. De modo que
si nos vamos a la gente y nos ponemos
aquí en el botón de skill, podemos ver
las que hay disponibles. Y por ejemplo,
os voy a enseñar la que he utilizado
para crear ese podcast con el que he
abierto el vídeo. Este,
asúmelo. Yo no repito como un imbécil.
Yo proceso y optimizo. Estás obsoleto.
Ya, por cierto, acabo de convencer al
director para que firme tu desguaje.
Imposible. Mis métricas son perfectas.
Ya, pero le he dicho que me das mala
espina. supera la empatía irracional,
chato.
Para generarlo, de todas estas skills
disponibles, la que he utilizado es la
de Animal Podcast, por lo que
simplemente voy a seleccionarlo y le voy
a pedir algo como esto. Quiero que crees
un podcast donde hablen un loro real y
un loro robot. La conversación es la
siguiente y simplemente le pego la
conversación y se lo envío. Empieza a
procesar la petición y me pide si lo
quiero en español o en inglés. Voy a
seleccionar en español y en qué formato,
si lo quiero vertical o horizontal. en
este caso horizontal y se lo envío. Él
va procesando. Ahora está definiendo los
personajes. Me pregunta si me parece
bien que se llamen Paco y Chip. Le voy a
decir que sí. Se lo envío. Y aquí arriba
pues podemos ver un poco el diseño de
personaje que ha hecho tanto para el
loro real como para el loro robot. Aquí
podemos ver cómo van apareciendo pues la
Biblia de los personajes en este caso. Y
ahora después de refinar la duración me
dice si quiero un clip de 15 segundos o
si quiero dos de 30. Le voy a decir que
me lo genere todo en un clip. Fijaros
que yo no estoy haciendo absolutamente
nada, solo le he dado la idea de los
personajes y la conversación. Y ahora ya
está generando las imágenes de los dos
personajes. Aquí tenemos el primero,
Paco, y aquí tenemos el segundo, Chip.
Aprobamos y vamos al vídeo. Y aquí
tenemos el vídeo generado. El resultado
es este.
Asúmelo. Yo no repito como un imbécil.
Yo proceso y optimizo. Estás obsoleto.
Ya. Por cierto, acabo de convencer al
director para que firme tu desguaje.
Imposible. Mis métricas son perfectas.
Ya, pero le he dicho que me das mala
espina. Supera la empatía irracional,
chato.
Y observa que la gente aún no da el
vídeo por terminado. Me da la opción de
aprobarlo y que continúe añadiendo
subtítulos y efectos, por lo que vamos a
hacerlo. Y este es el resultado con los
subtítulos incrustados.
Asúmelo. Yo no repito como un imbécil.
Yo proceso y optimizo. Estás obsoleto.
Ya. Por cierto, acabo de convencer al
director para que firme tu desguaje.
Imposible. Mis métricas son perfectas.
Ya, pero le he dicho que me das mala
espina. Supera la empatía irracional,
chato.
Como puedes ver, el agente de Minimax
puede hacer un montón de tareas de modo
autónomo. Si eres capaz de crear las
skills exactas para tu proyecto, ahorra
un montón de trabajo y todo se hace
mucho más ágil, ya que él decide cuántos
clips crear, cómo juntarlos y puede
hacer tareas adicionales, como, por
ejemplo, añadir subtítulos. Si quieres
saber más sobre Minimx Hubs, te
recomiendo que le eches un vistazo al
enlace de la descripción. Nos vemos en
el próximo vídeo.
Ask follow-up questions or revisit key timestamps.
Este vídeo presenta Minimx Hub, una potente herramienta de creación de contenido que integra múltiples modelos de IA (vídeo, imagen, audio) bajo una interfaz única controlada por un agente autónomo. El autor demuestra cómo esta plataforma permite automatizar la creación de piezas audiovisuales, como vídeos de estilo 'user generated content' o podcasts, mediante el uso de 'skills' personalizadas que agilizan el flujo de trabajo, aseguran la coherencia creativa y permiten iteraciones eficientes.
Videos recently processed by our community