
¿Sabes que puedes crear vídeopodcasts, como el que se muestra a continuación, con dos personajes conversando? Se trata de un episodio de Cómo lágrimas en la lluvia, donde Blogpocky y Tweetie nos explican cómo configurar la navegación segura con DSN4EU
Información sobre accesibilidad
En la parte inferior de este vídeo, y de otros que puedan aparecer en esta página, puedes activar los subtítulos.
Para acceder a una transcripción, haz clic en «YouTube» y en la página del vídeo, en la sección anterior a los comentarios, haz clic en «Mostrar transcripción».
Guía paso a paso para crear un vídeo con dos personajes conversando
Ya te apunté cómo crear personajes que hablan, en una publicación anterior e, incluso, cómo hacerlo con ingeniería de prompts. Pero aquí vamos a revisar algunos trucos interesantes. Y, por supuesto, profundizaremos en el método para lograr un vídeo como el que abre esta guía, a partir de un documento (URL, PDF, texto pegado, etc.).
1. Creación de los personajes
Puedes crear los personajes con muchas herramientas pero, ahora mismo, la mejor es ChatGPT, aunque podrías explorar las posibilidades de Ideogram.ai (que ha lanzado una función específica denominada «characters») y apob.ai, especializada en generar «influencers» es menos conocida pero también muy interesante.
En ChatGPT hay algunos GPT ya creados que te ayudarán a obtener prompts que luego podrás utilizar para generar tus personajes. Por ejemplo, Fotógrafo de Retratos que te asistirá para generar el prompt preciso rápidamente y crear retratos de todo tipo de personas y profesiones. Más info: Ingeniería de prompts para crear personajes con ChatGPT.
Acerca de mover personajes creados, profundizaremos en un próximo capítulo de esta serie.
Aquí, aprovecharemos Blogpocky y Tweetie, los dos personajes que ya tenemos.
Seguiremos empleando ChatGPT para cambiar posturas, vestimentas y añadir complementos y actitudes. El modelo GPT-5 es especialmente bueno en mantener la consistencia, dentro de un mismo chat.
2. Creación del guion del videopodcast
Existe una herramienta fabulosa que es especialmente buena para nuestro propósito de unir a dos personajes conversando sobre un tema. Se trata de NotebookLM que, a partir de fuentes (PDFs, URLs, Vídeos, textos,…) puede generar automáticamente documentos de resumen, mapas mentales, audios y vídeos. Es precisamente el resumen de audio el que sirve como base para crear una conversación entre dos personajes (en nuestro caso, Blogpocky y Tweetie).
El inconveniente de NotebookLM es que no hay posibilidad de configurar las voces del audio. Por eso, emplearemos un pequeño truco: abriremos un nuevo cuaderno, subiremos el audio creado como fuente y le pediremos a NotebookLM que realice una transcripción exacta del audio, destacando las voces (VOZ1, VOZ2).
La transcripción la llevaremos a Google Drive con el fin de editarla si procede y descargarla como PDF.
Bonus extra: Explora las posibilidades (por ahora solo en inglés) de la generación de resúmenes en vídeo de NotebookLM.
3. Creación de los avatares (con sus voces)
Para la creación del vídeo, emplearemos HeyGen pero antes hay que crear los dos avatares de los personajes. Esto, básicamente, consiste, dentro de HeyGen, en subir una imagen de cada uno de los personajes y asignarle un modelo de voz.
Subir avatar
En HeyGen, Ir a «My avatars (mis avatares) > Create new avatar (crear nuevo avatar)». Elige «Photo avatar» para subir una imagen del personaje o crear una con IA.
Una vez que elijas la imagen, cárgala («Upload») y haz clic en «Continuar».
Después asigna algunos detalles, como el nombre, la edad, etc. y haz clic en «Continuar».
Asignar modelo de voz
El siguiente paso es darle una voz al personaje, a partir de un archivo de audio. Podemos clonar nuestra voz o cargar un archivo con otra voz obtenida mediante otra herramienta.
Por ejemplo FakeYou es una herramienta divertida para crear voces tipo dibujos animados. Pero si tu personaje es un avatar real, puedes ensayar Amazon Polly que tiene voces muy realistas y, además, te permite crear el archivo de modelo directamente en mp3.
En Amazon Polly ve a la consola de administración de AWS, regístrate, elige la opción «Text-to-Speech (texto a voz)», el modelo generativo, el idioma y la voz en concreto. Escribe el texto, escúchalo primero por si hay algo que modificar y descárga el archivo mp3 en tu equipo.
Después, regresa a HeyGen, y en tu avatar haz clic en «Avatar voices» para elegir la opción «Add favorite voices» (añadir voces favoritas). Ve a «Create new voice» (crear nueva voz) y «Create new voice» para cargar el archivo con el mp3 obtenido en Amazon Polly.
Comprueba que entrando en el avatar, en la opción «Avatar voices», tu personaje tiene la voz apropiada. También puedes crear distintos aspectos (indumentaria, posturas, ambiente, etc.) para el personaje, haciendo clic en «Generate looks».
4. Creación del videopocast
Ya estamos en disposición por fin el vídeopodcast con los dos personajes charlando. Tenemos un PDF con el guion y dos avatares preparados para intervenir. En HeyGen, ve a la opción de «Vídeopodcast que encontrarás en «Apps > All apps (Todas las Apps) > Videopodcast».
Paso 1
Cargar el link de un sitio web o un PDF para empezar. También es posible subir la URL de una página web (y pronto la URL de un vídeo de YouTube).
Paso 2
Selecciona los avatares y la configuración del vídeo. Haz clic en «My avatars» para elegir los avatares. Después, configura la duración (hasta 10 minutos), el aspecto (vertical, horizontal o cuadrado), si se añadirán subtítulos o no y el idioma. Haz clic en «Submit» para iniciar la generación del vídeo, tarea que durará unos minutos.
4. Edición del vídeo final
Finalmente, editar el vídeo con Canva.com para añadir entradillas, o efectos; y crea el producto definitivo con ScreenFlow (añadiendo desde audio de fondo a textos descriptivos si es necesario).
Coste de generar un vídeo con dos personajes charlando
Todos los planes de HeyGen incluyen generación ilimitada de vídeos, siempre que sean de duración inferior a 30 minutos. El plan Creator admite una resolución de 1080p (29 $) y si quieres 4K debes saltar al plan Team (39 $/mes).
Dado que las herramientas citadas aquí, NotebookLM y Amazon Polly, tienen un plan gratuito que sirve perfectamente; la inversión necesaria estaría compuesta de ChatGPT (23 €), Canva (12 €) y HeyGen (29 $) con generación de vídeos ilimitada. Por lo tanto, suponiendo que queramos crear 4 vídeos de no más de 5 minutos cada uno, el gasto sería de unos 15 € por vídeo.
Pero teniendo en cuenta que la generación de vídeos es ilimitada en HeyGen, tal vez podamos ahorrarnos también el dinero de Minimax y Hedra a la hora de crear personajes que hablan individualmente (ver el siguiente capítulo de esta serie).
Próximos capítulos de esta serie:
- Cómo crear personajes que hablan individualmente con una única herramienta (HeyGen)
- Cómo mover un personaje, hacerlo hablar con sincronización labial, usando Runway (¿cuánto cuesta hacer un vídeo de 1 minuto?)
Índice
- Cómo optimizar tus prompts de ChatGPT para escribir y 32 trucos para principiantes
- Cómo escribir prompts efectivos para ChatGPT (guía visual para optimizar tus preguntas y obtener respuestas brillantes)
- Guía paso a paso para crear vídeos con personajes que hablan
- Ingeniería de prompts para crear personajes con ChatGPT
- Guía paso a paso para crear vídeos con dos personajes que conversan
- Cómo crear personajes que hablan individualmente con una única herramienta (HeyGen)
- Cómo mover un personaje tipo influencer y hacerlo hablar con sincronización labial, usando Runway
Si no ves el prompt autocompletado o ves el de una ejecución anterior (o aparece la página de acceso), el texto ya está copiado. Solo pégalo.
En Blogpocket se promueve un uso ético y responsable de la IA

Deja una respuesta