
Blogpocket Week – nº 411 – «Esta tecnología tiene un potencial enorme para un bien inmenso, pero es una tecnología de doble uso. Entonces, si actores malintencionados la obtienen, podría usarse para cosas malas.» – Demis Hassabis, cofundador y CEO de Google DeepMind, sobre los riesgos de que la IA sea utilizada por actores malintencionados
Blogpocky es un personaje que nació en mi cabeza, a finales de la década de los 70. Tenía un tupé exagerado y era algo desgarbado. Dibujé un par de cómics ácratas con él de protagonista. A raíz de probar con HeyGen la generación de videopodcasts con los audios de NotebookLM, se me ocurrió aplicar algo de consistencia a los episodios de una nueva serie de vídeo (Hecho con IA) pero con una pareja de personajes estilo 3D. El avatar masculino sería, por supuesto, la versión 2025 de aquél personaje que yo dibujaba en mis años mozos.

Para generar a Blogpocky y a Tweetie, usé ChatGPT. No fue necesario trabajar mucho en los prompts, como puedes comprobar en el correspondiente chat.
Los tres primeros capítulos de Hecho con IA con Blogpocky y Tweetie fueron construidos con VisionStory, con configuración de las voces a partir de modelos predefinidos. Al menos, pude asignar algo de personalidad a los personajes. Pero las secuencias de ambos avatares tenían que ser elaboradas por separado y las figuras eran totalmente estáticas.
Otra característica que andaba buscando era convertir las conversaciones en audio generada por NotebookLM en vídeopodcasts. Hubo un capítulo de Cómo lágrimas en la lluvia, elaborado con HeyGen pero esta herramienta todavía no tenía la función de videopodcast y tuve que:
- Usar primero SpeakerSplit para separar las voces del audio generado por NotebookLm en dos archivos mp3.
- Emplear HeyGen para crear un vídeo, a partir de dos de los avatares predefinidos y los dos audios de SpeakerSplit.
El resultado es aparente pero siempre con las voces de NotebookLM; y bastante laborioso, al tener que editar los archivos de audio, debido a los errores cometidos en SpeakerSplit al separar las dos voces.
Con la intención de perseguir:
- Movimiento natural para los personajes de Blogpocky y Tweetie.
- Personalización de voces de los audios de NotebookLM.
Llegué a dos herramientas bastante recomendables, por los resultados naturales de movimiento y voces. Estas son: una, que ya había probado, Hedra; pero que con el nuevo modelo de generación de vídeo permite crear clips a partir de una imagen y un script de audio. Y la otra, Minimax que posibilita a obtención de audios a partir de texto pero con una guía de audio, que se toma como base para generar el archivo final. Para mantener la consistencia en las voces de Blogpocky y Twettie, las guías utilizadas fueron fragmentos de las charlas de Hecho con IA donde ambos personajes presentan las noticias.
Esta fue la primera prueba (accede al vídeo en YouTube), después de editarla y ponerle subtítulos con OpusClip.
Información sobre accesibilidad
En la parte inferior de este vídeo, y de otros que puedan aparecer en esta página, puedes activar los subtítulos.
Para acceder a una transcripción, haz clic en «YouTube» y en la página del vídeo, en la sección anterior a los comentarios, haz clic en «Mostrar transcripción».
Ese mecanismo es fantástico para crear clips de vídeo destinados a reels de Instagram, TikTok, etc. Sin embargo, todavía me restaba conseguir la creación de vídeos a partir de los audios de NotebookLM.
Y probando la nueva función de creación de avatares interactivos de HeyGen (algo muy interesante pero que todavía no admite personalización de voces para los avatares predefinidos; y solo permite crear un avatar a partir de tu propia persona, incluida la voz) es como descubrí la posibilidad de videopodcast desde una URL o un PDF (próximamente desde un vídeo). Lo mismo que hace NotebookLM pero configurado con tu propio avatar. Sospecho que pronto veremos esa función en más herramientas de generación de vídeo a partir de scripts de audio o texto.
Primero, veamos el resultado con avatares predeterminados. No es exactamente todavía lo ideal (hay movimiento excesivo cuando uno de los avatares no habla y el acento del idioma español es demasiado anglosajón) pero se acerca mucho. Ver vídeo de prueba en YouTube.
Lo siguiente, por lo tanto, es crear dos avatares en HeyGen -para Blogpocky y Tweetie- con las voces de Hecho con IA. Y, después, crear -con la función de videopodcast de HeyGen- episodios a partir de resúmenes realizados con NotebookLM, o directamente con artículos.
Esta es la primera prueba (ver vídeo en YouTube):
Todavía, habría que hacer algunos ajustes; hay demasiados «um» y algunos errores en los subtítulos pero se acerca mucho a lo que se quiere (movimientos y posturas reales, consistencia de personajes y voces naturales sin demasiadas coletillas).
Esto proporciona, creando distintos looks de los mismos personajes con ChatGPT, y combinando HeyGen con Hedra, mucha flexibilidad para desarrollar con consistencia el protagonismo de Blogpocky y Tweetie como presentadores del videopodcast Hecho con IA, con diversos formatos: diálogos, secuencias individuales, etc.
¿Me gustaría escuchar tu opinión acerca de todo esto? Te leo en los comentarios.
Un poco más abajo, te sirvo las noticias de IA más interesantes de la semana.
¿Preguntas? ¿Sugerencias? ¿Ideas? No dudes en contactar conmigo a través de Mastodon.
Las noticias de IA más interesantes de la semana
Descarga el ebook «Escapando»

¿Quieres escapar del control de las redes sociales? Aquí tienes el plan.
En Blogpocket
Lo último en el blog clásico
- Desbloqueo de vídeos de YouTube en Safari
- Guía paso a paso para crear vídeos con personajes que hablan
- Trenes de contenidos llegando a la estación RSS
- Blogpocky y Tweetie charlando juntos
Para más información
- Suscríbete a la newsletter (federada)
- Sígueme en Mastodon
- Sígueme en Bluesky
- Sigue el blog spin-off (federado)
- Si lo prefieres, suscríbete al canal RSS que lo tiene todo.
Regístrate en Ghost, recibe por email los boletines y accede a contenidos exclusivos. Descarga todos los ebooks:
Descarga todos los ebooks (solo para suscriptores de la newsletter)
Lee todos los boletines de BLOGPOCKET
Si no ves el prompt autocompletado o ves el de una ejecución anterior (o aparece la página de acceso), el texto ya está copiado. Solo pégalo.
En Blogpocket se promueve un uso ético y responsable de la IA

Deja una respuesta