
Cuando en agosto de 2023 me propuse crear mediante IA un podcast, sobre WordPress, inspirado en el WPBriefs de Ben Gillbanks, tenía claro que sería un proyecto hard-stop.
WP A DAY ha durado 27 episodios y es el momento de reflexionar, sobre todo, acerca de las lecciones aprendidas.
Hubo dos ideas principales a la hora del planteamiento de WP A DAY:
- Crear contenido consistente.
- Explorar el uso y las posibilidades de herramientas de IA.
Lo primero era no «copiar» WPBriefs y, por otra parte, crear un podcast «made in Blogpocket» desde cero. El gran desafío era, como también lo fue para Ben Gillbanks, crear un podcast con contenido consistente y de calidad. Para ello, no valdría con generar guiones automáticamente mediante IA sino conseguirlos «naturales», que no pareciesen deshumanizados. Eso iba a suponer trabajo de investigación y mejoras constantes.
La primera versión estaba basada en código PHP, empleando la API de OpenAI para intereactuar con ChatGPT desde un programa. La labor fue muy interesante porque aprendí mucho sobre la importancia de redactar buenos prompts, en las herramientas de IA, con el fin de lograr mejores respuestas.
Los episodios iniciales solo eran de audio, obtenidos con Amazon Polly, una herramienta realmente buena a la hora de obtener locuciones bastante naturales, tanto en español como en inglés.
Después de realizar diversas pruebas con herramientas de generación de vídeo por IA, la más convincente fue HeyGen. Al principio, generaba el vídeo con el avatar «Lucia» en español, a partir del guion, descargaba los subtítulos generados automáticamente y montaba un vídeo definitivo mediante Screen Flow. Pero los últimos vídeos fueron creados usando solo HeyGen, subtítulos incluidos.
Con la irrupción de GPT4, y sus GPT, inmediatamente, me di cuenta de que sería mucho más sencillo que codificar en PHP para crear el guion. Con ello, se mejoró bastante, tanto la obtención de los resúmenes como la redacción de los guiones.
Ahora toca parar.
Un año aproximado de trabajo es suficiente y tengo la sensación de que cumplí los objetivos.
He aprendido mucho.
El producto ofrecido era muy parecido al de WPBriefs, con vídeo añadido, en español (algún episodio en inglés) y con contenidos de última hora relacionados con la plataforma WordPress.
Los resultados en la voz de Amazon Polly eran bastante aceptables, todavía algo robotizados. Supongo que poco a poco se conseguirán voces totalmente naturales.
Amigos y colegas, que escucharon WP A DAY, me advirtieron de que el sonido algo robotizado podría ser la principal razón para no escuchar un podcast hecho con IA. Comparto esa opinión y fui consciente de eso, desde el principio. Pero yo nunca pretendí sustituir la esencia del podcasting ni inventar la rueda, por supuesto.
Al igual que Hiro y Yumi, la historia que he co-escrito con IA, o cualquiera de los proyectos de Blogpocket, su propósito es doble: meramente didáctico para mis seguidores y una herramienta de crecimiento para mí.
Estamos aprendiendo el uso de una tecnología nueva que, para los que estudiamos a principios de la década de los 80 una asignatura de IA en la carrera de Informática, es absolutamente emocionante. En aquella época, quién nos iba a decir a nosotros que algún día en el futuro veríamos, palpándola, la utilidad de aquella teoría.
Más información:
- El porqué de hacer un podcast con inteligencia artificial (y el cómo) [WP al día nº 350]
- Directrices Éticas de IA: uso responsable de la Inteligencia Artificial [WP al día nº 346]
Conclusiones
Para conseguir un podcast original y consistente, se utilizaron diversas herramientas y técnicas a lo largo del proyecto de WP A DAY. Inicialmente, se empleó código PHP y la API de OpenAI para interactuar con ChatGPT, aprendiendo la importancia de redactar buenos prompts. El audio fue generado con Amazon Polly, y posteriormente se experimentó con HeyGen para la creación de vídeos con avatares y subtítulos.
Con la llegada de GPT-4, se simplificó el proceso de creación de guiones, mejorando la calidad de los mismos. A lo largo del año de trabajo, se cumplió con los objetivos establecidos, ofreciendo un producto similar al de WPBriefs pero con vídeo añadido y contenido actualizado para la comunidad de WordPress en español.
La principal lección aprendida es el potencial que tienen las nuevas tecnologías de IA para crear contenido educativo y original, a pesar de las limitaciones actuales en la naturalidad de las voces sintetizadas.
Más info
Para la escritura de este post se ha empleado ChatGPT (menos del 10 %). Las imágenes fueron generadas mediante ChatGPT (DALL-E). En Blogpocket, creemos en un uso ético y responsable de la IA
Deja una respuesta