Cómo he creado a Lucía 3.0

Share to social media

He creado una nueva versión de Lucía con el fin de que sea el avatar dedicado a los vídeos sobre inteligencia artificial, en mi canal de YouTube, La primera Lucía era muy parecida pero he querido mejorarla con un aspecto un poco más natural. Aquí puedes leer cómo hice aquella primera versión: Cómo crear con HeyGen tu avatar, gemelo o ficticio, hablando.

La creación de Lucía 3.0 tiene propósito didáctico y experimental. Las herramientas que se han utilizado pueden ser otras y la calidad de las imágenes y vídeos, así como la propia consistencia del personaje, se pueden mejorar. Lucía 3.0 está en desarrollo y podría sufrir cambios. No se trata de un producto final y nos encontramos en constante exploración de herramientas y procedimientos persiguiendo entender y comprender el alcance de la IA generativa. En Blogpocket, además, hay un manifiesto por el uso ético y responsable de la IA.

Lucía 3.0: Creación del prompt para Gemini

Para actualizar el avatar de Lucía, he vuelto a emplear el mismo prompt que obtuve en ChatGPT con el GPT Prompt Engineer. Lo llamaremos «prompt base»:

Ultra-realistic photographic portrait in 9:16 vertical format of a smiling young woman, captured in a centered medium shot, sitting in front of a professional studio microphone. She is looking directly at the camera, creating a sense of connection and warmth. Soft, warm lighting highlights her face, creating a cozy and inviting atmosphere. She is wearing a cropped white t-shirt with ‘Blogpocket.com’ printed on the chest, along with minimalist earrings and a simple necklace. Her dark brown hair is tied up in a casual bun. The background features a modern recording studio with acoustically treated walls and diffuse LED lighting in pastel tones (soft pink and light blue), evoking a creative and professional environment. Sharp focus, pronounced depth of field, realistic and well-balanced colors, with a smooth bokeh effect in the background. BK resolution (ultra high-definition).

Simplemente, ha sido cuestión de pedirle varias veces a Gemini para encontrar la expresión ideal de acuerdo a cómo pienso que podría ser Lucía, una mujer joven profesional, amante de la tecnlogía y con suficiente experiencia como para llevar las riendas de un videopodcast de Blogpocket.

Obtención de imágenes de Lucía en distintos escenarios

Lo importante es disponer de una foto (o varias) del rostro de Lucía. Puedes lograr una «foto de carnet» de Lucía en Canva.com (o sencillamente) capturando el trozo, de la imagen base que abre este post, correspondiente a su rostro. Esto es:

Esta foto de carnet de Lucía es la que hay que subir a Gemini para obtener distintas imágenes de ella en distintos escenarios.

Y podemos variar el prompt base (visto un poco más arriba), por ejemplo de la siguiente manera:

Ultra-realistic portrait in 9:16 vertical format, featuring the same face as the reference image. A smiling young woman is captured in a centered medium shot, seated in a professional studio. Soft, warm lighting highlights her face, creating a welcoming and attractive atmosphere. She wears a black sleeveless t-shirt with the ‘Blogpocket.com’ logo printed in yellow on the chest, minimalist earrings, and a simple necklace. Her dark brown hair is styled in a casual bun. A large window in the background floods the scene with light. A vintage-style microphone sits on a table, evoking a creative and professional ambiance. The portrait features sharp focus, a pronounced depth of field, realistic and well-balanced colors, and a subtle bokeh effect in the background. Ultra High Definition (UHD) resolution.

Es fundamental que indiquemos que queremos exactamente el mismo rostro de la imagen de referencia (la foto de carnet de Lucía) y que describamos con el mayor detalle posible el nuevo escenario, así como las peculiaridades de su vestimenta, peinado, complementos, etc. Así por ejemplo, se puede obtener la siguiente imagen:

Si de esta segunda imagen, se captura solo el rostro (una segunda foto de carnet), es posible configurar un «Gem» para ahorrarte tener que subir la foto de carnet cada vez, a la vez que Gemini posee más conocimiento sobre el rostro de Lucía. Lo mejor sería que Gemini tuviese unas cinco fotos de carnet, con distintas posiciones de la cabeza.

Sube, por lo tanto, unas cuantas fotos de carnet de Lucía a la sección de «Conocimientos» y, a continuación, las instrucciones para el Gem «Fotos de Lucía»:

Primero analizarás todas las fotos que tienes almacenadas en conocimientos. Luego generarás una imagen, en el formato que se te indique en el prompt, de Lucía en la situación que te pide el usuario en dicho prompt.

Repite el proceso para TODAS las interacciones que en una misma conversación empiecen por «Foto de Lucía».

Luego, abre el Gem «Fotos de Lucía» y , por ejemplo, con el siguiente prompt se generará una nueva imagen de Lucía:

Ultra-realistic photo of Lucía in 9:16 vertical format, featuring the same face as the reference image. She is a smiling young woman, captured in a centered medium shot, seated, in a professional studio. Soft, warm lighting highlights her face, creating a welcoming and attractive atmosphere. She wears a floral print shirt, minimalist earrings, and a simple necklace. Her dark brown hair is styled in a casual bun. A large window in the background floods the scene with light. A microphone for video podcasting sits on the table, evoking a creative and professional environment. Sharp focus, pronounced depth of field, realistic and well-balanced colors, with a soft bokeh effect in the background. BK (ultra-high definition) resolution.

Mejora de la piel

Con NanoBanana Pro y en Gemini 3 ahora es posible realizar optimizaciones de las imágenes con prompts sencillos. Por ejemplo, podemos «refinar» la piel de Lucía para dotarla de un aspecto mucho más natural con las siguientes indicaciones:

Refines and rebuilds skin texture, with more texture and realism.

Y este es el resultado:

Animación de Lucía

Lucía va a actuar de editora de IA para Blogpocket con un videopodcast, así que la herramienta adecuada para eso es HeyGen.

Para ello:

  • Añadimos un look (la imagen base de Lucía generada en Gemini) al avatar que ya teníamos creado (ver post Cómo crear con HeyGen tu avatar, gemelo o ficticio, hablando). Si no tienes un avatar creado, créalo directamente a partir de la imagen base.
  • Creamos una nueva voz mediante Amazon Polly, usando el modelo más natural en español. Descargando un guion como muestra. Aquí puedes emplear cualquier otra herramienta como Elevenlabs o Minimax, pero el resultado que buscamos es lo más natural posible tanto en tono como en acento.
  • Subimos al archivo de voces de HeyGen, el archivo mp3 descargado desde Amazon Polly como voz de Lucía.
  • En cada escena, en el editor de HeyGen, asignamos uno de los looks de Lucía y su voz, configurando esta con velocidad x1.1 y ElevenLabs V3 como «Voice Engine» en la configuración avanzada. Eso aporta mucha naturalidad al habla de Lucía y le da un toque de originalidad.

Recuerda que puedes asignar nuevos looks a Lucía subiendo a HeyGen imágenes generada mediante el Gem de Gemini o utilizando la función de generación de looks que usa Nano Banana dentro del editor de avatares.

Vídeo de presentación de Lucía

El siguiente vídeo fue compuesto con ScreenFlow, el vídeo de HeyGen, Canva para los créditos y la música de Suno.

Información sobre accesibilidad

En la parte inferior de este vídeo, y de otros que puedan aparecer en esta página, puedes activar los subtítulos.

Para acceder a una transcripción, haz clic en «YouTube» y en la página del vídeo, en la sección anterior a los comentarios, haz clic en «Mostrar transcripción».

Conclusiones

Crear un avatar para que hable en tus vídeos es más sencillo de lo que parece, aunque para ello hay que emplear las herramientas adecuadas.

Para este propósito, Gemini y HeyGen son especialmente eficaces. Pero puedes probar otras y sacar tus propias conclusiones.

A continuación, el primer vídeo de Lucía explicando qué es Google Labs. Pero, sin duda, Lucía promete ser una influencer en toda regla.

Resumir con tu IA favorita

Si no ves el prompt autocompletado o ves el de una ejecución anterior (o aparece la página de acceso), el texto ya está copiado. Solo pégalo.

En Blogpocket se promueve un uso ético y responsable de la IA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Antonio Cambronero.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a GreenGeeks que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.