OpenAI ha decidido detener el uso de la popular voz Sky en ChatGPT después de recibir preocupaciones de que suena demasiado similar a la actriz Scarlett Johansson, conocida por su papel en la película «Her».
La compañía asegura que las voces utilizadas en ChatGPT provienen de actores de voz remunerados. De una selección inicial de 400 actores, se eligieron cinco finales, y la similitud entre la actriz no identificada detrás de la voz Sky y Johansson es una mera coincidencia.
La voz está a punto de volverse más destacada para OpenAI con la introducción del nuevo modelo GPT-4o en ChatGPT. Este modelo traerá consigo una interfaz conversacional completamente nueva donde los usuarios podrán hablar en tiempo real con una inteligencia artificial que imita el sonido natural y las emociones humanas.
Aunque la voz Sky y una versión de ChatGPT Voice han estado disponibles por un tiempo, la comparación con Johansson se hizo más evidente cuando el CEO de OpenAI, Sam Altman, y otros, señalaron la similitud entre el nuevo modelo de IA y la película «Her».
En «Her», Scarlett Johansson interpreta a Samantha, un avanzado sistema operativo de inteligencia artificial que desarrolla una relación romántica con un escritor solitario interpretado por Joaquin Phoenix. Dado que GPT-4o puede imitar respuestas emocionales, las paralelas eran obvias.
Lo que distingue a GPT-4o de los modelos anteriores, o incluso de la versión anterior de ChatGPT Voice, es su multimodalidad. Esto significa que ha sido entrenado para comprender y generar imágenes, texto, video y, por supuesto, habla.
A diferencia de otros modelos multimodales, permitirá conversaciones en tiempo real y una voz emocionalmente adaptable.
Dada la mayor emoción en la forma en que suena ChatGPT Voice, existe el riesgo de que se pueda malutilizar o crear deepfakes. Entendemos las preocupaciones del equipo de Johansson debido a la gran similitud en las voces.
Actualmente, hay cinco voces disponibles para la versión actual de ChatGPT Voice y se usarán en el lanzamiento de la nueva versión: Breeze, Cove, Ember, Juniper y Sky.
OpenAI afirma que colaboró con actores de voz seleccionados, licenciando sus voces y muestreándolas para su uso en la aplicación. En una entrada de blog, OpenAI explicó: «Cada actor recibe una compensación por encima de las tasas más altas del mercado, y esto continuará mientras sus voces se utilicen en nuestros productos».
El proceso de selección de actores comenzó el año pasado, con más de 400 solicitudes. De esta lista, se seleccionaron cinco actores, cada uno de los cuales fue llevado a San Francisco para una sesión de grabación. Las muestras de esta sesión entrenaron los nuevos modelos de voz de IA, con cada actor correspondiendo a una de las cinco voces.
OpenAI declaró: «Creemos que las voces de IA no deberían imitar deliberadamente la voz distintiva de una celebridad. La voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a una actriz profesional diferente que usa su propia voz natural». Añadieron que no podían compartir el nombre de la actriz.
Pingback: Meta incorpora voces de celebridades a chat de IA, incluyendo a John Cena, Awkwafina y Keegan-Michael Key - BetaZetaNews