OpenAI puede clonar voces, no habrá acceso al público por sus riesgos

Se han implementado medidas de seguridad, como marcas de agua para rastrear el origen del audio generado por Voice Engine, y un monitoreo de la tecnología.

La empresa de inteligencia artificial (IA) OpenAI ha anunciado el desarrollo de su nuevo modelo Voice Engine, capaz de clonar voces humanas mediante muestras de tan solo 15 segundos.

Este avance tecnológico permite reproducir un sonido natural, emotivo y realista, ofreciendo un amplio abanico de posibilidades en la generación de voces sintéticas.

Sin embargo, a pesar de los potenciales beneficios que esta tecnología podría aportar, OpenAI ha decidido no lanzarla al público general debido a los riesgos asociados.

En un comunicado emitido por los creadores de ChatGPT, se reconoce que la generación de discursos que imitan voces humanas conlleva serios riesgos, especialmente en un año electoral.

Te puede interesar: Ataque israelí cerca de embajada de Irán en Siria dejó 8 muertos

Voice Engine promete convertir texto a voz de manera eficiente, preservando los acentos nativos de los hablantes y facilitando la comunicación verbal para personas con dificultades de expresión. Un ejemplo proporcionado por la empresa muestra cómo una voz anglosajona puede ser traducida a varios idiomas manteniendo su acento original, lo que podría resultar útil para la producción de contenido multilingüe y accesible.

Aunque Voice Engine aún no está disponible para el público en general, algunas empresas seleccionadas ya tienen acceso a esta tecnología. Entre ellas se encuentran la empresa de tecnología educativa Age of Learning, la plataforma de narración visual HeyGen, el fabricante de software de salud Dimagi, el creador de aplicaciones de comunicación de inteligencia artificial Livox y el sistema de salud Lifespan.

OpenAI ha adoptado un enfoque cauteloso en cuanto a la difusión de Voice Engine, consciente del potencial de mal uso de las voces sintéticas.

La empresa ha establecido políticas de uso para sus colaboradores, que incluyen la necesidad de obtener consentimiento para utilizar la voz de una persona y la obligación de informar a los usuarios cuando están interactuando con una voz sintética.

Además, se han implementado medidas de seguridad, como marcas de agua para rastrear el origen del audio generado por Voice Engine, y un monitoreo activo del uso de la tecnología.

Esto es especialmente relevante dado que ya se han registrado casos de llamadas automáticas con voces clonadas de políticos, como el presidente Joe Biden, durante el actual año electoral en Estados Unidos.

Uno de los riesgos más preocupantes asociados con las voces sintéticas generadas por IA es su potencial uso por parte de estafadores para acceder a cuentas bancarias que utilizan autenticación de voz. Estas preocupaciones destacan la importancia de una regulación y supervisión adecuadas en el desarrollo y uso de tecnologías de clonación de voz.

A medida que avanza la tecnología y se amplía su acceso, será fundamental abordar estos desafíos éticos y de seguridad para garantizar que las voces sintéticas se utilicen de manera responsable y beneficiosa para la sociedad.