Nueva York, Estados Unidos | AFP La inteligencia artificial ya comenzó a transformar el mundo de los audiolibros con la capacidad de generar locuciones fluidas sin utilizar un narrador humano, una novedad que preocupa a los profesionales de la voz.
Tanya Eby lleva veinte años dando voz a los textos a tiempo completo. En los últimos seis meses, sus pedidos se han reducido a la mitad y la actividad de muchos de sus colegas también ha mermado.
“Parece lógico que la inteligencia artificial nos esté afectando”, dice. “Creo que es el plan para el futuro: reemplazar trabajadores y reducir costos”.
No hay un sello para identificar la IA, pero según varios profesionales del sector, ya circulan en el mercado miles de audiolibros concebidos a partir de bancos de datos vocales.
Entre los programas más avanzados, DeepZen ofrece un precio básico que puede reducir a la cuarta parte el costo de creación de un audiolibro en comparación con un proyecto clásico.
Esta pequeña empresa con sede en Londres trabaja con una base de datos que ella misma creó grabando las voces de varios actores a los que se les pidió que expresaran una variedad de emociones diferentes.
“Hemos firmado un acuerdo de licencia con todas las voces que utilizamos”, dice Kamis Taylan, gerente general de DeepZen. “Pagamos por las grabaciones (…) y pagamos regalías cada vez que usamos la voz para un proyecto”.
“Las cosas evolucionan tan rápido que hay muchos recién llegados que no tienen la misma ética” y usan voces sin remunerar a sus dueños, advierte Tanya Eby.
“Hay una zona gris” que aprovechan muchas plataformas, explica Kamis Taylan. “Toman tu voz, la mía y cinco más, crean una nueva voz y no pagan nada, dicen que no es de nadie”.
Todas las empresas contactadas por la AFP se defienden de tales prácticas.
La start-up texana Speechki propone, además de utilizar sus propias grabaciones, utilizar voces extraídas de bancos de datos existentes, refiere su director general, Dima Abramov.
Esta segunda opción requiere la firma de un contrato que incluye los derechos de uso, explica.
– “Conexión emocional” –
Consultadas sobre el tema, las cinco principales editoriales del mercado estadounidense no respondieron.
Pero según profesionales entrevistados por AFP, varios nombres del sector editorial tradicional ya utilizan la llamada IA generativa, es decir capaz de crear, sin intervención humana, textos, imágenes, videos o voces, a partir de contenidos existentes.
“La narración profesional siempre ha sido esencial para escuchar en Audible y seguirá siéndolo”, dijo una portavoz del gigante estadounidense de los audiolibros, filial de Amazon.
“Dicho esto, a medida que la tecnología mejora, visualizamos un futuro en el que la interpretación humana y el contenido generado (con IA) pueden coexistir”.
Muy volcados a inteligencia artificial, los gigantes tecnológicos están involucrados en la floreciente economía de los audiolibros generados por software.
A principios de año, Apple lanzó una oferta de “narración digital”, destinada, según la compañía, a “hacer que la creación de audiolibros sea más accesible para todos”, en particular “para autores independientes y pequeñas editoriales”.
Google ofrece un servicio similar, descrito como “autonarración”.
“Necesitamos democratizar la industria editorial, porque en este momento solo los nombres más conocidos se convierten en audiolibros”, sostiene Kamis Taylan.
“La narración sintética acaba de abrir la puerta a todos los libros existentes que no han sido grabados y a todos los libros futuros que nunca se grabarían debido a limitaciones económicas”, dice Dima Abramov, que estima que actualmente 5% de los libros se convierten en audiolibros.
Este crecimiento del mercado también beneficiará a los actores de voz, añade. “Harán más grabaciones y ganarán más dinero”.
“Contar historias, en esencia, es permitir a los humanos reconectarse con su humanidad”, estima Emily Ellet, directora de la Asociación de Narradores Profesionales de Audiolibros (PANA). “La narración debe seguir siendo completamente humana”.
Para Tanya Eby, la narración de IA aún “carece de conexión emocional. Hay una diferencia real (con las grabaciones clásicas). Pero con el tiempo, los oyentes pueden acostumbrarse”.
“Me gustaría que las empresas hicieran saber a los oyentes que están escuchando una pieza generada por IA”, dice. “Que sean honestos al respecto”.
—