Noticias de Tecnología y tendencias de actualidad
Lo hemos dicho muchas veces y no podemos parar de hacerlo, la inteligencia artificial ya es algo de nuestro día a día y está presente en todos los aparatos tecnológicos que tenemos en nuestro hogar. Es por eso que no es de sorprender que las compañías tecnológicas siguen trabajando en crear IA’s más poderosas.
Bueno, eso es lo que ha hecho Microsoft, sin embargo, ellos mismos han asegurado que es “demasiado peligrosa” para publicarla.
Al mundo actual lo mueve la tecnología y cada nuevo avance en la materia suele anunciarse con bombos y platillos. Sin embargo, esta vez Microsoft ha decido tomar una ruta diferente y ser mucho más cauteloso.
Y es que el gigante tecnológico desarrolló un inteligencia artificial de voz tan convincente y avanzada, que decidió no hacerlo público.
VALL-E 2 es una maravilla de la IA, capaz de imitar la voz humana de forma natural y precisa con solo unos cuantos segundos de audio.
Esto representa un avance enorme en la tecnología de texto a voz, y los expertos de Microsoft se jactan de lograr la “paridad humana” en la generación de voz, lo que significa que su resultado es prácticamente indistinguible a la voz humana.
¿Qué hace a la Inteligencia Artificial tan humana?
La capacidad de la Inteligencia Artificial de Microsoft fue posible gracias a un par de características nuevas. La primera de ellas es el “muestreo consciente de la repetición”, que garantiza que VALL-E 2 descarte detalles del habla monótona al abordar las repeticiones de “muestras”, que no son más que pequeñas unidades del lenguaje, como palabras o sílabas. Dicha característica evita que la IA no se enfrasque en un bucle de sonido, y que su sonido fluya de forma natural, incluyendo tonos, respiraciones, incluso muletillas.
En segundo lugar, el “modelado de código agrupado” mejora significativamente la eficiencia al reducir la longitud de la secuencia, permitiendo al modelo procesar menos tokens individuales en una sola secuencia de entrada. Esta mejora, no sólo acelera la generación de voz, sino que se encarga de solventar todos los desafíos de procesar largas cadenas de sonidos. Según los investigadores, VALL-E 2 es la primera IA de voz que alcanza con precisión la paridad humana en cuanto a solidez, naturalidad y similitud del habla.
El miedo de su uso
Tecnológicamente, VALL-E 2 nos proporciona un mundo inmenso de aplicaciones, desde herramientas educativas y entretenimiento hasta funciones de accesibilidad y sistemas de respuesta de voz interactivos, sin embargo, Microsoft decidió mantener en secreto esta maravilla tecnológica.
¿Por qué? Sencillo; el miedo al uso indebido de un software tan avanzado, capaz de clonar voces. Los riesgos incluyen la capacidad de falsificar los sistemas de identificación de voz y hacerse pasar por otras personas.
Los investigadores aseguraron que VALL-E 2 es un proyecto netamente de investigación y que actualmente no tienen planes de incorporarlo en su producto para el público. Esto solo demuestra lo cautelosos que están siendo los investigadores con su poder.
A pesar de esta decisión, Microsoft sigue siendo optimista sobre el futuro de la tecnología de voz impulsada por Inteligencia Artificial. Imaginan aplicaciones prácticas en las que el habla sintetizada mantenga la identidad del hablante y se pueda usar de forma segura y ética. Cualquier implementación futura de dicha tecnología, enfatizan, debe incluir protocolos para garantizar que el hablante apruebe el uso de voz y un modelo sólido de detección de voz sintetizada.
Todos los avances hechos con VALL-E 2 se publicaron en arXiv.
Fuente: CerebroDigital.net