Luego de AlphaGo, Deepmind ha estado trabajando fuertemente con las expectativas de los seres humanos para la Inteligencia Artificial. Esta vez ideó Tacotron 2, un simulador de voz que emulará perfectamente la forma de leer de la voz humana.
Hasta ahora contamos con lectores de libros, de texto y de ejemplificadores en los traductores. Pero todos los que somos humanos estaremos de acuerdo que eso no suena real. No suena como una persona. Aunque fue ideada como sustituto de la voz humana, no lo es. En estos lectores muchas veces se dicen mal las palabras, no se acentúa correctamente, las palabras en otros idiomas se leen literales y tantos otros errores.
Esto es lo que Tacotron 2 pretende corregir. La idea de Google al crear este simulador por medio de inteligencia artificial es que suene humano. Tanto que se pueda confundir con otra persona que habla.
¿Cómo funciona Tacotron 2?
Si a un ser humano le puede tomar muchísimo tiempo leer correctamente, ¿Cuánto crees que le tomaría a una máquina?
Según Google, Tacotron 2 tiene su base en dos redes neuronales que le permiten interpretar el texto que se le presenta. Luego de esto, genera los efectos de pausa, acentuación y pronunciación según sea su “entrenamiento”.
En este sentido, sería capaz de diferenciar entre cada signo de puntuación. Así mismo, se espera que pueda distinguir entre signos de exclamación e interrogación y otros matices.
Según Quartz, la versión otorgada hasta ahora permite leer palabras difíciles y pronunciar correctamente nombres propios.
Además de esto, Tacotrón 2 plantea eliminar por completo la “roboticidad” al leer de los bots que ahora tenemos. Es decir, se plantea una conversión de texto a voz totalmente fluida y similar a un monólogo de otra persona.
Siri y Cortana vs. Tacotron 2
Ya el mundo tiene historiales con su Inteligencia Artificial y la tendencia a volverse “malvada”. Hace unos años Microsoft lanzó a su robot “Tay” como un experimento de tecnología de aprendizaje por tendencia. Se trataba de un robot que interactuaba con usuarios en Twitter y que después de unas lanzó comentarios racistas y de odio.
En ese sentido, existe cierta competencia con la Inteligencia Artificial y su independencia del ser humano.
La diferencia entre software como Siri o Cortana y Tacotrón 2, es que este sólo servirá para transforma el texto en voz. No está diseñado para razonar por sí mismo. Sino para traducir lo que está escrito a una lectura agradable a los oídos. Se espera que Google en un futuro la oficialice como la voz de su asistente virtual. Sin embargo, hasta ahora esto no es más que un supuesto
Tacotron 2 permanece en fase de desarrollo y pruebas por el momento. Actualmente sólo hay una versión de prueba con una voz femenina.
Sin embargo, hay usuarios que realizaron comparaciones entre la voz de Tacotron 2 y una humana, y te sorprendería el resultado. En el siguiente video, podrás ver las distintas pruebas de sonido hechas por un usuario Francés.