Google a annoncé qu’il travaillait sur un traducteur vocal d’un nouveau genre. Baptisé Translatotron, cet outil serait capable de vous traduire en imitant l’inflexion, la tonalité et le rythme de votre voix. Cette prouesse reposerait sur la combinaison d’un vocoder et d’un encodeur.
Avec l’essor de l’intelligence artificielle et de la reconnaissance vocale, de nombreux assistants vocaux se sont développés ces dernières années. Les références sont bien évidemment Siri (Apple), Alexa (Amazon) et Google Assistant. Mais force est de constater que la richesse de leur vocabulaire, ainsi que leurs capacités à imiter une voix humaine sont très limités. C’est pourquoi Google a pensé à un outil beaucoup plus performant et plus naturel.
Translatotron n’a pas besoin de module texte
Google a annoncé qu’il travaille sur un nouveau type de traducteur vocal. Il l’a baptisé Translatotron. Cet outil serait capable de garder les nuances dans la traduction d’une langue à une autre et surtout de reproduire la voix humaine, intonation et rythme y compris. Alors que les traducteurs classiques reposent sur trois modules séparés (un premier module pour reconnaitre les paroles puis les transcrire sous forme de texte, un second pour traduire le texte d’une langue vers une autre et un troisième pour effectuer la synthèse vocale et lire le texte traduit à voix haute), Translatotron lui n’aurait pas besoin de toute cette gymnastique technologique. Il traduirait directement la parole, grâce à un module séquence par séquence.
Eviter de traduire tout et n’importe quoi
Selon les ingénieurs de Google, Translatotron permet aussi d’éviter le cumul d’erreurs grossières entre la reconnaissance vocale et la traduction écrite, d’augmenter la vitesse de traduction et de conserver certains mots qui n’ont pas besoin d’être traduits, comme les noms. Imaginez que vous vous appelez Jeune Rivière et un assistant vocal vous le traduit en Anglais par « Young River »…Pas fameux, n’est-ce pas ?
Le système de traduction de Translatotron
Cerise sur le gâteau, Translatotron serait capable d’imiter votre voix en reproduisant le même débit, l’intonation, l’accent et tout ce qui va avec. L’outil fonctionne en utilisant des spectrogrammes auxquels s’ajoutent un vocoder neuronal (qui convertit les spectrogrammes générés en ondes temporelles) et un encodeur vocal (qui permet de garder les caractéristiques de la voix du locuteur lors de la synthèse vocale).
Vivement Translatotron !