Ufficio

Via Cairoli 1/4
16124 Genova
t. +39 010 8970500
f. +39 010 8970344

Follow us

InTw

Translatotron: Il nuovo sistema di traduzione AI di Google

 

Il nuovo sistema di traduzione AI di Google


La rivoluzione nel campo della traduzione starebbe arrivando grazie a un nuovo progetto di Google. Si chiama Translatotron il nuovo sistema di traduzione di Google
che utilizza l’intelligenza artificiale per replicare la nostra voce nel momento della traduzione.

I sistemi di traduzione vocale online sono stati creati con l’obiettivo di aiutare le persone che parlano lingue diverse a comunicare tra loro. Questi traduttori replicano la traduzione del testo con una voce robotica e standard.

A rivoluzionare il campo starebbe arrivando il nuovo progetto di intelligenza artificiale di Google. Si tratta di Translatotron, una versione avanzata di Google Translate.

Translatotron utilizza l’intelligenza artificiale per modellare la voce “in uscita” sulle stesse frequenze di quella “in entrata”. Questo sistema permette così di replicare l’impronta vocale dell’interlocutore nel momento della traduzione.

Translatotron si basa su un sistema di reti neurali, un metodo avanzato di traduzione automatica. Le reti neurali sono chiamate così perché il sistema è ispirato alle reti neurali biologiche che costituiscono il cervello umano.

 

Come funziona la traduzione automatica online


La traduzione automatica tradizionale analizza una frase e poi tenta di sostituirne le parole con gli equivalenti nella seconda lingua. Con una serie di processi, sostituisce le parole e ne cambia l’ordine facendo in modo che sia congruo alla lingua di destinazione. Tuttavia, a causa della caratteristica di questo sistema i risultati sono inferiori rispetto alle aspettative.

Invece, la traduzione automatica neurale tenta di costruire e addestrare una grande rete neurale che legga non solo la frase ma anche il contesto. Permettendo di fatto una traduzione molto più precisa.

Il nuovo sistema di traduzione AI di Google fa un ulteriore passo avanti. Translatotron permette di tradurre direttamente il parlato da una lingua all’altra lingua senza fare affidamento alla rappresentazione testuale intermedia, in nessuna delle due lingue.

 

Come funziona il sistema di Translatotron 


I sistemi di traduzione in uso oggi, incluso Google Translate, si basano su tre fasi distinte:

  • il riconoscimento automatico del parlato per trasformare il discorso di origine in testo
  • la traduzione automatica del testo scritto dalla lingua di partenza a quella di destinazione 
  • la sintesi vocale per produrre il “parlato” nella lingua di destinazione a partire dal testo tradotto.

Translatotron è un metodo speech-to-speech, che non richiede per la traduzione l’elaborazione intermedia di un testo. Dato che si tratta di un’interpretazione diretta, dovrebbe portare maggiore velocità e minori errori durante la conversione da una lingua all’altra.

 

                                                Architettura del modello di Translatotron

 

Per fare ciò, le reti neurali di Translatotron lavorano simultaneamente per analizzare lo spettrogramma della “voce input” e per produrre lo spettrogramma del contenuto tradotto nella lingua di destinazione. Inoltre, grazie all’impiego del codificatore vocale, è possibile mantenere le caratteristiche della propria voce durante la riproduzione della traduzione.

Oltre ai vantaggi in termini di velocità e di accuratezza della traduzione, è possibile ottenere traduzioni più naturali. Translatotron consente di mantenere i segnali non verbali come il tono, il timbro e gli accenti.

 

Conclusioni


I risultati della ricerca sono stati pubblicati dall’azienda sulla pagina ufficiale del progetto. Nella pagina ufficiale
è anche possibile ascoltare il set di voci originali impiegate per l’apprendimento del sistema con le rispettive traduzioni lette dai sintetizzatori vocali.

Per concludere, occorre precisare che Translatotron è un progetto ancora in fase sperimentale, lontano da una sua eventuale introduzione.  Certo però che Google ha dimostrato il grande potenziale dell’intelligenza artificiale grazie alla quale sarà presto possibile abbattere completamente le barriere linguistiche.