I software di traduzione automatica della FBK usati dall'ONU e dalla Commissione europea
(v.l.) Per i propri sistemi di traduzione automatica l'ONU e la Commissione europea utilizzano su larga scala il software open source IRSTLM sviluppato dalla Fondazione Bruno Kessler (FBK) di Trento. Una grande soddisfazione per la ricerca italiana e per l'Unità HLT (Human Language Technologies), appartenente al Centro Communication and Information Technology della FBK, che ha realizzato il software.
Le medesime istituzioni internazionali utilizzano anche il software di traduzione automatica MOSES, che a propria volta si basa su IRSTLM e che la stessa Unità HLT ha contribuito a sviluppare a partire dal 2006.
"L'ONU e la Commissione europea – spiega Marcello Federico, responsabile dell'Unità HLT della FBK- gestiscono i servizi di traduzione mediante dipartimenti interni. La Commissione dispone di uno staff di circa 2300 persone, tra traduttori e assistenti, per la traduzione nelle 23 lingue ufficiali dell'Unione europea. L'ONU possiede un'organizzazione simile per gestire traduzioni in sei lingue. Da qualche anno entrambi hanno iniziato a utilizzare le tecnologie MOSES e IRSTLM per realizzare sistemi di traduzione automatica a supporto dei traduttori interni. Ad esempio, presso l'ONU i server di traduzione automatica realizzati processano circa 7 mila richieste di traduzione al giorno. Presso la Commissione europea sono entrati in servizio da luglio 2013 sistemi di traduzione automatica su 50 coppie di lingue".
Un'ulteriore conferma del successo di IRSTLM in tutto il mondo si può avere considerando che i download dall'inizio del 2013 sono stati 4.800, richiesti soprattutto in Cina, USA, India, Giappone, Germania e Corea.
Il risultato è frutto di un'esperienza ventennale nel settore che ha reso la Fondazione Bruno Kessler uno dei maggiori punti di riferimento a livello internazionale per la ricerca nelle tecnologie del linguaggio. Solo nell'ambito del Settimo Programma Quadro dell'Unione europea, l'Unità HLT in questo campo della ricerca si è aggiudicata cinque progetti, per i quali è previsto un finanziamento europeo complessivo di oltre 18 milioni di euro.
Fra questi, anche MateCat, coordinato a livello europeo da Marcello Federico e a cui, oltre alla Fondazione Bruno Kessler, partecipano l'Università di Le Mans, in Francia, l'Università di Edimburgo, nel Regno Unito, e l'azienda italiana Translated.
In questo caso si sta mettendo a punto uno strumento informatico completo per i traduttori professionisti, in grado di imparare dagli errori, di migliorare automaticamente nel tempo e di specializzarsi in campi specifici di linguaggio (ad esempio nel contesto giuridico) per fornire all'utente i più adeguati suggerimenti di traduzione in modo del tutto automatico e trasparente.
"Tenendo presente che secondo gli analisti (Common Sense Advisory) il volume d'affari dei servizi di traduzione nel 2012 è stato di 34 milioni di dollari al giorno – sottolinea Marcello Federico - si può ipotizzare che le applicazioni di MateCat saranno molto richieste. L'obiettivo è migliorare la produttività dei traduttori professionisti integrando funzionalità molto innovative all'interno dei tradizionali programmi software di traduzione assistita dal computer che oggi costituiscono la tecnologia dominante nel mercato".
Per maggiori informazioni: http://hlt.fbk.eu
Definizioni
IRSTLM è un software che apprende, memorizza a interroga in modo efficiente modelli del linguaggio statistici di grandi dimensioni. I modelli del linguaggio sono una componente essenziale per varie tecnologie, come il riconoscimento automatico del parlato e la traduzione automatica.
MOSES è un software che permette di costruire sistemi di traduzione automatica allo stato dell'arte a partire da raccolte di traduzioni umane, ovvero testi paralleli. MOSES si appoggia su vari software esterni, tra cui GIZA++ per apprendere modelli di allineamento delle parole e IRSTLM per apprendere modelli del linguaggio statistici.
MateCat sarà sviluppato come strumento informatico di traduzione automatica completo per i traduttori professionisti. Sarà in grado di imparare dagli errori, di migliorare nel tempo e di specializzarsi in campi specifici di linguaggio per fornire all'utente i più adeguati suggerimenti di traduzione in modo del tutto automatico e trasparente.
Video su MateCat: http://www.fbk.eu/it/spotlights/il-progetto-matecat-un-sistema-di-traduzione-automatica-semplice-e-basato-su-web
Scheda - Unità di Ricerca HLT – Human Language Technology
Centro Communication and Information Technologies - Fondazione Bruno Kessler
L'unità di ricerca HLT affronta in modo multi-disciplinare l'analisi automatica del linguaggio umano. Il campo di indagine spazia fra varie discipline, quali la linguistica computazionale, l'analisi del parlato, le scienze cognitive, l'accesso all'informazione, l'apprendimento automatico e il riconoscimento di modelli.
In particolare l'Unità di ricerca HLT si focalizza su tre linee di ricerca:
- il riconoscimento automatico del parlato, cioè la conversione di un segnale vocale in un testo leggibile;
- la traduzione automatica, cioè la traduzione di un input vocale o di un testo da una lingua all'altra;
- l'analisi del contenuto, che include il recupero, l'estrazione e l'integrazione di informazione da testi e parlato.



Nessun commento:
Posta un commento