Digital360 Awards 2025

Traduzione automatica a bassa latenza: l’architettura AI di Translated e Lenovo



Indirizzo copiato

Con la collaborazione di Lenovo, la società specializzata in servizi linguistici, ha sviluppato un’infrastruttura AI per la traduzione, ottimizzata per scenari critici e ad alto volume 

Pubblicato il 21 ago 2025



Lenovo Translated AI

Translated, azienda internazionale specializzata in servizi linguistici e applicazioni di intelligenza artificiale per la traduzione, ha raggiunto un nuovo traguardo tecnologico grazie alla collaborazione con Lenovo.  

Il progetto ha riguardato l’evoluzione di Lara, il sistema AI proprietario di Translated, progettato per offrire traduzioni di alta qualità con latenza ultra-ridotta, anche in contesti ad alto volume e criticità operativa.

L’obiettivo era superare il tradizionale compromesso tra qualità e velocità nella traduzione automatica. Lara è oggi in grado di combinare la fluidità e il ragionamento tipici dei modelli linguistici di grandi dimensioni (LLM) con la reattività della traduzione automatica, raggiungendo una latenza inferiore al secondo (P99) nelle 50 lingue più parlate. Questo risultato apre la strada a nuove applicazioni in tempo reale, come la traduzione selettiva di contenuti in scenari di chat dal vivo, trading e news.

Architettura hardware ad alte prestazioni per AI linguistica

Per abilitare queste prestazioni, Translated ha collaborato con Lenovo alla progettazione di una nuova infrastruttura hardware, ottimizzata per i carichi di lavoro AI legati alla traduzione. La soluzione si basa su server Lenovo ThinkSystem equipaggiati con otto GPU NVIDIA di ultima generazione per ciascun nodo, in grado di supportare modelli linguistici avanzati, machine learning e calcolo ad alte prestazioni.

L’architettura è stata progettata per garantire scalabilità, efficienza e bassa latenza. I server sono stati installati in due data center strategici, a Washington e in California, in prossimità dei principali hub internet, per mantenere la latenza di rete tra Lara e le dorsali internet al di sotto di un millisecondo.

Il lavoro congiunti tra Translated e Lenovo ha incluso anche lo sviluppo di un sistema di decodifica innovativo, capace di sfruttare appieno le potenzialità dei chip più recenti. Il risultato è una piattaforma che, secondo i dati forniti, è da 10 a 40 volte più veloce dei principali LLM nelle attività di traduzione, mantenendo al contempo una qualità superiore.

Il progetto è entrato nella rosa dei finalisti per i Digital360 Awards nella categoria “Artificial Intelligence & Data Analytics”.

Articoli correlati