Nuance Communications, il futuro è la voce

La società è tra i maggiori fornitori di soluzioni vocali e di imaging. Ecco un breve viaggio tra i progressi tecnologici e lo spettro applicativo dei sistemi di voice recognition, text-to-speech, biometria vocale, assistente virtuale. Come sta cambiando l’interazione uomo-computer.

Pubblicato il 14 Lug 2014

Samantha ha una voce suadente, è dotata di intelligenza straordinaria, sa anticipare i bisogni. Theodore, che per lavoro detta al computer lettere sentimentali conto terzi, se ne innamora perdutamente, ma la storia non avrà lieto fine. Samantha è un sistema operativo e questo è il film “Her” di Spike Jonze, che descrive le relazioni uomo-macchina in un futuro prossimo, quando i computer saranno in grado di apprendere ed elaborare emozioni. Ma non si tratta di fantascienza: cognitive computing, voice recognition, assistente virtuale appartengono già al quotidiano, come dimostrano le tecnologie di Nuance Communications, tra i maggiori fornitori di soluzioni vocali e di imaging per aziende e privati.

Agostino Bertoldi, VP Enterprise & Mobility Sud Europa di Nuance Communications

Come spiega Agostino Bertoldi, VP Enterprise & Mobility Sud Europa della multinazionale, la società si compone di quattro business unit, rispondenti a mercati diversi che necessitano di prodotti ad hoc: Mobile (strumenti e applicazioni basati sulla comprensione del linguaggio naturale, come assistenti vocali personali e intelligent systems integrati nei dispositivi), Enterprise (soluzioni self-service web e mobile basate su sistemi Ivr – Interactive Voice Response per consentire alle aziende di fornire servizi personalizzati e customer experience cross-channel), Healthcare (l’offerta dedicata alla Sanità), Document Imaging (per il workflow documentale e l’automazione). “Le soluzioni in ambito Enterprise – precisa il vice president – si basano su tre tecnologie principali: riconoscimento vocale, text-to-speech e biometria vocale; l’assistente virtuale Nina (Nuance Interactive Natural Assistant), ad esempio, integra queste funzionalità, oltre alla comprensione del linguaggio naturale (Nlu, Natural Language Understanding). Oggi capire il parlato e tradurlo in testo o viceversa è relativamente semplice, mentre la nuova frontiera su cui ci stiamo già muovendo è comprendere il contenuto e contestualizzare la conversazione in modo da ottenere un dialogo il più naturale possibile, senza la presunzione di sostituire gli umani con le macchine, ma con l'obiettivo di rendere più efficienti alcuni processi aziendali”. Esemplificativo a questo proposito il caso di Air France, che è riuscita a condensare 80 diversi numeri di assistenza telefonica, deputati a differenti servizi, in uno solo: grazie al riconoscimento vocale, il sistema smista la chiamata all'ufficio di competenza in base all'esigenza espressa a voce dall'utente.

In ambito di gestione documentale, l’azienda propone soluzioni per la creazione, conversione e modifica di Pdf da documenti cartacei e file dinamici, come Word ed Excel, o la creazione di file di testo utilizzando Dragon Naturally Speaking (Dns), l’applicazione desktop ad uso privato e professionale di riconoscimento vocale e dettatura. Un caso interessante a questo proposito è rappresentata dal Consiglio di Stato, che da circa un anno ha adottato la suite di produttività di Nuance (Dns e Pdf Converter Enterprise) per un totale di oltre 200 licenze, ottenendo significativi vantaggi di efficienza e con l’obiettivo di estendere l’iniziativa alla totalità degli utenti aziendali.

Giulio Moriggi, Sales Manager, Italy Desktop Solutions, Nuance Communications

“L’utilizzo di Dragon – sostiene Giulio Moriggi, Sales Manager, Italy Desktop Solutions – è semplice, ma richiede un modo di parlare più controllato rispetto al parlato naturale. Occorre quindi una certa accortezza per riuscire a utilizzarlo correttamente, ma i vantaggi sono notevoli: non solo la riduzione del tempo di digitazione, ma anche un minore affaticamento, soprattutto a fronte di patologie come l’artrite o il tunnel carpale”. Un tema strettamente correlato al riconoscimento vocale, inoltre, è l’accessibilità per disabilità temporanee o più gravi e permanenti; altre applicazioni possibili, infine, sono il supporto per chi è affetto da dislessia o disgrafia oppure ai non vedenti (il text-to-speech permette al sistema di leggere i testi scritti).

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati

Articolo 1 di 3