I sistemi di conversational user interfaces (CUI), cioè le interfacce utente per computer e dispositivi mobili che emulano la conversazione con un essere umano reale, oggi sono ampiamente utilizzati in una delle due versioni macro disponibili: voice-based interfaces e text-based interfaces. A differenza del passato, in cui le graphical user interfaces (GUI) consentivano di ottenere informazioni scrivendo comandi specifici o cliccando su determinate icone, le conversational user interfaces rappresentano prodotti versatili e adattivi la cui semplicità d’uso ne sta decretando la crescente popolarità, insieme al fatto che aziende come Amazon, Google, Facebook e Apple le hanno ormai incorporate nelle loro piattaforme.

Gli esempi più noti a tal proposito sono gli assistenti vocali Siri e Alexa. Entrambi sono in grado di generare risposte complesse e perspicaci, dimostrando una reale distanza rispetto alle GUI. Laddove queste necessitavano che le persone imparassero come comunicare con la macchina, le conversational user interfaces stanno insegnando alla macchina come capire le persone.

Le conversational user interfaces negli Hype Cycle di Gartner

Le CUI erano presenti nell’Hype Cycle for Artificial Intelligence 2019 di Gartner alla sommità della curva del famoso modello della società di analisi che raffigura graficamente i livelli di adozione e maturità di tecnologie specifiche. Nello stesso Hype Cycle del 2020 non ci sono più, ma questo non deve fare ritenere che la loro importanza sia diminuita. Infatti, se si mettono a confronto gli Hype Cycle dedicati all’intelligenza artificiale del 2019 e del 2020 si scopre che sono in tutto 13 le tecnologie rimosse, riclassificate o spostate in altri Hype Cycle. Nel caso delle conversational user interfaces, sono state inserite sia nell’Hype Cycle for Customer Service and Support Technologies 2020 sia, insieme a speech recognition e virtual assistant, in quello dedicato al natural language processing (NLP). Le ragioni della loro collocazione nel primo sono facilmente intuibili, poiché l’impiego delle CUI aiuta i clienti ad accedere a informazioni pertinenti e contestuali in maniera rapida e intuitiva. Nell’Hype Cycle NLP, che le ha ospitate ribattezzandole conversational AI platforms, viene sottolineato implicitamente il legame con l’infrastruttura che permette ai computer di capire, analizzare e creare significato dal linguaggio umano combinando linguistica, informatica, ingegneria dell’informazione e intelligenza artificiale. Un legame previsto anche dal sottogruppo del natural language processing, il natural language understanding (NLU), la disciplina che si occupa della comprensione del “sentimento” e del contesto.

La comprensione del contesto nelle conversational user interfaces

Capire sentimento e contesto non è qualcosa di accessorio per le conversational user interfaces. La complessità del discorso umano, infatti, rende difficile per un computer riuscire a decifrare le richieste, poiché gli arrivano in forma di dati non strutturati che devono poi essere convertiti in un formato strutturato. La tecnologia NLU contribuisce a collegare gli input in un intento specifico e a tradurli in un set di passi da compiere. Se ad esempio si interroga Alexa per avere informazioni su una determinata località e, successivamente, si chiede anche come raggiungerla, in teoria il sistema non dovrebbe aver bisogno di ulteriori aggiunte esplicative.

Il motivo per cui lo speech recognition ha trovato posto con le CUI nell’Hype Cycle NLP deriva dall’interazione reciproca e dal coinvolgimento congiunto del natural language understanding. Un computer o un dispositivo mobile cattura quello che dice una persona attraverso un microfono, talvolta trascrivendo la voce in testo (speech-to-text), e combina grammatica, struttura della lingua e composizione dei segnali audio per estrarre le informazioni in vista di un’ulteriore elaborazione. Per questo le conversational user interfaces, oltre a dover essere costantemente aggiornate, non possono prescindere da un ampio dizionario che include varianti della stessa frase. Non basta che siano capaci di interpretare “Dammi gli orari del treno”, ma devono anche comprendere “Quali sono gli orari ferroviari” oppure “A che ora parte il treno” e così via.

VUI, chatbot, casi d’uso: dalla smart home ai settori industriali

Nel contesto delle CUI, le voice user interfaces (VUI) stanno diventando la forma consueta attraverso la quale gli utenti usano smartphone, TV, robot aspirapolvere ecc. Ma questo non deve far dimenticare che esistono anche i chatbot e che il loro impiego sotto forma di messenger nelle app o sui siti aziendali continua a riscuotere un certo successo. Analogamente alle VUI, i bot danno risposte significative in assenza di comandi esatti, seppure in forma scritta. Tra i casi d’uso maggiori si possono citare quelli del retail e dell’e-commerce che adoperano spesso i chatbot per fornire informazioni sugli acquisti, la fatturazione, la spedizione o per rispondere a quesiti in maniera automatica e senza il coinvolgimento di un operatore umano. Anche i settori bancario e assicurativo si avvalgono dei bot come prima linea nell’assistenza ai clienti, soprattutto per accompagnarli nella risoluzione di problemi di facile entità. Invece, un vero e proprio boom che sta coinvolgendo le VUI è quello dei dispositivi IoT (Internet of Things) domestici connessi e che si possono guidare tramite comandi vocali. Questa peculiarità è all’origine di un loro utilizzo sempre più diffuso in ambienti produttivi e industriali. Una voice conversational user interface potrebbe ad esempio essere l’opzione ideale quando si manovrano apparecchiature o macchinari. In ogni caso, che si tratti di chatbot o di VUI, il loro ricorso da parte delle aziende tenderà ad aumentare per gli evidenti benefici di ottimizzazione delle risorse e miglioramento nella tempistica di gestione del cliente. Gran View Research ha valutato che il mercato dei sistemi per il conversational user interfaces design nel 2019 valeva 5,94 miliardi di dollari e che il tasso di crescita annua dal 2020 al 2027 sarà del 26,3%. Una previsione che nel next normal probabilmente dovrà essere rivista al rialzo.