NLP cos’è, come funziona ed esempi d’uso

pittogramma Zerouno

Guida

NLP cos’è, come funziona ed esempi d’uso

Il natural language processing, in sigla NLP, è un’interfaccia uomo-macchina in grado di comprendere il linguaggio naturale, espresso in forma testuale o vocale. I sistemi NLP giocano un ruolo crescente in tutti i settori aziendali, e fondano il loro funzionamento su svariate tecnologie. Di seguito, una breve guida sui temi salienti

08 Nov 2022

di Giorgio Fusari

NLP è l’acronimo di “natural language processing”, che significa in italiano “elaborazione del linguaggio naturale”. Il lavoro di studio e ricerca scientifica su cui questa tecnologia affonda le proprie radici è lungo oltre settant’anni, ma i moderni esempi applicativi dei sistemi NLP sono oggi sotto gli occhi di tutti: basti pensare agli assistenti virtuali, ai sistemi di navigazione che tutti ormai usiamo in auto; ai sempre più diffusi chatbot, attivi nel servizio clienti di molte organizzazioni, e con cui è possibile interagire in maniera naturale per chiedere assistenza o informazioni su prodotti e servizi commerciali.

Tutto ciò testimonia come, in questi ultimi anni, la tecnologia NLP sia riuscita a estendere la propria presenza, dal più ristretto mondo accademico e della ricerca, al mondo delle imprese e del business, dove sta declinandosi in una miriade di nuove applicazioni.

Cosa significa elaborazione del linguaggio naturale?

Scendendo maggiormente nel dettaglio, con il termine NLP ci si riferisce a una tecnologia che appartiene a una branca dell’informatica, e, in maniera ancora più specifica, al dominio dell’intelligenza artificiale (AI). Ma NLP è anche a una tecnologia che, inevitabilmente, ha connessioni profonde con la linguistica, ossia la scienza che studia in maniera sistematica il linguaggio umano, in tutte le sue espressioni, forme, strutture.

WHITEPAPER
Cognitive Experience Center: ecco l'AI che può davvero supportare i tuoi operatori!
Intelligenza Artificiale
Networking

In sostanza, la tecnologia NLP consente a un software computerizzato di comprendere il linguaggio umano, sia che questo venga acquisito dalla macchina in forma testuale, oppure sulla base di parole pronunciate da una persona.

Per elaborare il linguaggio umano, sotto forma di testo o voce, e comprenderne a fondo il significato, NLP può utilizzare un insieme di tecniche. Queste spaziano, dalla linguistica computazionale, che analizza ed elabora il linguaggio naturale tramite metodologie informatiche, ai modelli statistici, fino ai modelli di machine learning (ML) e deep learning (DL).

Qual è l’obiettivo principale del NLP?

Gli esseri umani, utilizzando udito e vista, interagiscono tra loro rafforzando la comunicazione non solo attraverso le parole ma anche con la gestualità, che favorisce la comprensione del contesto.

In maniera analoga, un programma computerizzato può servirsi di sensori acustici, microfoni, ma anche di sensori d’immagine e tecniche di deep learning, per acquisire dati utili ad accrescere la propria consapevolezza situazionale (SA – situational awareness).

Un sistema NLP dotato di “orecchi e occhi elettronici” può trasformarsi in un’interfaccia uomo-macchina (HMI) ancora più potente e intelligente. La facoltà di percepire anche i gesti aiuta infatti l’applicazione NLP a capire meglio a cosa l’utente fa riferimento, o cosa sta indicando, mentre parla. Di conseguenza, l’applicazione NLP riesce a migliorare il proprio livello di comprensione del discorso.

Perché NLP è importante

Una ragione, spesso addotta, del perché NPL ricopra un ruolo sempre più importante nel mondo di oggi è legata alle enormi moli di dati non strutturati che vengono generate ogni giorno. Molte organizzazioni, attività di business, persone, producono questi dati, che possono essere corposi file di testo scritti in linguaggio naturale, conversazioni relative a messaggi e chat delle reti sociali; ma anche cartelle cliniche, referti, immagini radiologiche, o quant’altro. Molti dati non strutturati prodotti online, sono memorizzati in database, sistemi di storage, e fino a pochi anni fa era difficile analizzarli in maniera efficace ed efficiente, per ricavare insight: oggi però ciò è possibile con la tecnologia NLP di ultima generazione, che può funzionare di continuo ed eseguire con rapidità analisi precise.

Di conseguenza, i sistemi NLP rivestono un’importanza crescente nelle varie organizzazioni, per l’opportunità di sviluppare soluzioni basate su NLP, capaci di aumentare l’efficienza dei processi di business, razionalizzare l’operatività aziendale e rendere i dipendenti più produttivi.

Cos’è NLP e come funziona

Elementi grammaticali, differenze nella struttura sintattica e morfologica, parole diverse con il medesimo suono, espressioni idiomatiche, metafore, e molto altri fattori rendono il linguaggio umano, in forma testuale o vocale, particolarmente complesso da intendere in tutti i suoi differenti e profondi significati. La tecnologia NLP è comunque in grado di muoversi in questa complessità velocemente, riconoscendo i diversi elementi. Come?

Anzitutto, eseguendo una prima pre-elaborazione dei dati, testuali o vocali, indirizzata a semplificarli, e prepararli in una forma che la macchina sia poi in grado di analizzare, per attribuire un senso al linguaggio umano.

Esistono diverse operazioni di pre-elaborazione eseguite dalla tecnologia NLP, vediamone alcune.

Tokenizzazione

La tokenizzazione serve, ad esempio, a spezzare il testo continuo in frasi o unità semantiche più piccole, denominate token.

Segmentazione del parlato

La segmentazione del parlato, in maniera simile, permette di dividere il flusso vocale, il discorso di una persona, in singole parole o parti più piccole.

Part-of-speech tagging

La tecnica part-of-speech tagging (POS) consente d’identificare, tra le parole del discorso, quali sono i nomi, verbi, aggettivi, pronomi, congiunzioni, avverbi, etichettando ciascun elemento con uno specifico tag.

Stemming

Lo stemming attua una sorta di normalizzazione delle parole, riducendole alla loro forma radice.

Lemmatizzazione

La lemmatizzazione (lemmatization) è una tecnica di normalizzazione orientata a restituire la forma di una parola così com’è contenuta nel dizionario, cioè il lemma.

Rimozione delle stop word

La rimozione delle stop word, cioè delle parole ricorrenti (articoli, congiunzioni, preposizioni) ha la funzione di eliminare dal testo gli elementi ininfluenti per i risultati restituti dal motore di ricerca, lasciando solo quelli che forniscono più informazioni sul testo.

Le tipologie principali di algoritmi adottati

Quando la fase di pre-elaborazione dei dati risulta completata, può avere inizio la fase successiva, che tipicamente prevede lo sviluppo di un algoritmo in grado di elaborare e interpretare i dati stessi.

Gli algoritmi NLP rule-based

A una prima categoria di algoritmi NLP appartengono i sistemi “rule-based”, ossia quelli improntati su regole linguistiche. Gli algoritmi rule-based sono anche cronologicamente gli algoritmi sviluppati all’inizio delle attività di creazione della tecnologia NLP. L’approccio rule-based richiede in sostanza la realizzazione di un sistema di regole costruito artigianalmente, a partire dalle strutture linguistiche incluse nel progetto.

Nei sistemi basati su regole è sempre possibile controllare e verificare se il sistema ha potuto elaborare l’interrogazione dell’utente, e in che modo ha risposto alla richiesta dati. La limitazione più evidente è però il fatto che l’approccio rule-based richiede le competenze di un esperto linguista per la codifica di ciascuna regola nella tecnologia NLP. Per comprendere e interpretare una frase, proposizione, il sistema rule-based applica l’insieme, comunque limitato, di regole codificate manualmente, cercando d’individuare le relazioni tra le parole.

Elaborazione del linguaggio naturale e machine learning

L’altra fondamentale tipologia di algoritmi NLP è costituita dagli algoritmi di machine learning (ML). A differenza dei sistemi rule-based, i sistemi basati su algoritmi di ML non richiedono la definizione manuale di regole, perché sono improntati su metodi statistici, e sono in grado di apprendere in automatico da un dataset di training, per poi creare da sé le proprie regole e meccanismi di classificazione.

Come viene utilizzato NLP nella vita reale? Esempi d’uso e applicazioni

Il comparto globale della tecnologia NLP valeva 13,5 miliardi di dollari nel 2021, secondo stime della società di ricerche di mercato Straits Research, e toccherà, entro il 2030, la cifra di 91 miliardi di dollari, registrando un tasso di crescita annuale composto (CAGR) pari al 27%, nel periodo preso in esame dalla previsione (2022–2030). L’espansione del mercato NLP è attribuibile alla crescente adozione di questa tecnologia in ambiti come i contact center, i sistemi aziendali di servizio clienti e il settore dell’assistenza sanitaria.

Customer service

Nel customer service, i chatbot, comprendendo le richieste dei clienti, permettono di automatizzare le azioni successive, come fissare un appuntamento, o elaborare e tracciare un ordine. In maniera simile, gli assistenti virtuali, come Alexa, l’assistente vocale di Amazon, usano il riconoscimento vocale per comprendere i comandi dell’utente, e la generazione di linguaggio naturale (NLG) per rispondere adeguatamente alle richieste.

Assistenza sanitaria

Nel settore dell’assistenza sanitaria, la tecnologia NLP può essere utile ai medici che devono documentare procedure e risultati, tipicamente dettando a un operatore, o a un registratore vocale, le varie informazioni, che poi verranno trascritte in forma testuale. In questi casi, il sistema NLP può analizzare tali registrazioni e convertirle in testo, ma anche interpretare note e descrizioni dei test clinici su pazienti, identificando possibili nuovi candidati. Inoltre, l’applicazione NLP può utilizzare registrazioni e documenti di ricerca come dataset di training, per apprendere e riconoscere i termini medicali.

Cybersecurity

Nel campo della cybersecurity, le facoltà del sistema NLP nella classificazione del testo tornano utili per l’identificazione dello spam, tramite l’analisi di e-mail, frasi, messaggi che, per le loro caratteristiche, sono indicativi di comunicazioni indesiderate, tentativi di phishing o tecniche di ingegneria sociale.

NLP e market intelligence

Nell’ambito della market intelligence, le capacità della tecnologia NLP servono anche ad analizzare il “sentiment” in un dato comparto commerciale, estraendo insight utili dall’esame di commenti, recensioni, domande, risposte, post, reperiti sui vari canali delle reti sociali.

WHITEPAPER
La RPA in 9 step: da dove si comincia?
Intelligenza Artificiale
Realtà virtuale

Giorgio Fusari

Giornalista

Nel settore giornalistico dal 1989, Giorgio Fusari negli anni ha collaborato per numerose pubblicazioni nel panorama tecnologico e ICT italiano, tra cui la rivista NetworkWorld Italia (gruppo IDG); il settimanale di tecnologia @alfa, del quotidiano Il Sole 24 Ore, la testata Linea EDP. Dal 2012 collabora con il gruppo Digital360 e in particolare con ZeroUno. Tra le aree di maggior specializzazione di Giorgio, il crescente universo dei servizi cloud, il networking, le tecnologie di cybersecurity.

Argomenti trattati

Approfondimenti

Intelligenza Artificiale
M
Machine Learning

Articolo 1 di 5