Ricerca documentale, il ruolo di uno Smart Data Hub

pittogramma Zerouno

Digital360 Awards

Ricerca documentale, il ruolo di uno Smart Data Hub

Injenia ha realizzato per Saipem una piattaforma che permette di trovare documenti e informazioni in modo semplice e pertinente. La soluzione messa a punto sfrutta le più recenti tecnologie di ricerca cognitiva e di Natural Language Processing

12 Ago 2022

di Redazione

Saipem aveva bisogno di mettere i propri operatori nelle condizioni di trovare documenti e informazioni in modo semplice e pertinente, a prescindere dalla loro lingua e localizzazione nel mondo. Per farlo, occorreva creare una soluzione capace di indicizzare, etichettare e cercare documenti per requisiti di alto livello. La soluzione doveva essere basata su tecnologia Microsoft Azure, integrandosi con una pluralità di sorgenti documentali. In tale contesto è nato, in collaborazione con Injenia, il progetto Smart Data Hub, risultato finalista ai Digital Awards 2022 per la categoria Machine Learning e Intelligenza Artificiale.

Cos’è e come funziona lo Smart Data Hub

Saipem ha realizzato lo Smart Data Hub per ottimizzare il processo di ricerca documentale in termini di pertinenza e accuratezza delle risposte. Permette di indicizzare, etichettare e cercare documenti in modo rapido e semplice, sfruttando le più recenti tecnologie di ricerca cognitiva e di Natural Language Processing (NLP).

È una soluzione multipiattaforma che, in questo progetto, utilizza diverse funzionalità cloud messe a disposizione da Microsoft Azure.

Le tecniche implementate di NLP permettono di leggere e interpretare il linguaggio naturale grazie a regole, euristiche e modelli di apprendimento automatico.

Estraggono insight e dati strutturati da contenuti non strutturati come i documenti di testo, consentendo di automatizzare la loro classificazione, organizzazione e ricerca.

Lo Smart Data Hub riesce a gestire un grande volume di documenti organizzativi, qualitativi e tecnici come manuali e regolamenti, provenienti da numerose fonti e suddivisi in 7 tipologie in diverse lingue.

I documenti supportati provengono da sistemi in cloud (come SharePoint Online) o on-premise (come SharePoint On-Premise e Documentum). Permette la ricerca semplice e veloce del documento corretto anche tra un enorme volume di possibili risultati, andando a ricostruire il reale intento della ricerca.

Le sue principali caratteristiche riguardano: suggerimenti forniti dalle digitazioni; ricerche sia in OR che in AND (ricerca esatta); ricerca avanzata con filtri sfruttando i valori dei metadati.

La soluzione consente: di utilizzare quattro lingue differenti supportate (inglese, francese, spagnolo, italiano); la condivisione dei risultati della ricerca; il salvataggio delle query più utilizzate tra i preferiti; la ricerca in diversi contesti: contenuto dei documenti, valori e descrizioni dei metadati, TAG e l’evidenziazione delle parole chiave nel contenuto dei documenti.

Per quanto riguarda l’etichettatura dei documenti, la codifica automatica elabora alcune regole per suggerire l’applicazione di metadati e valori TAG. La funzionalità si basa su una tecnica NLP che permette di ottenere le parole chiave più importanti nel documento.

Queste parole chiave vengono confrontate con le regole esistenti nel sistema. Nel caso in cui la ricerca sia positiva, vengono forniti i suggerimenti richiesti. La realizzazione dell’infrastruttura di processo di gestione e provisioning è stata realizzata con modalità infrastructure-as-a-code.

La roadmap di implementazione seguita è riassumibile nei seguenti step: realizzazione di un PoC di 3 mesi volto alla validazione del modello; implementazione della soluzione su 3 ambienti seguendo una logica DevOps; rilascio in produzione della main release; continuous improving attraverso l’analisi dei key user.

I benefici ottenuti da Saipem

Come anticipato, lo Smart Data Hub è in grado di gestire grandi quantità di documenti, di diversa lingua, formato e provenienti da fonti dati di diverse tipologie. Lo Smart Data Hub realizzato da Saipem e Injenia è diventato un asset strategico capace di migliorare la diffusione della conoscenza e la qualità delle informazioni richieste dagli operatori e ha migliorato notevolmente la velocità di reperimento delle informazioni e, di conseguenza, aumentato l’efficienza dei processi.

In sintesi, Injenia ha strutturato uno Smart Data Hub coerente, facilmente accessibile e consultabile, a supporto dei processi decisionali interni. È aderente alle security policy di Saipem, garantisce un’esperienza di usabilità intuitiva che aiuta l’azienda a fornire il contenuto giusto agli operatori.

Il progetto procede per rilasci incrementali, ottimizzando la soluzione sulla base dell’esperienza utente in un’ottica di continuous improving. Lo Smart Data Hub diventa dunque sempre più ricco di funzionalità capaci di rispondere alle reali esigenze degli operatori.

R

Redazione

Nel corso degli anni ZeroUno ha esteso la sua originaria focalizzazione editoriale, sviluppata attraverso la rivista storica, in un più ampio sistema di comunicazione oggi strutturato in un portale, www.zerounoweb.it, una linea di incontri con gli utenti e numerose altre iniziative orientate a creare un proficuo matching tra domanda e offerta.

Argomenti trattati

Approfondimenti

Digital360 Awards

Articolo 1 di 4