L’approccio al cloud divide le aziende creando un “effetto distonico”. Se i benefici di flessibilità e sicurezza sono ampiamente riconosciuti, rimangono ancora nodi spinosi da sciogliere, come il controllo sui costi e la governance dei dati.

Fabio Pascali, Regional Vice President Italy di Cloudera, riassume così il rapporto travagliato che gli IT Decision Maker (ITDM) dell’area EMEA vivono nei confronti della nuvola. Il vendor, che fornisce una piattaforma per la gestione dei dati multi-source in ambienti ibridi, ha infatti pubblicato i risultati di un’indagine condotta nel 2023 da Coleman Parkes Research, coinvolgendo un campione di 850 decisori informatici appartenenti a realtà con oltre mille dipendenti.

La distonia strategica della cloud adoption tra le aziende EMEA

“Secondo lo studio – riporta Pascali – il 76% degli intervistati ha dichiarato l’intenzione nei prossimi tre anni di ‘rimpatriare’ alcuni workload ritornando all’on-premise. Tuttavia, la maggioranza dei rispondenti ha anche espresso la volontà di migrare in cloud ulteriori carichi applicativi nel triennio venturo. Insomma, le aziende oggi hanno acquisito la maturità necessaria per comprendere le potenzialità e i limiti della nuvola”.

Se la flessibilità è il tornaconto primario, i costi rappresentano il peggiore spauracchio. Pertanto, la convenienza del cloud risiede nella capacità di valutare quali workload possono veramente beneficiare dalla migrazione.

Data management: preoccupa la compliance, lievitano i costi

La compliance, come suggerisce Pascali, è l’altra grande discriminante della cloud adoption, poiché limita la possibilità di trasferire i dati presso le infrastrutture dei provider, a seconda della criticità e delle legislazioni nazionali.

Per gli ITDM , il tema della conformità in materia di gestione e sicurezza delle informazioni rimane centrale. La ricerca rivela che, nei processi di data management, le principali preoccupazioni degli intervistati riguardano la compliance e la governance, indicate rispettivamente dal 79% e 66% del campione. In Italia, le statistiche rimangono pressoché allineate alla media EMEA, attestandosi al 76% e 65%.

In particolare, il 63% dei decisori EMEA e il 59% degli italiani addita la “segregazione” dei dati in silos tra gli ostacoli che impediscono il pieno raggiungimento della compliance normativa.

Inoltre, il ricorso a un insieme di soluzioni puntuali per la gestione e l’analisi delle informazioni non solo acuisce il problema della conformità, ma sta facendo anche lievitare i costi del data management, come dichiara il 78% delle aziende EMEA e il 68% delle imprese italiane. In media, le organizzazioni della regione spendono circa il 28% del budget IT annuale per la gestione dei dati lungo l’intero ciclo di vita (a livello nazionale, la statistica raggiunge addirittura il 36%).

Libertà di scelta tecnologica con l’hybrid data platform

“Alla luce dello scenario descritto – prosegue Pascali – dove i silos rappresentano un problema e la flessibilità del cloud un’opportunità, Cloudera esprime il massimo potenziale. Fornisce, infatti, una hybrid data platform che lascia libero il cliente di decidere dove e quando spostare i workload aziendali, su ambienti on-premise e nuvole pubbliche o private nel rispetto della compliance”.

Sotto ogni punto di vista, sottolinea, l’indipendenza tecnologica rappresenta un tassello essenziale nella filosofia di Cloudera, che si dichiara impegnata nel garantire l’interoperabilità con soluzioni di terze parti e attualmente lavora con tutti i principali cloud provider, da Microsoft a Google.

La nuova partnership con AWS e il rilascio di Apache Iceberg

“Recentemente – sottolinea Pascali – abbiamo annunciato una partnership tecnologica e commerciale con Amazon Web Services. Oggi le soluzioni Cloudera sono perfettamente integrate con l’ecosistema AWS, ottenendo così benefici di scalabilità per i nostri clienti nei processi di gestione e analisi dei dati”.

Sostanzialmente, le aziende potranno fruire della Cloudera Data Platform (CDP) nella versione Public Cloud direttamente dalle infrastrutture di AWS, acquistandola sul marketplace del provider, traendo vantaggio dai suoi servizi e accelerando così la migrazione dei workload sulla nuvola.

Tuttavia, la collaborazione si spinge in ottica ancora più strategica. “Abbiamo rilasciato sul cloud di Amazon in maniera nativa – evidenzia Pascali – Apache Iceberg, cioè un formato tabellare open-source che permette di svincolare le risorse sottostanti creando i presupposti tecnologici per la costruzione del lakehouse”.

L’Open Data Lakehouse per ogni tipo di necessità

Ma di cosa si sta parlando esattamente? Proseguendo nei dettagli, Pascali descrive l’Open Data Lakehouse di Cloudera, basato su Apache Iceberg, come una piattaforma per la gestione delle informazioni in grado di coniugare la flessibilità dei moderni data lake con la potenza dei tradizionali data warehouse.

Entrambe le tecnologie, infatti, convivono spesso all’interno delle organizzazioni con scopi differenti: i primi sono ad uso soprattutto dei data scientist per attività di advanced analytics e intelligenza artificiale; i secondi rimangono invece legati al mondo della Business Intelligence.

Secondo le dichiarazioni del vendor, il lakehouse offrirebbe invece un ambiente unico, supportando applicazioni BI, AI e ML o altre analisi in streaming sugli stessi dati senza doverli bloccare o spostare dal sistema su cui risiedono. Inoltre, come evidenzia Pascali, proprio perché basato su tecnologie open-source, può essere implementato ovunque, on-premise o sulla nuvola, senza obbligare le scelte del cliente.

Trusted AI: la filosofia di Cloudera per l’innovazione intelligente

In virtù delle caratteristiche sopraccitate, Cloudera promuove l’Open Data Lakehouse come ambiente affidabile per le nuove applicazioni di intelligenza artificiale generativa.

“Molte imprese – afferma Pascali – stanno pensando di utilizzare la Generative AI per reingegnerizzare i processi aziendali esistenti così da ottenere benefici in termini di riduzione dei costi, customer relationship, creazione di documenti e così via. Tuttavia, esistono dei freni di adozione, tra cui l’incertezza dei risultati e la sicurezza delle informazioni, che vengono esportate su applicazioni esterne all’organizzazione. Cloudera invece promuove il principio della Trusted AI che riporta il tema della sovranità del dato nell’ambito dell’intelligenza artificiale”.

Il vendor ha infatti stretto una partnership con Hugging Face, la startup franco-statunitense che ha sviluppato l’alternativa open-source a ChatGPT e fornisce una libreria di modelli AI aperti. “Così – chiarisce Pascali – abbiamo qualificato una serie di Large Language Model mettendola a disposizione dei nostri clienti all’interno di Cloudera Machine Learning. La nostra soluzione pertanto offre dei prototipi di intelligenza artificiale generativa pre-addestrati, che permettono di sperimentare nuove applicazioni e ottenere risultati. Chiaramente gli LLM possono essere arricchiti attraverso i prompt e database vettoriali. L’intelligenza artificiale generativa infatti non va concepita come singolo componente, ma piuttosto un’integrazione”.

Come chiarisce Pascali, l’approccio Trusted AI permette di ridurre il rischio di allucinazioni perché il motore di AI si alimenta con le informazioni dell’azienda, fornendo risposte più coerenti rispetto a una soluzione generalista. Inoltre, offre maggiori garanzie di sicurezza, perché il dato non esce dal perimetro aziendale.

Tra le referenze internazionali di Cloudera, in ambito ML, Pascali cita la cinese OCBC Bank, che attraverso le soluzioni di AI generativa del vendor ha ottenuto significativi risultati in tre ambiti: sviluppo software, generazione automatica di report (con un taglio sui costi del 95%) e customer relationship. Nell’ultimo caso, grazie all’analisi continua delle interazioni, è stato possibile ridurre il tempo dedicato a ciascun cliente del 10%; inoltre l’AI ha permesso di duplicare l’efficacia delle campagne promozionali).

La diffusione della Data Platform in Italia

Tornando all’Italia, Pascali è positivo: recentemente è stato aperto un ufficio a Milano, in Piazza Gae Aulenti, un segnale di prestigio per clienti e partner. Il business è distribuito su diverse realtà (non ci sono grossi progetti di punta), il fatturato ricorrente annuale mostra buoni risultati, c’è maggiore apertura verso le Pmi (complice il Public Cloud che ha abbassato le barriere di ingresso).

Insomma, la caratteristiche chiave della CDP (ovvero, gestione end-to-end del dato, utilizzo di tecnologie open-source, indipendenza dall’ambiente sottostante, interoperabilità con soluzioni terze) sembrano convincere il mercato nazionale, in particolare nei settori Finance, Telco ed Energy.

Ultimamente, si sta registrando una crescita significativa anche nel comparto Pubblico. “Ormai – dichiara – la PA rappresenta per Cloudera un’area strategica. Molte amministrazioni hanno capito che la capacità di integrare e analizzare i dati è una leva fondamentale per migliorare i servizi al cittadino. La nostra piattaforma permette di gestire le informazioni indipendentemente dai sistemi sottostanti, senza vincolare l’ente nelle scelte infrastrutturali e nelle gare di appalto”.

Tra i settori su cui concentrare i prossimi sforzi, Pascali individua il Manifatturiero, sulla spinta dell’Industria 4.0, il Farmaceutico (molto promettente soprattutto all’estero) e gli istituti governativi locali, ad esempio in ambito sanitario.

