architetture

Everpure Data Stream prepara i dati all’AI senza spostarli

Data Stream consente di preparare documenti, file e contenuti enterprise per applicazioni AI direttamente nel luogo dove risiedono. L’obiettivo è accelerare RAG e inferenza mantenendo controllo, sicurezza e tracciabilità dei dati

Pubblicato il 24 giu 2026

Aggiungi tra i preferiti su Google

Gianluca Ferrari

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

Everpure porta la preparazione dei dati AI-ready dentro l’infrastruttura storage. Con Data Stream, annunciato a Pure Accelerate 2026, la società punta a ridurre uno dei passaggi più lenti nei progetti di intelligenza artificiale aziendale: trasformare dati dispersi, non strutturati e soggetti a vincoli di sicurezza in input utilizzabili da agenti, sistemi di ricerca semantica, applicazioni RAG e workload di inferenza.

L’offerta si basa sul reference design NVIDIA AI Data Platform e si inserisce nella strategia con cui Everpure, ex Pure Storage, sta ampliando il proprio posizionamento dallo storage alla gestione intelligente del dato. La promessa riguarda tempi più brevi di preparazione, controlli sugli accessi e scalabilità indipendente tra storage e capacità di calcolo.

Indice degli argomenti

Everpure Data Stream e la preparazione dei dati AI-ready

Secondo il comunicato ufficiale, Data Stream porta capacità avanzate di AI direttamente sui dati enterprise, “nel luogo in cui già risiedono”. Everpure sostiene che questa soluzione integrata hardware-software consente di ridurre la preparazione dei dati grezzi “da mesi a minuti”, introdurre controlli di accesso a livello di flusso e supportare un’architettura scale-out in cui storage e capacità di calcolo possono crescere in modo indipendente.

Molti progetti AI aziendali si bloccano prima del modello, quando occorre raccogliere contenuti da sistemi SaaS, ambienti on-premise, cloud, mainframe, archivi documentali e repository applicativi. In assenza di pipeline ripetibili, i team finiscono per duplicare dati, creare processi manuali e moltiplicare controlli di sicurezza difficili da mantenere.

Data Stream si propone come componente infrastrutturale per automatizzare ingestione, trasformazione e ottimizzazione dei dati destinati alle pipeline AI. Everpure descrive la soluzione come uno stack hardware-software, GPU-centric, collocato tra storage e GPU, progettato per preparare dati enterprise per inferenza e applicazioni di AI generativa.

Lavorare direttamente sui dati non strutturati

Il valore operativo emerge soprattutto sui dati non strutturati. Documenti, PDF, immagini, email, knowledge base e tabelle aziendali sono spesso ricchi di informazioni, ma poco adatti a essere usati direttamente da modelli e agenti AI. Data Stream dichiara di poter trattare contenuti accessibili tramite protocolli come NFS, S3 e SMB, eseguendo chunking, arricchimento dei metadati, generazione di vector embeddings e scrittura degli output in formati come JSON, Parquet o Arrow.

Per le applicazioni RAG, questo significa predisporre dati indicizzati e ricercabili a supporto di retrieval, query augmentation e generazione di risposte basate su contenuti aziendali. Per i team infrastrutturali, significa spostare una parte della data preparation in un layer più vicino allo storage, con l’obiettivo di ridurre passaggi manuali e copie intermedie.

Il ruolo di NVIDIA AI Data Platform

La scelta di appoggiarsi a NVIDIA AI Data Platform colloca Data Stream nel filone delle infrastrutture enterprise in cui lo storage non conserva soltanto dati, ma partecipa alla loro preparazione per l’AI. NVIDIA definisce la piattaforma come un reference design personalizzabile che integra accelerated computing nello storage enterprise per centralizzare la gestione intelligente dei dati, ridurre la latenza, rafforzare la sicurezza e migliorare le prestazioni dei workflow di agentic AI.

L’infrastruttura proposta da Everpure utilizza il reference design NVIDIA per accelerare le attività di acquisizione, indicizzazione e preparazione dei dati che alimentano applicazioni AI e sistemi di inferenza. Il dato aziendale viene trattato più vicino alla fonte, mentre l’infrastruttura accelera estrazione, indicizzazione e retrieval. È una direzione coerente con la crescita dei workload AI che richiedono accesso a grandi volumi di dati multimodali, aggiornati e governati.

Governance e sicurezza come requisito dell’AI in produzione

La parte più significativa per le imprese riguarda la governance. Se agenti e applicazioni AI accedono direttamente a dati aziendali, ogni pipeline deve rispettare policy, autorizzazioni, classificazioni e vincoli di compliance. Everpure lega Data Stream a Data Intelligence, la tecnologia derivata da 1touch, pensata per individuare, classificare e contestualizzare le informazioni alla fonte.

L’acquisizione di 1touch aggiunge alla piattaforma Everpure funzioni di data discovery, classificazione, data security posture management e contesto semantico. Questo passaggio è rilevante perché la preparazione dei dati per l’AI non riguarda solo pulizia e indicizzazione. Include la capacità di sapere quali dati possono essere usati, da chi, con quali permessi e in quali applicazioni.

Il dato IDC sulla qualità dei dati

Come noto ai più, molte iniziative AI rallentano quando passano dalla sperimentazione all’esercizio. Secondo il white paper IDC “Why AI Projects Fail: Revealing the Data Infrastructure Gap”, il 94% dei responsabili IT identifica la qualità dei dati come fattore determinante per il successo dell’AI.

La qualità del dato, la frammentazione delle fonti e la governance incidono direttamente su accuratezza del retrieval, affidabilità delle risposte, tempi di sviluppo e rischio operativo.

Nodo dell’AI enterprise	Impatto sui progetti	Risposta promessa da Data Stream
Dati frammentati	Pipeline lente, duplicazioni, integrazioni costose	Ingestione e preparazione integrate
Dati non strutturati	Difficoltà in ricerca semantica e RAG	Chunking, metadati, embeddings
Governance	Rischi su accessi, audit e compliance	Policy e controlli a livello di flusso
Scalabilità	Colli di bottiglia tra storage e GPU	Crescita separata di storage e compute

Le domande per CIO e responsabili infrastruttura

La prima domanda riguarda l’integrazione con l’esistente: data lake, archivi documentali, storage on-premise, repository cloud, applicazioni SaaS, sistemi legacy e ambienti Kubernetes. Una pipeline AI-ready produce valore se riesce a leggere e governare i dati dove sono già gestiti, senza imporre una migrazione estesa o una duplicazione costosa.

La seconda riguarda la misurazione del beneficio. Ridurre i tempi di preparazione dei dati è un obiettivo rilevante, ma in produzione servono metriche più precise: tempi di ingestione, accuratezza del retrieval, freschezza degli indici, utilizzo delle GPU, riduzione delle copie, costi per workload e impatto sui tempi di rilascio delle applicazioni AI.

La terza riguarda il lock-in architetturale. Data Stream nasce dentro l’ecosistema Everpure e si appoggia al reference design NVIDIA. Per molte imprese questa integrazione può semplificare deployment e supporto. Per altre può introdurre dipendenze da valutare rispetto a strategie multicloud, standard aperti, strumenti già adottati e vincoli di procurement.

Resta poi il tema della sicurezza. Rendere i dati disponibili agli agenti AI amplia la superficie di controllo: servono policy coerenti, segregazione degli accessi, tracciabilità delle query, gestione dei dati sensibili e verifiche su come gli output vengono prodotti, conservati e riutilizzati. La promessa di portare AI più vicino al dato ha senso solo se non riduce la visibilità dei team security e compliance.

In ogni caso, la preparazione dei dati per l’AI tende a diventare una funzione stabile della piattaforma, non un progetto artigianale ricostruito per ogni caso d’uso. Storage, governance, indicizzazione, retrieval e accelerazione GPU entrano sempre più nella stessa discussione architetturale.

@RIPRODUZIONE RISERVATA