Attualità

Hyperscale NAS: storage per potenziare le performance



Indirizzo copiato

Hammerspace ha introdotto un’architettura NAS che promette di eliminare i colli di bottiglia dei sistemi tradizionali e delle soluzioni NAS scale-out, rispondendo alle esigenze di orchestrazione dati a livello geografico per l’elaborazione dei workload di AI, ML e deep learning

Pubblicato il 29 apr 2024



4938

Le nuove architetture applicative richiederanno in maniera crescente nuovi tipi di infrastruttura, inclusa l’infrastruttura edge per i casi d’uso data-intensive, costituendo una sfida continua per i team aziendali I&O (infrastructure and operations). La previsione è della società di ricerca e consulenza Gartner, secondo cui la domanda di nuovi tipi di infrastruttura è tra i trend che impatteranno il futuro di cloud, data center, infrastruttura edge. Contemporaneamente, il mercato globale delle soluzioni infrastrutturali per l’intelligenza artificiale (AI) sta rapidamente espandendosi: lo segnala un rapporto pubblicato da MarketsandMarkets, secondo cui, nei data center che elaborano workload AI, aumenta la focalizzazione sulle tecnologie di calcolo parallelo, utilizzato nelle applicazioni HPC (High Performance Computing) e nei supercomputer.

Evoluzione in atto nelle architetture di storage

Oltre alle crescenti necessità infrastrutturali, il calcolo a elevate prestazioni comporta sfide architetturali a livello di file system: sfide che fanno emergere limiti nelle esistenti tecnologie e sistemi di storage per la gestione, l’organizzazione, e l’accesso ai dati sui differenti dispositivi di memorizzazione, residenti on-premise, nella rete edge, o nel cloud.

L’architettura Hyperscale NAS (fonte: Hammerspace)

Con l’obiettivo di superare tali limitazioni, e implementare pipeline dati ad alte prestazioni, richieste dal calcolo parallelo basato su GPU (graphics processing unit), a febbraio la società californiana Hammerspace ha introdotto quella che definisce una “nuova categoria di architettura storage”, in grado di abbracciare ambienti IT che spaziano dalle infrastrutture edge, ai data center, al cloud: si chiama Hyperscale NAS, si basa su pNFS (parallel Network File System) ed è disponibile con il supporto storage GPUDirect di Nvidia. Questa architettura NAS (network attached storage) a elevate performance punta a eliminare i colli di bottiglia degli attuali sistemi di storage, nel rispondere ai requisiti dei progetti che adottano AI, ML (machine learning) e DL (deep learning) a livello aziendale, e nell’indirizzare l’aumento diffuso del GPU computing, negli ambienti on-premise e nel cloud.

Hyperscale NAS, aggiunge Hammerspace, supporta l’addestramento dei modelli linguistici di grandi dimensioni (LLM) e fornisce la velocità necessaria per alimentare con efficienza cluster di GPU di qualsiasi dimensione, per applicazioni di AI generativa (GenAI), rendering e calcolo ad alte prestazioni in ambito aziendale.

Hyperscale NAS, per combinare prestazioni HPC con sicurezza e semplicità d’uso

David Flynn, cofondatore e amministratore delegato di Hammerspace, ha illustrato Hyperscale NAS in anteprima alla stampa, al recente Technology Live! di Londra, approfondendo quali sono le attuali sfide infrastrutturali a cui la nuova architettura vuol rispondere: da un lato, negli odierni ambienti dati, decentralizzati e distribuiti in infrastrutture tecnologicamente eterogenee, l’addestramento e l’ottimizzazione di modelli idonei a generare valore di business richiedono, per l’accesso e la condivisione di file, un’interfaccia dati standard, come il protocollo di networking NFS (Network File System).

David Flynn, cofondatore e amministratore delegato di Hammerspace (fonte: Hammerspace)

Dall’altro lato, nelle organizzazioni, i dati non strutturati da utilizzare per l’addestramento dei modelli di deep learning permangono ancora intrappolati in differenti piattaforme di storage proprietarie, fornite da diversi vendor, che creano silos a cui è difficile accedere e rendono complessa l’unificazione delle fonti dati. Infine, nell’ottica di raggiungere le prestazioni per mantenere le GPU operative, ovunque si trovino, le soluzioni NAS e object storage esistenti non sono progettate per supportare elevate performance di calcolo. Hyperscale NAS, secondo Hammerspace, è la soluzione che affronta questi problemi, riportando visibilità sull’infrastruttura, restituendo il controllo globale sui dati, ed elevando le performance.

“Nel settore enterprise, coloro che adottano le tradizionali architetture NAS scale-out valutano essenzialmente due cose: la sicurezza e la semplicità d’uso” chiarisce Flynn. “Ma ciò che sacrificano in nome di questi benefici è avere performance di file system come GPFS, che appartengono al mondo supercomputing. Se invece si guarda a quest’ultimo, i requisiti sono diametralmente opposti, perché chiunque fa HPC desidera velocità, anche a costo di avere un sistema instabile e complesso. Tra questi due estremi opposti si colloca Hyperscale NAS, che permette di soddisfare tutti questi requisiti con una sola soluzione” spiega il CEO. In altre parole, Hyperscale NAS punta a fornire alle aziende prestazioni di classe HPC, senza dover rinunciare alle caratteristiche RAS (Reliability, availability and serviceability) e alla facilità d’uso delle tradizionali soluzioni di storage NAS scale-out.

L’evoluzione delle architetture NAS aziendali (fonte: Hammerspace)

L’architettura Hyperscale NAS, dichiara Hammerspace, ha dimostrato di essere il file system più veloce al mondo per l’addestramento dell’intelligenza artificiale a livello aziendale e web-scale, e si trova in produzione presso una grande proprietà web (di cui non è stato reso noto il nome) con sistemi implementati su circa mille nodi storage, che alimentano fino a 30 mila GPU, con prestazioni aggregate di 80 terabit al secondo (Tb/s) su rete Ethernet e TCP/IP.

Inoltre, aggiunge Hammerspace, Hyperscale NAS è una soluzione adatta sia agli hyperscaler, sia alle imprese, perché non richiede software client proprietario, ed è in grado di espandere con efficienza la capacità per soddisfare la domanda di qualsiasi numero di GPU durante le fasi di training e inferenza, utilizzando le reti Ethernet o InfiniBand esistenti, e le infrastrutture di storage disponibili o di terze parti. Dispone anche di un completo insieme di servizi dati per rispondere ai requisiti di conformità, sicurezza e data governance.

Partnership con Nimbus Data

Tra i partner che supporteranno Hyperscale NAS anche Nimbus Data, fornitore californiano di soluzioni storage flash. La partneship tra Hammerspace e Nimbus Data punta a combinare sinergicamente le qualità degli array all-flash di quest’ultima con la soluzione di orchestazione dati e l’ambiente dati globale (GDE) di Hammerspace. Al Technology Live! Di Londra, Thomas Isakovich, fondatore e amministratore delegato di Nimbus Data, ha descritto in particolare le caratteristiche della soluzione FlashRack Turbo.

Le sfide delle infrastrutture di storage per l’elaborazione dei workload AI (fonte: Hammerspace)

Quest’ultima si caratterizza per un design modulare compatto, con solo tre unità FRU (field replaceable unit) hot-swap, utilizza array all-flash costituiti da unità di memoria a stato solido (SSD) PCIe (PCI express) NVMe (non-volatile memory express), ed ha una capacità di 4,5 petabyte (PB) grezzi (15 PB utilizzabili). L’apparato, ha spiegato Isakovich, adotta form factor e interfaccia industry-standard, per accettare SSD standard-based di terze parti, ed evitare l’uso di moduli proprietari, che creerebbero situazioni di lock-in. In termini di connettività, FlashRack Turbo supporta reti Ethernet, RoCE (RDMA over Converged Ethernet), FC (Fibre Channel), o InfiniBand fino a 400 Gb.

Articoli correlati

Articolo 1 di 4