Attualità

La resilienza del primary storage: un esperimento concreto di stress test su HPE Nimble

Con uno storage test disponibile in video mettiamo alla prova un primary storage simulando su Nimble HPE vari malfunzionamenti che potrebbero mettere in difficoltà la business continuity dell’azienda.

Pubblicato il 30 Gen 2021

storage test

Per garantire una business continuity elevata è fondamentale mettere al centro dell’attenzione la gestione e la protezione del dato. Infatti, proprio lo storage è uno dei principali elementi alla base del Disater Recovery plan e di conseguenza della strategia di backup. La soluzione di storage deve garantire al tempo stesso perfomance, sicurezza e stabilità, deve quindi essere anche in grado di far fronte a malfunzionamenti hardware, interruzioni di alimentazione e ogni altra problematica di natura tecnica che potrebbe essere di ostacolo all’accesso ai dati da parte dei collaboratori o dei clienti.

Gran parte delle organizzazioni prevedono una soluzione di primary storage a cui accedono i vari virtual desktop, le applicazioni e i servizi. Di fatto quindi concentrare le tecnologie di storage in un’unica risorsa è una soluzione valida perché permette di sfruttare processi di ottimizzazione e razionalizzazione altrimenti irraggiungibili. Questa razionalizzazione riguarda i processi di compressione, deduplica e backup, ma si estende anche alle situazioni di crisi in cui si deve far fronte a problemi e malfunzionamenti.

Un video per mostrare lo storage test realizzato su Nimble HPE

Quanture ha voluto creare uno stress test dedicato a questo scenario critico. Su un primary storage basato sul prodotto Nimble HPE vengono simulati vari malfunzionamenti; lo scopo del test è mostrare quali opportunità può offrire un primary storage intelligente e fino a che punto questa soluzione può considerarsi solida. Nei laboratori di Netmind è stata quindi ricostruita un’infrastruttura di test che prevede un primary storage che rende disponibile l’accesso a varie postazioni di lavoro in virtual desktop, una tipologia di infrastruttura decisamente diffusa e utilizzata.

Giovanni Golinelli, Presales Manager & Hybrid IT Architect, si è occupato in prima persona di fare lo stress test. Il primo malfunzionamento simulato prevede la rottura contemporanea di ben tre dischi del primary storage e viene mostrato come lato client (virtual desktop) non si abbia alcuna ripercussione. Ciò è possibile sfruttando la tecnologia Triple+ Parity RAID che permette la protezione e il recupero dei dati fino alla rottura di tre elementi di storage, un problema non certo comune ma comunque risolvibile.

Nello storage test è stata anche simulata un’eventuale avaria all’alimentatore al fine di valutare eventuali ricadute sull’operatività: l’alimentatore ridondante è intervenuto rimpiazzando quello in avaria, garantendo quindi la continuità di alimentazione, e anche in questo caso lato utente non c’è stata alcuna ripercussione. Il passo successivo è stato simulare il guasto di uno dei due controller interni a Nimble HPE: in questa tipologia di problema il lavoro del controller guasto è stato preso in carico dal secondo controller funzionante in modo pressoché istantaneo. Anche in questa situazione di crisi simulata nello storage test i virtual desktop hanno avuto continuità nell’accesso ai dati gestiti dal primary storage.

Snapshot gestiti direttamente dal Nimble HPE

Ma i vantaggi legati all’utilizzo di un primary storage intelligente sono apprezzabili anche in condizioni di normalità e senza necessariamente dover far fronte a situazioni critiche o malfunzionamenti. Come ci spiega Giovanni Golinelli a margine dello storage test, una soluzione Nimble HPE è in grado di gestire in modo autonomo la creazione di snapshot, dialogando con l’hypervisor VMware e sgravando quest’ultimo di un oneroso compito. Infatti, l’hypervisor delega al primary storage il compito di creare lo snapshot, liberando quindi risorse hardware che potranno essere usate per gestire altro lavoro.

La gestione degli snapshot da parte di Nimble HPE offre vantaggi anche per quanto riguarda la sicurezza e la possibilità di risolvere problemi legati al criptomalware. Sfruttando gli strumenti messi a disposizione da Nimble HPE, o attraverso Veeam, sarà possibile estrarre da uno snapshot un singolo elemento non criptato e sostituirlo nel volume compromesso. Questa opzione prevede la disponibilità di uno snapshot sufficientemente recente e relativo a una condizione in cui i dati non siano ancora stati criptati dal malware, ma merita di essere considerata come una possibile risoluzione della situazione di crisi.

Intervenire in uno scenario simile non è certo un’operazione semplice e banale, anzi sono richieste competenze di un certo livello in merito a storage e virtualizzazione. In alternativa – come ci ha descritto Marina Silvestri, responsabile marketing per Netmind –, è possibile accedere ad alcuni servizi messi a disposizione da Netmind, servizi caratterizzati da precisi livelli di SLA che garantiscono alle organizzazioni la risoluzione di problemi particolarmente complessi.

La possibilità di gestire con efficacia questo tipo di problemi è garantita anche da HPE Infosight, che mette a disposizione dei tecnici una serie di informazioni precise e aggiornate relative alla soluzione Nimble soggetta a problemi. Il tutto può avvenire da remoto e con tools ormai omogenei e utilizzati anche con le soluzioni HPE Primera: grafiche e denominazioni comuni anche su dispositivi di differente natura offrono quindi un miglior approccio.

Con HPE Infosight AI e machine learning per il primary storage

Ma un vantaggio non di poco conto che deriva dall’utilizzo di HPE Infosight è l’adozione di tecnologie di AI e machine learning, con l’applicazione di algoritmi predittivi. Di fatto l’ampio parco hardware installato permette a HPE Infosight di accedere a un gran numero di configurazioni hardware e di rilevare prestazioni o failure in particolari condizioni; questa enorme base dati, una volta processata, permette a HPE Infosight di offrire suggerimenti in termini di ottimizzazione, applicazione di patch o segnalazione di possibili problemi, il tutto basandosi su quanto rilevato in sistemi analoghi o simili a quello in esame.

Gli amministratori hanno quindi notifica di queste segnalazioni e possono procedere o meno ad applicare quanto suggerito da HPE InfoSight.

I numeri disponibili sono molto significativi: con HPE Nimble Storage, HPE InfoSight prevede e risolve automaticamente l’86% dei problemi. Questo si traduce – citando dati forniti da HPE stessa – in una riduzione del 79% delle spese operative IT, in un calo dell’85% del tempo dedicato ai problemi di storage e in una disponibilità comprovata di oltre il 99,9999% nella base installata di Nimble HPE.

L’ultimo problema ricostruito nel test condotto da Quanture è un totale blackout elettrico. Non si tratta quindi di un malfunzionamento proprio del Nimble HPE ma del data center i cui servizi ridondanti di alimentazione elettrica non sono intervenuti in modo appropriato, o hanno riscontrato problemi.

Di fronte al blackout lo storage test fallisce, ma ci salva il cloud

Di fronte a uno scenario simile il primary storage non ha potuto garantire ai virtual desktop la continuità operativa, ma comunque è disponibile una soluzione. Per uscire rapidamente da un problema simile è necessario ripristinare l’alimentazione e successivamente riavviare tutti i servizi utilizzando un backup recente – opzione perseguibile sfruttando le tecnologie di gestione degli snapshot a cui abbiamo accennato in precedenza -, oppure è necessario che i virtual desktop possano accedere ai dati resi disponibili da un servizio in cloud.

Su questo fronte si apre un nuovo scenario operativo ricco di possibilità e opzioni utili anche per gestire carichi momentanei, o situazioni prevedibili e non legate a failure così gravi come il completo blackout del primary storage. Infatti, HPE Nimble HPE con il servizio Cloud Volume offre visibilità diretta verso il cloud, in particolare con i servizi offerti da Azure, AWS o Google.

Sarà così possibile prevedere servizi in replica, la cui base dati dovrà ovviamente essere costantemente aggiornata, accessibili in cloud: in condizioni di normalità sarà il primary storage ad essere operativo, ma in casi estremi potranno essere attivati i servizi preconfigurati in cloud sui quali saranno dirottati i virtual desktop.

Scopri le soluzioni di disaster recovery per il business che non si ferma mai. Clicca qui e scarica il White paper

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati