Analisi

“Quattro nove” posson bastare?

Per settori quali le vendite online o i trasporti pubblici sicuramente sì. Ma per molti altri settori, i “quattro nove” possono bastare

Pubblicato il 27 Set 2012

information-security-150309094833

L‘alta disponibilità è un fatto della vita IT di molte aziende, ma per molte organizzazioni il 99.999% di uptime, spesso, non è necessario.

Il fatto che un’organizzazione abbia bisogno o meno di un uptime del 99.999% dipende da una serie di fattori, che vanno dalle restrizioni a livello di software al costo, finanziario o di altro tipo, del downtime.

“I cinque nove sono quello che serve a un’organizzazione che opera con migliaia di vite umane o se il downtime costa milioni di euro al minuto”, esordisce Alan Robertson, sviluppatore Linux e fondatore del progetto High-Availability Linux.

Soppesare i costi dell’alta disponibilità

I costi per ottenere l’alta disponibilità, che si tratti di quattro nove di uptime o cinque, includono software, hardware, personale e training. Le organizzazioni hanno bisogno di pesare attentamente i costi relativi e di confrontarli con le perdite subite dai tempi di inattività non pianificati, oltre che con la possibilità concreta di pianificare i tempi di inattività. Anche le aziende di alcuni specifici settori in cui sono in gioco milioni di euro, come ad esempio il mercato azionario, possono facilmente pianificare i tempi di inattività, “ovviamente al di fuori delle ore di negoziazione”, sostiene Robertson.

Le maggiori perdite legate ai tempi di inattività non pianificati derivano da interruzioni del business e perdita di fatturato, sostiene un recente sondaggio condotto sui responsabili di 41 data center da Emerson Network Power. Anche la risposta di un’organizzazione a un fermo macchine non pianificato (che comprende diverse fasi, tra cui rilevare il problema, risolverlo e riavere i sistemi di nuovo in funzione), costa soldi.

In un ufficio IT che lavora per ottenere il 99,99% di uptime, una società potrà arrivare a sperimentare fino a 8,76 ore di inattività all’anno. Se ogni ora di inattività costa un milione di euro, la perdita totale è di 8,76 milioni. Ma se quello stesso ufficio assicura il 99,999% di uptime, questo si traduce in meno di un’ora di inattività all’anno, con una perdita totale di meno di un milione di euro. In questo caso, il prezzo di tutte le attività e tecnologie necessarie per aumentare l’uptime può rivelarsi effettivamente conveniente, concordano gli esperti.

“Per ogni prodotto c’è un costo/valore di tradeoff”, puntualizza Wayne Gateman, esperto di virtualizzazione per una grossa società che opera nel campo delle apparecchiature mediche. “Quale sarà il tempo di inattività giusto per la vostra organizzazione? Quanto si può perdere, in termini di lavoro e denaro, per l’inattività? Quali sono i rischi di una revisione al ribasso delle pretese relative al downtime?”

I “quattro nove” dovrebbero funzionare per la maggior parte dei grandi retailer, come i rivenditori online o gli host Web, e per le altre organizzazioni, le imprese con business “offline”, anche i “tre nove” potrebbero andare bene.

Avere il 99,999% di uptime

In alcuni settori, come i trasporti, l’alta disponibilità è fondamentale, non importa a quale costo. Nei Paesi Bassi, ad esempio, alcuni anni fa tutti i treni si fermarono a causa del guasto al computer di un hub e centinaia di migliaia di persone rimasero bloccate. “Il 99,999% è per questi settori”, chiarisce Gateman. In questi casi, le organizzazioni possono rivolgersi a tecnologie quali i server fault-tolerant. “La ridondanza su più fronti, ovvero del server stesso, del software di failover e del software che divide i box fisici in modo da forzare il failover per gli aggiornamenti, utile per riuscire a rendere i server realmente fault-tolerant vale tutto il suo costo”, sostiene Gateman.

Prima del passaggio a server fault-tolerant, la società di Gateman aveva implementato i software di failover per mantenere l’ambiente di produzione sempre in esecuzione, “ma non sempre il sistema funzionava come previsto – ammette -. Il software è software e non sempre risponde a dovere a un guasto, mentre l’hardware è in grado, per certo, di segnalare una failure. E avendo implementato la ridondanza integrata, questi guasti in genere non sono in grado di spegnere il CED”.

Giusto per essere più sicuro, Gateman ha aggiunto un secondo server al suo macro ambiente di calcolo…

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati

Articolo 1 di 2