TechTarget

Machine learning al servizio dei data center: 6 esempi virtuosi



Indirizzo copiato

Ottimizzare le operation dei data center con l’aiuto dell’intelligenza artificiale e del machine learning può aiutare a minimizzare i loro consumi energetici e a migliorarne il monitoraggio. Esistono applicazioni già disponibili per provare a sfruttare virtuosamente queste tecnologie. 

Pubblicato il 23 apr 2024



machine learning

L’apprendimento automatico e l’intelligenza artificiale rischiano di apparire come la panacea per tutti i mali, nel mondo IT. A volte ne vengono sopravvalutate le potenzialità, va ammesso, ma non è questo il caso dei data center. Utilizzarli per migliorare la loro gestione operativa può davvero mostrarsi una scelta vincente. Lo dimostrano i risultati ottenuti in alcuni casi “sperimentati” e che può essere utile conoscere. 

I software di machine learning sono in grado di prevedere attivamente le situazioni con velocità non confrontabili con quelle concesse dalla natura umana. Si tratta quindi di sistemi che permettono una reale evoluzione dell’odierno ambiente di data center ibrido e dell’infrastruttura a supporto. 

Nel 2022, secondo un’indagine dell’Uptime Institute, il 57% degli operatori di data center si affidava all’intelligenza artificiale e all’apprendimento automatico per prendere decisioni operative di routine. Ancora oggi non sono pochi coloro che lo fanno solo per l’ottimizzazione dell’alimentazione e del raffreddamento, oppure per il rilevamento delle anomalie.

Nel 2023 in un altro sondaggio dello stesso istituto è emerso come il 73% degli intervistati tema che un software AI possa ridurre i livelli di personale delle strutture. C’è poi un 25% che è convinto che tutto ciò possa avvenire nel giro di cinque anni.

Esempi di applicazioni di ML per data center

Questa ben nota tecnologia regala la possibilità di ottimizzare gran parte delle operazioni complessive, tra cui la pianificazione e la progettazione, i carichi di lavoro, i tempi di attività e la gestione dei costi.

L’apprendimento automatico è in grado di formulare reazioni immediate partendo da set di dati, senza alcun intervento umano e senza la necessità di azioni pre-programmate. In tal modo, diventa l’opportunità di agire partendo con il conoscere meglio i propri sistemi, per gestirli in modo più efficiente, senza rischiare tempi di inattività imprevisti.

Ecco alcuni esempi di ottimizzazione delle prestazioni dei data center attraverso un buon uso di AI e ML.

1. Creazione di data center più efficienti

Con l’apprendimento automatico si può gestire in modo autonomo l’ambiente fisico del proprio data center, apportando modifiche in tempo reale dal software alla struttura e all’architettura, senza attendere alert ad hoc. Google, Meta e Microsoft utilizzano AI e ML per monitorare l’energia e ottimizzare le prestazioni dei loro data center.

2. Riduzione del rischio nelle operazioni

Per le operazioni dei data center, prevedere e prevenire i tempi di inattività è fondamentale. Un software ML aiuta perché riesce a monitorare in tempo reale i dati sulle prestazioni delle apparecchiature critiche, come i sistemi di gestione dell’alimentazione e di raffreddamento, prevedendo eventuali guasti dell’hardware. Ciò consente di eseguire la manutenzione preventiva, evitando costose interruzioni.

L’analisi dei rischi basata sul machine learning migliora i tempi di attività dei data center, suggerendo le configurazioni che aumentano la resilienza, identificando le opportunità di manutenzione preventiva e individuando i potenziali rischi di cybersecurity ancor prima che si manifestino.

3. Ridurre il tasso di abbandono attraverso i dati

L’apprendimento automatico può servire per comprendere meglio gli utenti, prevedendo il loro comportamento grazie all’analisi delle enormi quantità di informazioni presenti nei data center, finora rimaste spesso inutilizzate dopo la raccolta.

Collegando software ML e CRM, un data center intelligente è in grado di cercare e recuperare i dati memorizzati in un database storico e che tradizionalmente non vengono utilizzati per il CRM. Ciò permette di ampliare la tipologia di strategie per la generazione di nuove opportunità di business.

4. Gestione dei consumi energetici e di energia

Le organizzazioni possono gestire l’energia con l’apprendimento automatico e ottenere immediatamente vantaggi significativi. Per esempio, il software di gestione dell’infrastruttura dei data center di Siemens, Datacenter Clarity LC, utilizza strumenti AI per analizzare i singoli server e rilevare anomalie e opportunità di ottimizzazione.

Gli strumenti di ML e AI scoprono e reindirizzano i carichi di lavoro da server meno efficienti a server più efficienti dal punto di vista energetico e lavorativo con tassi di utilizzo inferiori. Gli operatori ricevono quindi un avviso di sostituzione del server più vecchio che permette loro di aggiornare il server prima che diventi obsoleto.

5. Analisi di registri di sistema

La maggior parte dei sistemi di data center durante il funzionamento genera registri che, per essere utili, devono essere gestiti. Con il machine learning li si può centralizzare e analizzare per creare report e sfruttarli in modo concreto. La tecnologia open source, come Elasticsearch, e le opzioni a pagamento, come quelle di Splunk, possono poi analizzare e integrare i dati raccolti dalle routine di apprendimento automatico.

6. Analisi delle cause di errore

Quando si verifica un errore di prestazioni, serve identificare rapidamente la causa principale e risolverlo. Motori predittivi di intelligenza artificiale, come InfoSight di Hewlett Packard Enterprise, forniscono strumenti per farlo e risolvere gli errori in tempo quasi reale nei data center on-premises e nelle configurazioni cloud di un’organizzazione.

Strategie AI e ML per ottimizzare i data center

L’hardware e il software dei data center diventano sempre più complessi con l’evolversi della tecnologia, “pesando” sul personale IT e sulle operazioni in tutta l’infrastruttura IT.

AIOps e MLOps

AIOps e MLOps descrivono l’uso dell’AI e del ML nelle operazioni IT per identificare e risolvere automaticamente i problemi operativi dell’IT. Questi approcci sono piattaforme multistrato che applicano l’apprendimento automatico, l’analisi e la scienza dei dati alle operazioni IT a livello aziendale, sia in sede che in un data center.

L’AIOps abbatte i silos di dati per aggregare e analizzare quelli provenienti da strumenti e applicazioni di gestione dei servizi e delle operazioni. I modelli identificati determinano se la soluzione può essere gestita automaticamente o se è preferibile avvisare i team IT.

MLOps prevede lo sviluppo dell’apprendimento automatico e il suo utilizzo per aumentare l’automazione. Le MLOps inoltre distribuiscono, mantengono e monitorano i modelli di apprendimento automatico.

SecOps e DevOps

SecOps e DevOps sono termini correlati che si riferiscono all’AI e all’apprendimento automatico nelle attività di cybersecurity e sviluppo tecnologico. Gli strumenti di automazione precedenti non riducevano il carico di lavoro dell’analista di sicurezza, ma lo aumentavano. SecOps con AI riduce invece gli errori e rende il lavoro dell’analista più efficiente e olistico permettendogli di identificare gli errori in modo più proattivo.

In DevOps, gli strumenti di AI automatizzano e ottimizzano il processo di sviluppo e consegna del software. L’intelligenza artificiale automatizza i processi di test e distribuzione, migliora l’accuratezza e la qualità dello sviluppo del software e ottimizza l’utilizzo delle risorse e l’allocazione degli asset, come l’infrastruttura cloud. Quando il codice supera i test, si integra automaticamente nella base di codice di produzione.

L’intelligenza artificiale può anche arrivare a suggerire parti di codice agli sviluppatori, riducendo così il tempo necessario per creare nuove funzionalità o prodotti. L’AI può anche eseguire l’analisi delle cause profonde degli errori nel codice durante lo sviluppo, consentendo ai team DevOps di identificare l’errore e di intraprendere azioni correttive.

Articoli correlati

Articolo 1 di 5