È una consulenza tecnologica reciproca, quella che da oltre una decina di anni lega il CERN con Western Digital. Il primo condiziona la roadmap della seconda, che a sua volta propone soluzioni “creative” per risolvere problemi complessi, non sprecando risorse. Nell’istituto di ricerca di Ginevra “esiste un vero e proprio team di esperti che cerca sul mercato soluzioni per salvare dati spendendo di meno. Ormai è diventato un fondamentale riferimento per altre realtà in simili condizioni che possono usufruire di ciò già viene sviluppato lì per implementarlo nella propria realtà” spiega infatti Davide Villa, Director Business Development EMEAI di Western Digital. È già accaduto con il Composable disaggregated infrastructure, un trend e una strategia preziosa per chi deve centellinare le risorse senza rinunciare ad alte ambizioni scientifiche.
Temperature e vibrazioni, le due sfide IT del nuovo Lch del CERN
Con la creazione di Lhc Run 3 il CERN, grazie al contributo di Western Digital, è di nuovo riuscito a trovare una soluzione inedita ed economicamente accessibile che molti in futuro sfrutteranno. Nel 2020, pianificando l’infrastruttura IT adeguata al nuovo acceleratore previsto pronto nell’aprile 2022, il CERN si è trovato a dover fare i conti con una “nuova” e grande quantità di dati al secondo. “Si parla di 1 petabyte al secondo che, grazie a una computer farm che filtra dati e output, si riduce a una velocità di 12,5 gigabyte al secondo. Una sfida che richiederebbe gli SDD, tecnologia dai costi inarrivabili per il CERN, che si è quindi rivolto a noi per poter continuare a usare i dischi, ma in modo affidabile” spiega Villa.
Passando dalle jbod da 24 dischi a quelle di 60 (o addirittura 102) necessarie per il nuovo Lhc Run 3, questa tipologia di storage può infatti creare dei problemi non trascurabili, come racconta Villa. “Troppi dischi vicini tendono a scaldarsi, e l’affidabilità cala in modo significativo superati i 50 gradi. La criticità maggiore riguarda però l’intensità delle vibrazioni: se elevata, scatta il sistema automatico che solleva le testine e il dato rischia di essere corrotto. Ne consegue una riduzione della velocità”.
Tecnologie ad hoc per andare oltre il Modello Standard dell’universo
Da produttore di hard disk e SDD, Western Digital ha scelto di gestire anche questo genere di criticità annesse a beneficio di tutti coloro che, come il CERN, devono trovare un compromesso economicamente sostenibile. Ne sono nate due tecnologie brevettate e inserite nel Lhc Run 3 pronto al varo: ArticFlow e IsoVibe.
La prima permette di gestire la temperatura assicurando un gap tra i dischi di massimo 5 gradi. Grazie a dei canali che lasciano penetrare aria fresca a metà della jbod, e non solo davanti, i dischi posti in fondo vengono ben raffreddati e non impattano sulle performance dello storage. Con IsoVibe, invece, si introducono dei tagli che semi-isolano ogni segmento della motherboard su cui sono montati i singoli dischi. In questo modo ciascuno inevitabilmente vibra, ma non crea vibrazioni indotte.
Grazie a queste due tecnologie, il CERN giunge al lancio del Lhc Run 3 perfettamente in grado di gestire velocità pari e superiori ai 12,5 giga al secondo, in modo costante, senza mai cali di performance con 60 ma anche con 102 dischi. “Le soluzioni di Western Digital hanno soddisfatto i nostri requisiti in termini di prestazioni, capacità, affidabilità e consumo energetico, mantenendo una distribuzione e un funzionamento efficienti” conferma anche Eric Bonfillou Server Hardware Specialist nel Dipartimento IT del CERN.
ArticFlow e IsoVibe non hanno inoltre alcun impatto sul resto delle infrastrutture IT, le nuove jbod più dense del Lhc Run 3 invece sì. L’attuale data center non è infatti abbastanza spazioso per ospitarle e ne è stato messo in produzione uno nuovo. Nulla di sorprendente, però: non potendo mai cancellare dati per questo ente, sa che ciclicamente deve adeguarsi alla crescita del loro volume con nuove strutture e tecnologie.
“Per limitare lo spazio usano anche dischi più grandi, passando da 14 TB a 18 TB, mentre noi stiamo già preparando quelli da oltre 20 TB” precisa Villa. Il mondo della tecnologia sa che è necessario giocare d’anticipo per soddisfare i futuri bisogni della roadmap per la ricerca delle origini dell’universo per offrire puntualmente le infrastrutture adeguate. “La parte IT non è ufficialmente una priorità di realtà come il CERN, che sanno però molto bene come sia essenziale organizzarsi per poter salvare e conservare i dati. Senza un supporto storage adeguato, gli esperimenti sarebbero inutili”.
Non pago delle oltre 60 particelle scoperte, ora Lch nella sua nuova versione “potenziata”, sarà in grado di spiegare i fenomeni avvenuti nei primi momenti di vita dell’Universo e quelli non completamente descritti dal Modello Standard. Questo grazie alle energie altissime raggiunte che fanno aumentare l’”ingrandimento” a chi si osserva il mondo in scala microscopica. Nel 2024 è però previsto un nuovo step che renderà i fasci di particelle ancora più stretti e precisi, aumentando così il numero di collisioni e i dati messi a disposizione della ricerca, superando la soglia delle 40 collisioni ad ogni “scontro” di protoni.
Figura 1: L’interno dell’acceleratore LCH del CERN
Salvare più dati riducendo i costi: il CERN come modello per PA e ricerca
Limitare le spese nel salvare un illimitato numero di dati è una mission che accomuna quasi tutte le realtà del mondo della ricerca. L’INGV (Istituto Nazionale di Geofisica e Vulcanologia) ha infatti adottato una soluzione simile a quella del CERN, sempre attraverso Western Digital. Gran parte del mondo della ricerca, col ritmo di raccolta dati oggi raggiunto, potrebbe fare a breve dover fare lo stesso.
Anche la PA, alle prese con le sfide del PNRR, può attingere a queste tecnologie. Più che “può”, deve. Secondo Villa, infatti, “di fronte a una mole di centinaia di petabyte di dati da conservare, la PA se vuole consolidarli in un solo data center avrà bisogno di ArticFlow e IsoVibe per poter riempire gli armadi di tante jbod dense. Queste tecnologie sono fondamentali per la realizzazione del cloud sovrano “.
La PA italiana dovrebbe copiare il CERN anche nella Composable disaggregated infrastructure: “solo con una separazione tra computing e storage potrà ottimizzare gli investimenti facendo scalare solo ciò che è necessario di volta in volta. È l’unica strada per conservare adeguatamente i dati dei cittadini abilitando l’innovazione ma senza sprecare risorse”.