NEWS

Telemetria e reti virtuali: nuovi strumenti, avvisi efficienti, meno lavoratori



Indirizzo copiato

Si chiama Zoonet ed è la novità annunciata da Alibaba Cloud. Una soluzione dedicata alle spesso trascurate reti virtuali che rende la telemetria più specifica per questo verticale e riduce dell’86% il numero di ingegneri che solitamente se ne occupano. 

Pubblicato il 6 mag 2024

Marta Abba'

Giornalista



telemetria

Pur essendo presenti e penetranti in molti settori, le reti virtuali spesso restano in secondo piano. Fino a quando non si verificano problemi tecnici che causano malfunzionamenti e interruzioni, e allora sì che ci si ricorda della loro esistenza e della loro importanza. Non si può permettere questa “attenzione emergenziale e spot” un player come Alibaba Cloud, però, che ne gestisce di numerose e che ne ricava enorme profitto. È proprio sui suoi ricercatori che possiamo quindi contare per qualche virtuosa innovazione in merito, con impatto non indifferente sugli utenti, anche sui più distratti.

Arriva Zoonet, se ne vanno gli ingegneri

L’ultima, la più recente, è descritta in un documento realizzato assieme ad alcuni ricercatori dell’Institute for Network Sciences and Cyberspace e del Beijing National Research Center for Information Science and Technology dell’Università Tsinghua. In questo testo si descrive nei dettagli uno strumento di telemetria sviluppato ad hoc per individuare i problemi nelle reti virtuali dei clienti. Una novità che ha permesso a Alibaba Cloud stessa di ridurre dell’86% il personale dedicato a questo task.

Battezzata con il nome di Zoonet, questa soluzione proattiva per cloud multi-tenant su larga scala invia “pacchetti di sonde” per rilevare le reti virtuali e raccogliere i dati telemetrici desiderati. Per farlo, innesca un processo distribuito insieme alle macchine virtuali di ospiti e all’hypervisor della macchina virtuale sul server.

Nello stesso documento, con uno sforzo non indifferente e non scontato di trasparenza, Alibaba Cloud illustra anche gli elementi che compongono il suo Zoonet. C’è un piano dati che utilizza host agent e arp-ping per proteggere la privacy dei tenant e definisce una generalizzazione di ping e traceroute, che può funzionare su middlebox eterogenee. C’è un piano di controllo per l’elaborazione in batch degli aggiornamenti e un probing pruning dei percorsi per ridurre l’overhead. E poi, terzo e ultimo piano, quello di analisi, mirato a ridurre il rumore e aggregare gli avvisi in base alla correlazione temporale e spaziale, conducendo a una telemetria hop-by-hop per individuare i guasti.

CPU dedicata, funzionamento segreto

Implementato per oltre due anni, in decine di regioni cloud e centinaia di migliaia di server, Zoonet ha spinto anche a una revisione della gestione dei carichi di lavoro da parte di Alibaba Cloud. L’azienda da subito gli ha dedicato uno specifico core della CPU, perché non impattasse sulle performance legate ai servizi forniti a tenant e hypervisor.

Quando Zoonet si trova a dover eseguire attività di probing intense e simultanee, sfrutta la CPU in modo significativo, infatti, e non si può correre il rischio che disturbi i processi in esecuzione o influisca sull’accuratezza della telemetria. Ecco perché i task di probing sono stati distribuiti a intervalli di tempo casuali, proprio per evitare picchi di carico della CPU.

Una scelta mirata a integrare Zoonet nella daily routine in modo più efficace possibile, per poi cantarne le lodi guardando gli avvisi basati su correlazioni temporali e spaziali che è in grado di sviluppare. Ciò significa, per chi lo deve usare, non essere sommerso da una marea di alert ma riceverne solo alcuni, rappresentativi e funzionali alla risoluzione dei problemi della rete virtuale. Questo non sembrerebbe causare problemi o rischi, anzi, a quanto riferito dall’azienda cinese, Zoonet avrebbe rivelato bug, congestioni, anomalie di routing virtuale e dell'”ultimo miglio” che avrebbero potuto passare inosservati con strumenti di telemetria creati per monitorare le reti fisiche.

Un risultato interessante, e che infatti interesserebbe tutto il mercato che gira attorno o solo sfiora le reti virtuali. Ma Alibaba Cloud sembra continuare a volerlo dominare, e non ha quindi alcuna intenzione, per ora, di condividere ulteriori dettagli con i competitor. Per ora.

Articoli correlati

Articolo 1 di 4