infrastrutture

IBM z17, il mainframe pensato per l’intelligenza artificiale enterprise

Una nuova architettura per elaborare fino a 450 miliardi di operazioni di inferenza AI al giorno con un tempo di risposta di un millisecondo

Pubblicato il 13 apr 2025

Redazione

IBM ha annunciato il lancio di IBM z17, la nuova generazione di mainframe pensata per integrare nativamente l’intelligenza artificiale nell’hardware, nel software e nel sistema operativo. Si tratta del primo mainframe progettato fin dall’inizio per supportare carichi di lavoro AI su larga scala, ampliando le funzionalità già presenti nella generazione z16 e introducendo nuove capacità per l’inferenza AI, la sicurezza e l’automazione delle operazioni IT.

Il cuore tecnologico di IBM z17 è il processore Telum II, dotato di un acceleratore AI on-chip di seconda generazione. Questa nuova architettura, grazie a una maggiore frequenza, capacità di elaborazione e un incremento del 40% della cache, permette di elaborare fino a 450 miliardi di operazioni di inferenza AI al giorno con un tempo di risposta di un millisecondo, offrendo un incremento del 50% rispetto alla generazione precedente.

Secondo quanto comunicato, la piattaforma è progettata per gestire oltre 250 casi d’uso in ambiti critici come la mitigazione del rischio finanziario, i chatbot, l’analisi di immagini mediche e la prevenzione della microcriminalità. Le funzionalità AI possono essere sfruttate in modo nativo senza dover spostare i dati fuori dal sistema, consentendo valutazioni in tempo reale del 100% delle transazioni.

Indice degli argomenti

Verso un’infrastruttura AI-integrated

Con z17, IBM propone un’integrazione più stretta tra sistemi AI e dati aziendali, eliminando la necessità di spostare i dati al di fuori del mainframe. La scheda IBM Spyre Accelerator, disponibile dal quarto trimestre 2025 tramite PCIe, è progettata per portare funzionalità di AI generativa al mainframe, inclusa l’esecuzione di assistenti AI che utilizzano i dati aziendali contenuti nel sistema.

L’infrastruttura introduce anche nuove funzionalità per le operazioni IT, come IBM watsonx Code Assistant for Z e watsonx Assistant for Z. Quest’ultimo, per la prima volta, sarà integrato con Z Operations Unite per fornire rilevamento e risoluzione degli incidenti basati su chat AI, sfruttando dati di sistema in tempo reale. Inoltre, IBM Z Operations Unite consente di unificare i dati operativi provenienti da più fonti in formato OpenTelemetry, accelerando il rilevamento delle anomalie e migliorando i tempi di risposta agli incidenti.

z/OS 3.2, un sistema operativo per l’intelligenza artificiale

IBM ha introdotto anche in anteprima z/OS 3.2, il nuovo sistema operativo per IBM Z, pensato per valorizzare le capacità AI del mainframe. La nuova versione, la cui disponibilità è prevista per il terzo trimestre del 2025, è progettata per integrare insight operativi basati su AI e per gestire in modo nativo carichi di lavoro moderni. Le funzionalità includono supporto esteso per database NoSQL.

z/OS 3.2 è pensato per trarre vantaggio dall’accelerazione AI hardware del sistema, offrendo strumenti nativamente predisposti per il machine learning e l’analisi predittiva.

A completare l’ecosistema, IBM Storage DS8000 giunge alla sua decima generazione come componente strategico per garantire accesso continuo ai dati critici, prestazioni costanti e una base modulare per la modernizzazione dell’infrastruttura dati.

IBM z17 sarà disponibile a partire dal 18 giugno 2025.

Cosa significa elaborare operazioni di inferenza AI in tempo reale?

L’inferenza è il processo con cui un modello già addestrato elabora nuovi dati per generare previsioni o decisioni. Quando si parla di operazioni di inferenza AI in un sistema come IBM z17, si fa riferimento alla capacità del mainframe di applicare modelli AI direttamente ai dati transazionali al momento stesso in cui vengono generati, senza latenza significativa.

Il tempo di risposta di un millisecondo indicato da IBM consente, ad esempio, di rilevare frodi su carte di credito o fornire risposte via chatbot durante una transazione in corso. Questa velocità è fondamentale in contesti ad alto volume, dove anche pochi millisecondi possono determinare la riuscita di un’operazione o la prevenzione di un rischio

@RIPRODUZIONE RISERVATA

Redazione

Nel corso degli anni ZeroUno ha esteso la sua originaria focalizzazione editoriale, sviluppata attraverso la rivista storica, in un più ampio sistema di comunicazione oggi strutturato in un portale, www.zerounoweb.it, una linea di incontri con gli utenti e numerose altre iniziative orientate a creare un proficuo matching tra domanda e offerta.