La lettera “o” in GPT-4o, il modello di intelligenza artificiale annunciato da OpenAI lo scorso maggio, significa “omni”, e indica un nuovo, sostanziale progresso tecnologico verso la AI generativa multimodale. Rispetto alle precedenti versioni di GPT, numerosi video esemplificativi sulla pagina web dedicata mostrano l’abilità impressionante di GPT-4o nel conversare vocalmente con le persone: il modello risponde in tempo reale, e con estrema naturalezza, a input vocali e visivi. Percepisce il tono di voce degli interlocutori, interpreta gesti ed espressioni facciali, e, a seconda di ciò che sente e vede, è in grado di esprimere emozioni, cantare, generare frasi scherzose o risate.
Attualità
AI generativa multimodale: l’evoluzione continua (e prepara la strada alla AGI)
A meno di due anni dall’introduzione sul mercato del chatbot ChatGPT, l’intelligenza artificiale sta rapidamente evolvendosi, e sviluppando capacità multisensoriali. La AI e la GenAI multimodali promettono di migliorare la versatilità di utilizzo di queste tecnologie in molti campi applicativi.
Giornalista

Continua a leggere questo articolo
Argomenti
Canali
Con o Senza – Galaxy AI per il business

VITA DA CIO
-

In A2A, IT e business si muovono a ritmo di jazz
12 Feb 2026 -

Cosa hanno raccontato i CIO nel 2025
26 Dic 2025 -

«Rimettere la “T” al centro dell’IT»: la visione di Enrico Andrini, CIO di Bonfiglioli
16 Dic 2025 -

Dal supercalcolo al pensiero critico: la figura del CIO secondo Dario Pagani (Eni)
27 Nov 2025 -

Modernità e rapidità d’esecuzione: l’IT di Hyundai come ponte tra culture e innovazione
06 Nov 2025

















