Intelligenza artificiale: Amazon Web Services accelera la corsa e rilascia servizi via cloud

Riconoscimento vocale, visivo e capacità di conversione di testi in audio. Ecco le tre aree di focalizzazione di Aws che rende disponibili agli sviluppatori nuovi tool sotto forma di servizi di public cloud per accelerare il rilascio di applicazioni sempre più ‘smart’ ed efficaci nella relazione uomo-macchina. E la battaglia tra vendor It tradizionali e ‘nuovi attori’ come Amazon, Google o Facebook si inasprisce

La notizia arriva dal palco di Las Vegas dove è in corso ‘Aws re:Invent’ , l’evento mondiale di Amazon Web Services (Aws) dedicato agli sviluppatori attraverso il quale, immancabilmente, l’azienda lancia sul mercato nuove soluzioni che spesso fanno tremare i grandi big player dell’It. E anche quest’anno le attese non hanno deluso i follower: Aws ha annunciato il rilascio di una nuova piattaforma di intelligenza artificiale (Amazon AI platform) messa a disposizione degli sviluppatori e delle aziende sotto forma di servizio di public cloud.

Tre le funzionalità chiave della piattaforma messe a disposizione degli sviluppatori (con il chiaro obiettivo che questi possano usare tali servizi per creare nuove applicazioni ‘intelligenti’, come per esempio avanzati sistemi di ChatBot, programmi che simulano una conversazione tra robot ed essere umano) e già ‘testate’ da aziende del calibro di Netflix, Airbnb e Pinterest:

Lex: è il motore di riconoscimento vocale che in molti conosceranno perché parte tecnologica pulsante del tool di assistenza vocale targato Amazon, noto con il nome di Alexa; Lex viene messo a disposizione come sistema per lo sviluppo di interfacce uomo-macchina specifiche per le conversazioni audio e testo. Le basi tecnologiche del sistema sono quelle ‘tipiche’ del deep learning: Natural Language Understanding (Nlu) e Automatic Speech Recognition (Asr). “Lex permette lo sviluppo di ‘conversational application’ che potranno abilitare dialoghi multi-step tra macchine ed esseri umani esattamente come avviene in modo naturale tra gli uomini”, si è spinto a dire il Ceo di Aws, Andy Jassy, dal palco di Las Vegas.

Modello per l'utilizzo di Amazon Lex in Sanità, per gestire gli appuntamenti dei pazienti – Fonte: AWS

Polly: 47 voci che parlano in 24 differenti lingue, questi i numeri che caratterizzano Polly, un servizio di text-to-speech che converte il testo in formato vocale. Per gli sviluppatori diventa un’opportunità interessante per migliorare applicazioni esistenti (si pensi per esempio alle piattaforme di ‘newsreader’ o di e-learning) o creare nuove categorie di prodotti abilitati o comandati dalla voce via mobile app. Il servizio risulta molto semplice da utilizzare: basta inviare a Polly un testo (mediante Sdk – software development kit – o la console di gestione Aws) e la piattaforma restituisce immediatamente una ‘stringa’ audio che può essere usata come file audio standard ed integrata quindi in qualsiasi tipo di applicazione. “La semplicità di utilizzo maschera in realtà una sofisticatezza tecnologica senza eguali – commenta il Ceo -; la comprensione del contesto è uno degli aspetti più complessi da trattare, il sistema non deve cadere nell’errore di confondere una parola con un’altra portando a fraintendimenti (si pensi per esempio alla parola ‘read’ che ha una pronuncia diversa a seconda che si tratti del verbo o della sua coniugazione al passato o al participio passato nonostante si scriva sempre allo stesso modo);

Rekognition: non poteva mancare all’elenco il riconoscimento visivo; in questo caso si tratta di un motore di identificazione di scene ed oggetti già maturato nelle ‘stanze di Amazon’ (Amazon Prime Foto nato come spazio di archiviazione di immagini in cloud analizza ogni giorno miliardi di immagini per la loro ‘catalogazione’) ma che ora viene messo a disposizione degli sviluppatori come motore (alla cui base c’è sempre la tecnologia di deep learning) per il riconoscimento automatico dei volti delle persone (per esempio per capire se stanno sorridendo o piangendo), degli animali, degli oggetti, delle scene e degli spazi all’aperto, ecc.

Indice degli argomenti

Il modello vincente dell’accoppiata Aws – Amazon

Nulla di nuovo invece nella modalità di rilascio delle proprie soluzioni, Aws è di fatto il canale attraverso il quale la multinazionale eroga servizi It ‘monetizzando’ l’esperienza fatta in-house a supporto della crescita e dello sviluppo del core business di Amazon (cioè l’e-commerce). Il Ceo di Aws, Andy Jassy, conferma ‘tra le righe’ l’approccio ormai consolidato del gruppo: “Amazon ha un background enorme sul piano del machine learning, anche se non se ne è mai parlato, e in Aws abbiamo migliaia di persone che si occupano di intelligenza artificiale”. In altre parole, significa che, come di consueto ormai, Aws porta sul mercato soluzioni mature già ampiamente utilizzate e testate al proprio interno ed erogate ad Amazon per migliorare i servizi di commercio elettronico [e a giudicare dai numeri i risultati si vedono chiaramente: le azioni di Amazon sono quadruplicate dall’inizio del 2012 e la sua capitalizzazione di mercato di circa 375 miliardi di dollari la rende una delle cinque società più di valore al mondo, riportano gli analisti di InsiderPro – ndr].

Una battaglia che si stanno giocando Aws, Google, Ibm e Microsoft

Che la battaglia nel mercato dell’intelligenza artificiale si sarebbe inasprita, portando all’interno dei giochi competitivi anche aziende ‘nuove’ che da qualche anno ormai fanno ‘tremare’ i grandi big dell’It, era evidente. Google si è fatta pioniera tecnologica del deep learning lanciando il guanto di sfida ad Ibm; Microsoft – sotto la guida di Satya Nadella – ha dedicato risorse per la ricerca accelerato la sua corsa… ma adesso arriva Aws che mette nelle mani degli sviluppatori tool di intelligenza artificiale disponibili via cloud (come per altro già aveva anticipato Ibm con Watson). Anche Facebook entra in campo, per altro annunciando che i propri motori di intelligenza artificiale potrebbero persino eliminare le ‘notizie false’ dalla piattaforma (questione ancora calda e di ampio dibattito dopo le polemiche sulle elezioni Usa). Quel che appare già evidente è il futuro delle comunicazioni (dove l’intelligenza artificiale sta già esprimendo il suo potenziale): video e audio saranno media sempre più utilizzati e non certo per l’intrattenimento personale (basti pensare alla realtà virtuale e aumentata e alle sue possibili implicazioni di business di cui già oggi possiamo vedere i risultati).