Studio AI Stanford University: l'importanza di dati certi e analisi credibili | ZeroUno

Studio AI Stanford University: l’importanza di dati certi e analisi credibili

pittogramma Zerouno

Prospettive

Studio AI Stanford University: l’importanza di dati certi e analisi credibili

Un’approfondita ricerca della prestigiosa università americana, fissa il punto su una serie di aspetti nei quali il fenomeno dell’Intelligenza Artificiale si sta articolando nella nostra società. In questa prima puntata parliamo di Ricerca & Sviluppo, con un particolare focus sulla diffusione culturale del fenomeno. Tenendo presente che il Covid-19 ha accelerato ed aumentato gli investimenti, le tecnologie diventano sempre più raffinate mentre le regole sul piano etico in rapporto ad una società sempre più pervasa da queste tecnologie resta ancora a un livello più teorico che pratico. Emerge l’importanza di dati e indicazioni validate dal confronto tra esperti prima di essere sottoposti all’azione politica e legislativa

23 Giu 2021

di Stefano Uberti Foppa

Ideato con l’ambizioso obiettivo di rappresentare la fonte mondiale più autorevole e qualificata di dati e analisi sul tema dell’intelligenza artificiale, l’Artificial Index Report 2021 della Stanford University – in collaborazione con HAI/Human Centered Artificial dello Stanford Institute, è giunto alla sua quarta edizione. Vede un ampliamento dei dati disponibili, un maggior numero di istituzioni esterne coinvolte con le quali calibrare meglio i numeri e le interpretazioni, approfondendo potenziali aspetti di studio e miglioramento, realizzati nel corso del 2020, con oltre 140 fruitori qualificati all’uso di questo tipo di informazioni: esponenti di strutture governative e della pubblica amministrazione, industria ed enti accademici.

Lo studio si articola inoltre in una serie di supplementi e propone tools di approfondimento su dati grezzi per effettuare comparazioni tra nazioni, fino a 26 paesi, basandosi su 22 parametri, consentendo quindi un’analisi approfondita degli indicatori nazionali in confronto a quanto realizzato da altri paesi, sia appartenenti ad economie avanzate sia a paesi emergenti.

Naturalmente questa edizione ha una forte correlazione con quanto la pandemia di Covid-19 ha determinato sullo sviluppo delle tecnologie di AI da numerose prospettive: tecnologiche, economiche, sociali, etiche, ecc.

Di questo grande lavoro (uno studio di oltre 220 pagine ricche di approfondimenti, grafici, specifiche focalizzazioni ecc), ZeroUno ha deciso di darne una pubblicazione di sintesi ragionata per sette differenti capitoli rispondenti ad altrettanti focus:

  • Research and development (quella che segue);
  • Technical performance;
  • The economy; AI Education;
  • Ethical Challanges of AI Applications;
  • Diversity in AI; AI policy and national strategies.

Un percorso che vi accompagnerà da giugno fino ad ottobre su questo tema che in modo tanto pervasivo sta entrando nella struttura economica, culturale e tecnologica della nostra società.

Alcuni milestone…”da portarsi a casa”

A massima sintesi del Report e prima di affrontare la focalizzazione su “Ricerca & Sviluppo”, diamo un breve elenco di alcuni milestone che emergono con chiarezza dal lavoro nel suo complesso:

  1. gli investimenti nel disegno e nella scoperta di nuovi farmaci sono aumentati in modo significativo, ricevendo nel 2020 il più grande investimento privato in Intelligenza Artificiale fin qui raggiunto, 13,8 miliardi di dollari, quattro volte e mezzo più alto del 2019.
  2. L’industria gioca un ruolo sempre maggiore nello sviluppo dell’AI attraendo talenti: nel 2019 circa il 65% dei laureati con dottorato in AI sono stati assorbiti dal comparto industria.
  3. Il livello di raffinatezza sta aumentando: i sistemi di AI, soprattutto in alcune specifiche applicazioni, riescono ormai a comporre testi, audio e video a un livello talmente alto da essere difficilmente riconoscibili come lavori non umani.
  4. Lo studio rileva un tema di diversity da tenere sotto controllo: nel 2019 il 45% dei nuovi cittadini americani laureati con dottorato in AI erano bianchi, contro il 2,4% di afro-americani e il 3,2% di ispanici.
  5. Divulgazione: la battaglia con la Cina continua. Dopo aver superato gli Stati Uniti per numero di pubblicazioni AI ormai parecchi anni fa, ora la Cina supera gli Usa anche in termini di citazioni e riferimenti sulle diverse pubblicazioni (studi e giornali). Tuttavia gli Usa continuano ad avere una supremazia nei conference papers (atti di congressi e conferenze), a significare anche una maggiore capacità di organizzazione di incontri, confronti e dibattiti su questo tema.
  6. La maggior parte dei laureati con dottorato in AI proviene dall’estero (64,3%) ma risiede negli Usa (81,8%). Solo l’8,6% ha deciso di lavorare al di fuori dagli Stati Uniti.
  7. Le tecnologie di controllo a base AI, applicate al monitoraggio di massa per la classificazione delle immagini, riconoscimento facciale, videoanalisi e identificazione vocale, hanno registrato significativi progressi nel 2020, con caratteristiche di facilità d’uso e pervasività.
  8. Sebbene ci sia una gran produzione di indicazioni e normative sul piano etico dell’AI, mancano ancora punti di riferimento e veri e propri benchmark per concretizzare in azioni pratiche il dibattito sullo sviluppo sostenibile ed etico di una società sempre più pervasa dalle tecnologie di AI. In ogni caso, ad oggi la società civile e il mondo della ricerca considera l’elemento etico più importante che non quanto avvenga da parte delle imprese.
  9. Il 116mo Congresso degli Stati Uniti, e quindi il mondo politico americano, è il più focalizzato sull’AI nella storia (almeno degli ultimi anni) di questa istituzione, con menzioni e riferimenti all’AI triplicate rispetto al Congresso precedente.
Fig.1

R&D: cresce la cultura sull’AI, ma servono informazioni validate e di qualità

Questa sezione dello studio si sofferma soprattutto sulla “dissemination” del tema AI, con particolare riferimento alla diffusione delle pubblicazioni scientifiche all’interno del circuito della Ricerca & Sviluppo interaziendale e tra soggetti accademici, indicando anche il livello di revisioni di documenti e lavori da parte di enti peer (soggetti pari dedicati alla verifica e validazione dei lavori prima della pubblicazione ufficiale) per analizzare l’attendibilità e l’effettiva realizzabilità di tesi e ipotesi. Una fase che in tema di AI è fondamentale prima di definire orientamenti e direttrici di sviluppo e investimento da proporre al mercato e alla sfera legislativa.

Fig.2

Ad esempio, lo studio certifica un dato importante: cioè che la maggior parte di lavori sull’Intelligenza artificiale validati da soggetti peer (numero in costante crescita dal 2000 –figura 1) proviene da istituzioni accademiche, a garanzia quindi, almeno in teoria, di lavori meno soggetti a condizionamenti dell’industria. Anche il numero delle pubblicazioni scientifiche sul tema dell’Intelligenza Artificiale (figura 2) è cresciuto del 34,5% nel 2020 (contro il 19,6% dell’anno prima) e già nel 2019 (ultimo dato disponibile) rappresentava il 3,8% di tutte le revisioni scientifiche peer a livello worldwide rispetto all’1,3% del 2011.

Fig. 3
Fig. 4

Interessante notare nella comparazione tra le successive tre figure (figure 3 e 4) la differenza di approccio nella validazione peer di studi sull’AI da parte di Cina, Unione Europea e Stati Uniti. Se le prime due vedono la predominanza di validazione di lavori con istituzioni affiliate all’interno di enti accademici e governativi, lasciando al secondo posto la voce “corporate”, negli Usa le istituzioni affiliate dedicate alla verifica dei lavori sull’AI sono primariamente nel mondo delle aziende. Ciò non significa necessariamente un elemento di criticità: nella relazione con le aziende, gli Stati Uniti possono infatti vantare un modello ibrido industria-mondo accademico, che rappresenta, da moltissimi anni, l’elemento di spinta e di crescita in ogni ambito della ricerca, non solo in quello dell’AI. Infatti, dal 1980 il modello collaborativo università-impresa americano, con primari centri di ricerca ad investimento misto, ha rappresentato un elemento di forte crescita nella creazione di brevetti e soprattutto nell’applicabilità industriale della ricerca. E anche nell’ambito delle pubblicazioni peer-reviewed co-prodotte da questi soggetti misti università-impresa in tema di AI si rileva un valore più che doppio rispetto all’Unione Europea che è a sua volta seguita dalla Cina (figura 5).

Fig. 5

Il totale dei brevetti AI pubblicati nel mondo è marcatamente aumentato nelle ultime due decadi (con un rallentamento nel 2020 dovuto sia a dati incompleti del report sia in relazione allo scoppio del fenomeno pandemico), dai 21.806 dell’anno 2000 a 101.876 del 2019, ben oltre 4,5 volte in più (figura 6).

Fig. 6

La comunità tecnico-scientifica, inoltre, ha in uso pubblicare preliminarmente i propri lavori su arXiv.org, un archivio, sviluppato nel 1991 da Paul Ginsparg (premiato con il prestigioso MacArthur fellowship nel 2002 proprio per aver creato arXiv) prima del rilascio ufficiale su riviste scientifiche o divulgazione tramite convegni specialistici. Vi si trovano bozze di lavori sottoposte alla peer evaluation, al confronto e all’approfondimento in ambiti che riguardano matematica, fisica, statistica, informatica, machine learning, robotica, computer quantistici e neurali, biologia, ecc. E’ un passaggio importante nell’accelerazione per la validazione e diffusione di cultura scientifica, in questo caso in ambito AI. In sei anni, il numero delle pubblicazioni di AI su arXiv è cresciuto di oltre 6 volte, dalle 5.478 del 2015 alle 34.736 del 2020 (figura 7).

Fig.7

Le software libraries AI open source

GitHub è una piattaforma utilizzata di frequente da ricercatori e sviluppatori in ambito AI per up e download software e funzioni varie. Gli utenti di GitHub possono assegnare la denominazione “star” a un progetto per salvarlo nella propria lista, e così facendo, allo stesso modo dei “like” di Twitter e di altri social, esprimono il loro apprezzamento e interesse per quel progetto. In breve, la funzione “Star” su GitHub misura la popolarità e il gradimento a librerie di programmazione AI open source. TensorFlow (sviluppata da Google e rilasciata nel 2017) è risultata essere la più popolare AI software library, seguita da Keras (sempre sviluppata da Google su TensorFlow 2.0) e da PyTorch di Facebook, che sta aumentando la propria diffusione e consenso nella comunità scientifica internazionale (figura 8).

Fig.8

Stefano Uberti Foppa

Digital innovation influencer

Giornalista professionista dal 1989, inizia ad occuparsi di giornalismo nel settore informatico nel 1981, partecipando all'avvio della sede italiana del settimanale Computerworld. Nel 1987 passa al mensile ZeroUno di cui nel 1997 assume la direzione insieme a quella del settimanale PcWeek Italia. Opinion leader riconosciuto nel settore Ict in Italia, è stato direttore responsabile di ZeroUno edito da Ict&Strategy, società del Gruppo Digital360, fino al febbraio 2019. Oggi è una delle principali firme del magazine.

Argomenti trattati

Approfondimenti

I
Intelligenza Artificiale

Articolo 1 di 5