Data visualization: cos’è e perché è importante | ZeroUno

Data visualization: cos’è e perché è importante

pittogramma Zerouno

Guida

Data visualization: cos’è e perché è importante

La data visualization è la pratica di tradurre le informazioni in un contesto visivo, come una mappa o un grafico, per rendere i dati più facili da comprendere per il cervello umano

13 Nov 2020

di Redazione

La data visualization è la pratica di tradurre le informazioni in un contesto visivo, come una mappa o un grafico, per rendere i dati più facili da comprendere per il cervello umano e da cui trarre intuizioni. L’obiettivo principale della data visualization è semplificare l’identificazione di modelli, tendenze e valori anomali in set di dati di grandi dimensioni. Il termine è spesso usato in modo intercambiabile con altri, inclusi grafici di informazioni, visualizzazione di informazioni e grafici statistici.

La data visualization è una delle fasi del processo di data science, che afferma che dopo che i dati sono stati raccolti, elaborati e modellati, devono essere visualizzati per poter trarre conclusioni. La data visualization è anche un elemento della più ampia disciplina dell’architettura di presentazione dei dati (DPA), che mira a identificare, individuare, manipolare, formattare e fornire i dati nel modo più efficiente possibile.

La data visualization è importante per quasi ogni contesto. Può essere utilizzata dagli insegnanti per visualizzare i risultati dei test degli studenti, da scienziati informatici che esplorano i progressi nell’intelligenza artificiale (AI) o da dirigenti che desiderano condividere informazioni con le parti interessate. Svolge anche un ruolo importante nei progetti di big data. Poiché le aziende hanno accumulato enormi quantità di dati, avevano bisogno di un modo per ottenere rapidamente e facilmente una panoramica dei dati disponibili. Gli strumenti di visualizzazione erano una scelta naturale.

La visualizzazione è fondamentale per l’advanced analytics per ragioni simili. Quando un data scientist scrive analisi predittive avanzate o algoritmi di apprendimento automatico (machine learning), diventa importante visualizzare gli output per monitorare i risultati e garantire che i modelli funzionino come previsto. Questo perché le visualizzazioni di algoritmi complessi sono generalmente più facili da interpretare rispetto agli output numerici.

Perché la data visualization è importante?

La data visualization fornisce un modo rapido ed efficace per comunicare le informazioni in modo universale utilizzando le informazioni visive. La pratica può anche aiutare le aziende a identificare quali fattori influenzano il comportamento dei clienti; individuare le aree che devono essere migliorate o richiedono maggiore attenzione; rendere i dati più memorabili per le parti interessate; capire quando e dove posizionare prodotti specifici; e prevedere i volumi di vendita.

Altri vantaggi della data visualization includono:

  • la capacità di assorbire rapidamente le informazioni, migliorare le intuizioni e prendere decisioni più rapide;
  • una maggiore comprensione dei prossimi passi da compiere per migliorare l’organizzazione;
  • una migliore capacità di mantenere l’interesse del pubblico per le informazioni che possono comprendere;
  • una facile distribuzione delle informazioni che aumenta la possibilità di condividere approfondimenti con tutte le persone coinvolte;
  • eliminare la necessità di data scientist poiché i dati sono più accessibili e comprensibili; e
  • una maggiore capacità di agire rapidamente sui risultati e, quindi, raggiungere il successo con maggiore velocità e meno errori.

Data visualization e big data

La crescente popolarità dei big data e dei progetti di analisi dei dati ha reso la visualizzazione più importante che mai. Le aziende utilizzano sempre più l’apprendimento automatico per raccogliere enormi quantità di dati che possono essere difficili e lenti da ordinare, comprendere e spiegare. La visualizzazione offre un mezzo per accelerare questo processo e presentare le informazioni agli imprenditori e alle parti interessate in modo che possano comprenderle.

La visualizzazione dei big data spesso va oltre le tecniche tipiche utilizzate nella visualizzazione normale, come i grafici a torta, gli istogrammi e i grafici aziendali, utilizzando rappresentazioni più complesse, come per esempio le mappe di calore. La visualizzazione dei big data richiede potenti sistemi informatici per raccogliere dati grezzi, elaborarli e trasformarli in rappresentazioni grafiche che gli esseri umani possono utilizzare per trarre rapidamente intuizioni.

Sebbene la visualizzazione dei big data possa essere vantaggiosa, può comportare diversi svantaggi per le organizzazioni. Sono i seguenti:

  • per ottenere il massimo dagli strumenti di visualizzazione dei big data, è necessario assumere uno specialista della visualizzazione. Questo specialista deve essere in grado di identificare i set di dati e gli stili di visualizzazione migliori per garantire che le organizzazioni ottimizzino l’uso dei propri dati.
  • I progetti di visualizzazione dei big data richiedono spesso il coinvolgimento dell’IT, oltre che della gestione, poiché la visualizzazione dei big data richiede un hardware potente, sistemi di archiviazione efficienti e persino un passaggio al cloud.
  • Le intuizioni fornite dalla visualizzazione dei big data saranno accurate solo quanto le informazioni visualizzate. Pertanto, è essenziale disporre di persone e processi per governare e controllare la qualità dei dati, dei metadati e delle fonti di dati aziendali.

Alcuni esempi

Agli albori della visualizzazione, la tecnica di visualizzazione più comune consisteva nell’usare un foglio di calcolo Microsoft Excel per trasformare le informazioni in una tabella, un grafico a barre o un grafico a torta. Sebbene questi metodi di visualizzazione siano ancora comunemente usati, sono ora disponibili tecniche più complesse, tra cui: Infografiche, Bollicine, Grafici puntati, Mappe termiche, Grafici di serie temporali.

Alcune altre tecniche popolari includono:

Grafici a linee. Questa è una delle tecniche più basilari e comuni utilizzate. I grafici a linee mostrano come le variabili possono cambiare nel tempo.
Come mostra l’esempio che mostra la crescita della popolazione urbana nel mondo a partire dal 1960, una visualizzazione dinamica del classico grafico a linee rende immediatamente l’idea della variazione nel tempo. Inoltre consente di selezionare i dati del continente che maggiormente interessa.

Grafici ad area. Questo metodo di visualizzazione è una variazione di un grafico a linee; visualizza più valori in una serie temporale o una sequenza di dati raccolti in punti consecutivi e equidistanti nel tempo.

Grafici a dispersione. Questa tecnica mostra la relazione tra due variabili. Un grafico a dispersione assume la forma di un asse x e un asse y con punti per rappresentare i punti dati.

Mappe ad albero. Questo metodo mostra i dati gerarchici in un formato nidificato. La dimensione dei rettangoli utilizzati per ciascuna categoria è proporzionale alla sua percentuale dell’intero. Le mappe ad albero vengono utilizzate al meglio quando sono presenti più categorie e l’obiettivo è confrontare parti diverse di un intero.

Piramidi della popolazione. Questa tecnica utilizza un grafico a barre in pila per visualizzare la complessa narrativa sociale di una popolazione. È utilizzato al meglio quando si cerca di visualizzare la distribuzione di una popolazione.

Questi sono veramente alcuni semplicissimi esempi perché, come mostra l’esempio che segue, le possibilità sono davvero infinite.

Casi d’uso comuni

I casi d’uso comuni per la data visualization includono:

Vendite e marketing. I team di marketing devono prestare molta attenzione alle loro fonti di traffico web e al modo in cui le loro proprietà web generano entrate. La data visualization semplifica la visualizzazione delle tendenze del traffico nel tempo come risultato degli sforzi di marketing.

Politica. Un uso comune della data visualization in politica è una mappa geografica che mostra il partito votato da ogni stato o distretto.

Assistenza sanitaria. Gli operatori sanitari utilizzano spesso mappe coropletiche per visualizzare dati sanitari importanti. Una mappa coropletica mostra aree geografiche o regioni divise a cui è assegnato un determinato colore in relazione a una variabile numerica. Le mappe coropletiche consentono ai professionisti di vedere come una variabile, come il tasso di mortalità delle malattie cardiache, cambia in territori specifici. In questo ultimo anno di emergenza sanitaria a causa del coronavirus abbiamo tutti familiarizzato con mappe di questo tipo. Quello che riportiamo è uno dei tanti esempi (consigliamo di visualizzare il monitor a schermo intero, cliccando sull’apposita icona nella riga grigia in fondo al monitor).

Scienzati. La visualizzazione scientifica, a volte indicata in breve come SciVis, consente a scienziati e ricercatori di ottenere una visione più approfondita dai loro dati sperimentali che mai.

Finanza. I professionisti finanziari devono monitorare l’andamento delle loro decisioni di investimento quando scelgono di acquistare o vendere un bene. I grafici a candela sono utilizzati come strumenti di trading e aiutano i professionisti della finanza ad analizzare i movimenti dei prezzi nel tempo, visualizzando informazioni importanti, come titoli, derivati, valute, azioni, obbligazioni e materie prime. Analizzando come il prezzo è cambiato nel tempo, analisti di dati e professionisti della finanza possono rilevare le tendenze.

Logistica. Le compagnie di navigazione possono utilizzare strumenti di visualizzazione per determinare le migliori rotte di spedizione globali.

Data scientist e ricercatori. Le visualizzazioni create dai data scientist sono in genere per uso personale dello scienziato o per presentare le informazioni a un pubblico selezionato. Le rappresentazioni visive sono costruite utilizzando le librerie di visualizzazione dei linguaggi e degli strumenti di programmazione scelti. Scienziati e ricercatori di dati utilizzano spesso linguaggi di programmazione open source, come Python, o strumenti proprietari progettati per analisi di dati complesse. La data visualization eseguita da questi scienziati e ricercatori di dati li aiuta a comprendere i set di dati e identificare modelli e tendenze che altrimenti sarebbero passati inosservati.

La scienza della data visualization

La scienza della data visualization deriva dalla comprensione di come gli esseri umani raccolgono ed elaborano le informazioni. Daniel Kahn e Amos Tversky hanno collaborato alla ricerca che ha definito due diversi metodi per la raccolta e l’elaborazione delle informazioni.

Il sistema 1 si concentra sull’elaborazione del pensiero che è veloce, automatica e inconscia. Questo metodo è spesso utilizzato nella vita di tutti i giorni e aiuta a realizzare: leggere il testo su un cartello; risolvere semplici problemi di matematica, come 1 + 1; identificare da dove proviene un suono; andare in bici o determinare la differenza tra i colori.

Il sistema 2 si concentra sull’elaborazione del pensiero lenta, logica, calcolatrice e poco frequente. Questo metodo viene utilizzato quando: si dicono le cifre di un numero di telefono; per la risoluzione di problemi matematici complessi, come 132 x 154; per determinare la differenza di significato tra più segni affiancati; per la comprensione di segnali sociali complessi.

Strumenti e fornitori

Gli strumenti di data visualization possono essere utilizzati in vari modi. L’utilizzo più comune oggi è come strumento di reporting di business intelligence (BI). Gli utenti possono impostare strumenti di visualizzazione per generare dashboard automatici che tracciano le prestazioni dell’azienda attraverso gli indicatori chiave di prestazione (KPI) e interpretano visivamente i risultati.

Le immagini generate possono anche includere funzionalità interattive, che consentono agli utenti di manipolarle o esaminare più da vicino i dati per interrogarli e analizzarli. Possono essere integrati anche indicatori progettati per avvisare gli utenti quando i dati sono stati aggiornati o quando si verificano condizioni predefinite.

Molti reparti aziendali implementano software di data visualization per monitorare le proprie iniziative. Ad esempio, un team di marketing potrebbe implementare il software per monitorare le prestazioni di una campagna e-mail, monitorando metriche come tasso di apertura, percentuale di clic e tasso di conversione.

Poiché i fornitori di data visualization estendono le funzionalità di questi strumenti, vengono sempre più utilizzati come front-end per ambienti di big data più sofisticati. In questa impostazione, il software di data visualization aiuta i data engineer e i data scientist a tenere traccia delle origini dati e ad eseguire analisi esplorative di base dei set di dati prima o dopo analisi avanzate più dettagliate.

Alcuni altri fornitori offrono software di visualizzazione di big data specializzato, tra le aziende che si distinguono in questo ambito: Tableau, Qlik, Tibco, Microsoft (Power BI), IBM (Cognos Analytics), Oracle (Visual Analyzer), SAP, SAS, Zoho, Google (Charts), MicroStrategy, Flourish ecc.

WP - Tutto quello che devi sapere per orientarti nel mondo del DevOps

R

Redazione

Nel corso degli anni ZeroUno ha esteso la sua originaria focalizzazione editoriale, sviluppata attraverso la rivista storica, in un più ampio sistema di comunicazione oggi strutturato in un portale, www.zerounoweb.it, una linea di incontri con gli utenti e numerose altre iniziative orientate a creare un proficuo matching tra domanda e offerta.

Argomenti trattati

Approfondimenti

G
Guida

Articolo 1 di 5