Questo sito web utilizza cookie tecnici e, previo Suo consenso, cookie di profilazione, nostri e di terze parti. Chiudendo questo banner, scorrendo questa pagina o cliccando qualunque suo elemento acconsente all'uso dei cookie. Leggi la nostra Cookie Policy per esteso.OK

Quale data management per i sistemi analitici

pittogramma Zerouno

Vendor Overview

Quale data management per i sistemi analitici

21 Dic 2017

di Giampiero Carli Ballola

L’adozione delle soluzioni per l’analisi di grandi volumi di dati eterogenei sta avendo un effetto dirompente sul mercato dei database e dei sistemi di data warehousing. Cambia l’offerta dei fornitori tradizionali e nuovi nomi entrano nel mercato, sia con soluzioni on-premises sia con servizi cloud. Valutiamo, con l’aiuto di una recente analisi Gartner, i pro e contro delle principali piattaforme di DMSA (Data Management Solutions for Analytics).

Le opportunità strategiche e operative che si sono aperte ai decisori aziendali grazie alla possibilità di utilizzare soluzioni di big data analysis, per analizzare una mole di dati con tempi e modalità come mai s’era potuto fare prima, sono la spinta che ha provocato una vera rivoluzione nelle tecnologie e nel mercato dei software di data management. Sono cambiati sistemi di database e architetture di data warehouse e soprattutto è nata una nuova classe di soluzioni rivolte all’analisi di grandi volumi di dati che chiameremo Data Management Solutions for Analytics, o DMSA.

Secondo Gartner, una DMSA è una soluzione software in grado di gestire dati in uno o più database e progettata e ottimizzata per attività di data management al supporto dei processi analitici, ivi compresi (ma non solo) processi relazionali e non relazionali (come i grafi), machine learning o linguaggi di programmazione come Python o R. Questa definizione copre sistemi aperti a modelli di dati diversi (relazionali, documentali, grafici, geospaziali e altro) e, sempre per Gartner, prevede anche software di data management costituiti da più tecnologie e aventi più tipi di delivery (software stand-alone, appliance, servizio cloud). Su tale definizione Gartner ha elaborato il Magic Quadrant DMSA, aggiornato al 28 febbraio 2017, cui noi qui facciamo riferimento.

Quadrant Gartner Data Management Solutions for Analytics, i migliori software di data management
Magic Quadrant for Data Management Solutions for Analytics – Fonte: Gartner, Febbraio 2017

Ecco i principali vendor di software di data management per analytics

Gartner valuta l’inclusione e la posizione dei vendor di software di data management per analytics secondo molti criteri. Per le DMSA si tratta di 12 punti principali, di cui i quattro dettagliati in 19 sotto-paragrafi. Non potendo qui riportare, nemmeno a grandi linee, tutte le voci (il documento integrale è disponibile sul sito di Gartner), ci limitiamo a ricordare che queste trattano sia le proprietà tecnologiche e di mercato dell’offerta (completezza, maturità, funzionalità, flessibilità di deployment e implementazione, tipo di supporto, modello commerciale e così via), sia la posizione e capacità, anche economica, del fornitore (fatturato, numero clienti, copertura geografica, partnership e altro). L’insieme dei livelli ai quali tali parametri sono soddisfatti costruisce la valutazione qualitativa e quantitativa del fornitore di questo tipo di software di data management e la sua collocazione nel quadrante.

Stanti queste premesse, ecco, in ordine alfabetico, una sintesi dei commenti di Gartner relativi ai vendor valutati come ‘leader’ nel Magic Quadrant 2017 per le DMSA.

Amazon Web Services

Interamente controllata da Amazon.com, AWS offre diverse opzioni di software di data management: Simple Storage Service (S3) per i servizi di base; Redshift, per un data warehouse su cloud ed Elastic Map Reduce (EMR) per un framework Hadoop adatto ai grandi volumi di dati. A questi servizi si è poi recentemente aggiunto Athena, un motore di query serverless e fruibile a consumo per attività di data management di dati risiedenti su Amazon S3.

Vantaggi

  1. trattandosi del cloud dominante è più probabile che i dati da gestire stiano su Amazon piuttosto che altrove, il che semplifica le cose;
  2. disporre di più opzioni permette di scegliere la soluzione più adatta per funzionalità e servizio ai vari casi-utente;
  3. AWS punta da sempre al basso costo e al pay-per-use ed EMR ha un sistema di pricing che permette di disporre di risorse addizionali a costi sensibilmente più bassi di altri vendor.

Limiti

  1. le soluzioni AWS sono usabili solo via cloud, per cui non vi si può ricorrere nel caso in cui, anche temporaneamente, occorra un ambiente ibrido;
  2. il DW Redshift viene fornito in configurazioni fisse per capacità di calcolo e storage e scalare tali risorse non è facile, comportando un lavoro di varie ore mentre i dati sono ridistribuiti;
  3. avere servizi diversi per i vari casi-utente è un vantaggio, ma implica un lavoro di controllo affinché il proliferare dei servizi non crei problemi d’integrazione.

IBM

L’offerta di database per big data management Ibm comprende soluzioni stand-alone, come DB2 per Linux, Unix e Windows e DB2 per appliance z/OS (cioè i Pure Data System for Analytics, Pure Data System for Operational Analytics e DB2 Analytics Accelerator); un framework Hadoop (BigInsights) e una PaaS per cloud pubblico o privato con la famiglia dashDB. Vi sono poi sia i classici servizi di data warehouse management sia i DataFirst Method, per ottimizzare l’uso delle analisi e le soluzioni Watson Data Platform e Watson DataWorks, entrambe a supporto di evoluzioni ad ambienti ibridi cloud e on-premises.

Vantaggi

  1. le prestazioni generali, l’equilibrio tra potenza e apertura agli standard della piattaforma e soprattutto il supporto al deployment, frutto dell’approccio Ibm ”design once deploy anywhere”;
  2. l’interoperabilità di processi e analisi attraverso le varie piattaforme cloud e on premises data da Fluid Query, che potenzia le capacità logiche del DW;
  3. la capacità di analisi approfondite e su grandi data set della Watson Data Platform, sistema di AI a supporto decisionale la cui diffusione è in crescita.

Limiti

  1. la varietà dell’offerta può portare a un portafoglio complesso da gestire, per cui Gartner consiglia un approccio graduale focalizzato sui bisogni immediati;
  2. molti utenti Ibm trovano il prezzo e il costo operativo elevati e talvolta l’uso di elementi open source crea problemi di upgrading.

Microsoft

Oltre alla soluzione puro-software di data management, con configurazioni certificate, data da SQL Server, l’offerta comprende l’ Analytics Platform System, appliance in architettura MPP (massive parallel processing) che supporta data warehouse in ambienti ibridi, e i servizi cloud Azure SQL DW, Azure Data Lake e Azure HDInnsight, distribuzione Hadoop basata su Hortonworks.

Vantaggi

  1. si tratta per Gartner dell’offerta che più di altre risponde alle esigenze cloud e, con Azure SQL DW, indirizza il crescente interesse per il data warehousing nel cloud e in ambienti ibridi;
  2. Azure Data Lake, che supporta Apache Spark e il linguaggio U-SQL può fare da base per l’implementazione cloud di grandi DW per dati di formati eterogenei e diversi tipi di elaborazione e analisi;
  3. il pricing dei servizi cloud è flessibile e permette di scalare indipendentemente storage e calcolo a seconda dei carichi di lavoro.

Limiti

  1. la tecnologia di Azure SQL DW è ancora giovane (inizi 2016) e il fatto che la maggioranza dei deployment sia inferiore ai 5 TB fa pensare che prima di lanciarsi in progetti di vasta portata di attività di data management convenga fare realizzazioni di prova;
  2. la capacità di combinare le soluzioni Azure con altre tecnologie secondo un concetto di best-fit è limitata, per cui il rischio di lock-in è alto, anche se Microsoft lavora sulll’accesso ad Amazon S3 e altre fonti;
  3. i diversi motori di accesso ed elaborazione (Spark, U-SQL e altri) complicano la scelta della soluzione migliore per un DW con dati di formato multiplo.

Oracle

La gamma Oracle comprende, oltre al Database 12c, le soluzioni software di data management Big Data SQL, Big Data Management System e Big Data Connectors e i sistemi integrati Big Data Appliance ed Exadata DB Machine. L’offerta cloud prevede la fornitura in servizio del database e delle appliance Exadata e Big Data.

Vantaggi

  1. con un’esperienza di decenni e un ruolo primario nell’area dei Dbms, Oracle offre tutte le garanzie d’una visione e capacità tecnologia di soluzioni big data di prima classe;
  2. con Big Data SQL l’utente può beneficiare delle più diffuse distribuzioni Hadoop sia per l’accesso sia per funzioni avanzate come il predicate pushdown (lo spostare parte della query sulla fonte dati per ridurre il traffico di rete – ndr);
  3. secondo Gartner oltre il 70% delle scelte in ambito DMSA va sul fornitore di sistemi di database management (Dbms) aziendale, il che, assieme con le capacità di cui s’è detto, fa di Oracle il vendor d’elezione per la grande maggioranza dei casi utente.

Limiti

  1. sebbene i sistemi di database come servizio siano disponibili da più di due anni e l’offerta PaaS sia in produzione, Oracle non dà ancora, secondo Gartner, quel supporto al cloud che altri vendor offrono da tempo;
  2. molti dei suoi stessi utenti ritengono che i prezzi e le condizioni dei contratti siano onerosi.

SAP

A parte SAP IQ, un Dbms colonnare disponibile in soluzione stand-alone, l’offerta e la strategia Sap puntano su Hana, anch’esso un sistema di database management colonnare, ma disegnato in modo specifico per analisi in-memory. Hana è fornito come appliance da molti vendor hardware, come servizio cloud pubblico e privato (sulla SAP Cloud Platform, della quale è parte) e come Hana TDI (Tailored Data Center), programma per farne l’architettura di riferimento sulla quale ottimizzare le infrastrutture esistenti.

Vantaggi

  1. stante la strategia volta a rendere Hana la soluzione DMSA d’elezione per tutta l’impresa, l’offerta è in continua crescita, con miglioramenti nell’availability e data recovery, nello streaming, nella multiutenza e nelle integrazioni ed estensioni varie,
  2. secondo gli utenti le prestazioni sono molto al di sopra della media;
  3. Hana è offerta in versione 1.0 per chi vuole una soluzione stabile e con supporto triennale, e 2.0 per chi preferisce un ambiente continuamente aggiornato.

Limiti

  1. nonostante gli sforzi per farne una soluzione universale, Hana è ancora visto come legato al mondo Sap, tanto da non essere quasi mai valutato per progetti esterni all’ecosistema Sap;
  2. oltre ad essere un prodotto costoso, secondo indagini del 2016 vi sarebbero difficoltà d’implementazione e funzionalità deboli o mancanti, per cui Gartner raccomanda d’esaminare la roadmap di sviluppo per verificarne l’allineamento ai bisogni dell’azienda.

Teradata

L’offerta di data warehousing dell’azienda prevede, oltre al noto Dbms, sia appliance sia soluzioni cloud in architettura MPP su infrastruttura propria o pubblica (AWS e Azure). La Teradata Unified Data Architecture (UDA) dà il supporto dei big data e tramite la Query Grid (parte dell’UDA) e l’open-source Presto abilita le query multisystem. Teradata inoltre fornisce la piattaforma d’analisi Aster Analytics e i relativi servizi di consulenza.

Vantaggi

  1. indirizzando tutti i possibili casi utente, integrando una quantità di fonti dati anche streaming (via Teradata Listener), fornendo un’interfaccia query unica e potendo funzionare in più ambienti e in più fattori di forma, la piattaforma DMSA di Teradata si pone al top per visione e capacità tecnologica;
  2. le sue prestazioni sono eccellenti, tra le migliori di tutti i vendor del Magic Quadrant;
  3. queste caratteristiche la rendono adatta a fare da DMSA standard per l’impresa, come in effetti è per quasi l’80% dei suoi utenti.

Limiti

  1. le soluzioni Teradata sono costose e ciò ne frena sia l’adozione sia l’estensione e il potenziamento, attuati da meno della metà dei suoi utenti; con l’annunciato passaggio a forme di abbonamento, questo ostacolo si potrebbe ridurre;
  2. nonostante la superiorità tecnologica, per chi sceglie Teradata resta il problema di passare ad ambienti diversi da Dbms che già usa e che stanno affinando le capacità di fare da DMSA.

Giampiero Carli Ballola
Giornalista

Giampiero Carli-Ballola, nato nel 1942 e giornalista specialista in tecnologia, collabora con ZeroUno dal 1988. Segue i processi di digitalizzazione del business con particolare attenzione ai data center e alle architetture infrastrutturali, alle applicazioni big data e analitiche, alle soluzioni per l’automazione delle industrie e ai sistemi di sicurezza.

Argomenti trattati

Approfondimenti

Vendor Overview
Quale data management per i sistemi analitici

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

    LinkedIn

    Twitter

    Whatsapp

    Facebook

    Link

    Articolo 1 di 4