Tech InDepth

Data integration: da Talend un’app per il data streaming self-service

In occasione della presentazione della release Spring 2018 della propria piattaforma open source commerciale per la data integration, Talend ha lanciato Talend Data Streams, un’app già disponibile per il download gratuito sul marketplace di Amazon. Fra i target, data engineer, data scientist, data analyst

Pubblicato il 13 Giu 2018

Concetto di Data Integration: completare un puzzle di dati

Talend Data Streams va ad aggiungersi alle altre app basate su figure professionali attualmente disponibili con Talend Data Fabric, una piattaforma di integrazione open source che combina tutte le soluzioni Talend in una serie di strumenti potenti e il più possibile intuitivi per l’integrazione, in tempo reale o batch, di dati o applicazioni.

Come si evince dal suo nome, Talend Data Streams mette nel mirino “gli stream di dati che – come sostiene Antongiulio Donà, Vice President Sales Italia di Talend – rappresentano il vero futuro dell’IT. In questo momento, nel mondo, ci sono centinaia di migliaia di prodotti differenti in grado di generare dati. A loro volta, questi confluiscono in milioni di diversi database. L’obiettivo di Talend Data Streams è permettere a tutti di accedere a queste fonti di dati in tempo reale da pc senza dover disturbare l’IT aziendale”.

L’app si rivolge a data engineer, data scientist, data analyst e altri analisti che devono integrare dati ad hoc. Utilizzando un’interfaccia utente web che non richiede installazione e gestione, gli utenti possono avviare l’integrazione dei dati e nel giro di breve tempo integrare nei data lake aziendali grandi volumi di dati eterogenei da streaming e cloud. Una funzionalità di anteprima ‘live’, che visualizza i cambiamenti in tempo reale, permette di accelerare la progettazione e la costruzione di pipeline di dati, la loro modifica e portabilità fra piattaforme cloud alimentate da Apache Beam (un modello unificato open source per la definizione di pipeline di elaborazione parallele dati batch e in streaming) senza interruzioni dei flussi.

Per capire la portata di questa app, e in generale di una suite come Talend Data Fabric, bisogna pensare alla crescente importanza dei data lake, che non sono altro che repository di dati e big data di svariati formati e provenienti da fonti disparate, come, per esempio, applicazioni Sap, Oracle, Microsoft, Salesforce, oppure piattaforme social e tecnologie dell’Internet of Things (IoT).

“Al momento – conclude Donà – sul piano della data integration sul cloud e dei big data siamo irraggiungibili. Nonostante l’azienda sia giovane, con soli 900 dipendenti, e si basi su software open source, già da qualche anno figuriamo sempre nei quadranti magici sulla data integration. Competiamo con vendor quali Informatica, IBM e Oracle, ma a differenza di loro, noi utilizziamo software creato e gestito dalle community open source, che sosteniamo e di cui in parte contribuiamo a indirizzare le attività. Così, possiamo dire di avvalerci di circa tre milioni di sviluppatori, il che ci permette di investire le nostre risorse nella parte alta degli stack tecnologici. Al momento, la nostra piattaforma offre più di un migliaio di connettori nativi diversi, che permettono agli sviluppatori di creare le loro applicazioni una sola volta e poterle implementare e portare dappertutto”. Talend prevede un modello di licensing basato su sviluppatore e non su implementazioni. Un vantaggio soprattutto per le aziende che acquisiscono o che si fondono con altre aziende, portandosi a casa nuovi ambienti IT da integrare.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati

Articolo 1 di 4