Cosa sono gli smart data e qual è la differenza con i big data
Cosa intendiamo per “smart data”? la definizione di smart data è, letteralmente, “dati intelligenti”. Lato pratico questo si traduce come la selezione di dati contenenti informazioni utili per prendere decisioni real time. Essi vengono creati in un processo di elaborazione creato ad hoc ad obiettivi stabiliti.
I big data, invece, hanno questo nome a causa della grandezza dei loro volumi, che necessitano di strumenti di analisi per averne un’utilità in tempi ragionevoli. Inoltre questi hanno altre caratteristiche che li rendono “unici”, quali la varietà delle fonti di provenienza o la velocità di trasmissione.
Per ottenere un valore dai big data è opportuno che questi siano inseriti in un contesto adeguato, perché non tutti sono adatti ad un’impresa. In tal senso gli smart data sono dei big data in grado di sviluppare un potenziale economico per le aziende che li utilizzano.
Gli smart data vengono estratti da un’analisi strategica a tutto tondo, in cui, una volta stabiliti degli obiettivi, vengono delineati i KPI (Key Performance Indicator) in base ai quali verranno valutati e selezionati i dati analizzati.
In cosa vengono usati i dati smart e come sfruttarli in azienda
L’utilizzo di questa tipologia di dati è d’interesse per qualsiasi settore aziendale e per qualsiasi strategia ben definita: dal miglioramento della customer experience all’individuazione di nuove aree di business, fino all’ottimizzazione dei consumi e delle prestazioni.
Proprio perché il criterio principale è il raggiungimento di un determinato obiettivo strategico: le fonti dei dati possono essere le più svariate (l’azienda, i partner o altri).
Nel settore delle telecomunicazioni dai volumi di traffico voce vengono usati smart data utili a fare diagnostica delle strutture. Nel retail gli smart data sono utilizzati per aumentare e migliorare le vendite, analizzando il viaggio del cliente, il customer journey, tra i diversi punti di contatto on e offline e personalizzando l’offerta.
Ma come vengono utilizzati gli smart data nei vari settori? Qui abbiamo riportato alcuni esempi:
- Nelle telecomunicazioni dai volumi di traffico voce sono estratti smart data utili a fare diagnostica delle strutture;
- Nel retail gli smart data sono utilizzati nell’ambito delle vendite, attraverso un’analisi della customer journey e la produzione di offerte personalizzate.
- Nell’industria manifatturiera invece gli smart data sono fondamentali nel monitoraggio in tempo reale dei processi. I loro ambiti di applicazione sono molteplici, dalla gestione del magazzino, quindi nell’inventario e nel calcolo dei livelli di fornitura, alla produzione vera e propria, con tutto quello che essa concerne.
- Nel settore comunicazione e marketing, gli smart data aiutano nell’analisi delle conversazioni pubbliche online e dalle menzioni nel tempo al brand e ai competitor, è possibile inoltre misurare la Brand Reputation di un marchio sul web, raccogliere dei dati sul coinvolgimento ed elaborare strategie.
In generale, gli smart data ci danno informazioni essenziali per poter decidere con criterio riguardo a costi di produzione, consumi di risorse e condizioni delle macchine, garantendo – per queste ultime, la cosiddetta manutenzione predittiva, che permette di intervenire sul macchinario prima che si verifichi il guasto.
Cos’è e come funziona una smart data platform
La smart data platform è dunque la piattaforma per la gestione degli smart data sopra descritti. Tra le sue funzioni possiamo annoverare la gestione di dataset eterogenei e la capacità di unire dati aziendali anche di seconde e terze parti. Esse si possono anche configurare in base a quello che vogliamo ottenere dai dati.
Quando facciamo una richiesta alla piattaforma, la nostra domanda viene trasformata in query, ovvero un’interrogazione del database, il quale deve individuare i dati necessari a fornire la risposta che ci serve. Per queste richieste viene di solito utilizzato il protocollo SPARQL – Protocol and RDF Query Language, basato sull’RDF – Resource Description Framework. RDF utilizza le cosiddette triple (soggetto-predicato-valore) per descrivere le relazioni tra concetti: ci dà la possibilità quindi di elaborare richieste che abbiano questi tre elementi.
RDF è il modello di riferimento del “web semantico”, un ambiente digitale in cui ogni documento viene associato a informazioni e metadati che ne specificano il contesto semantico in un formato adatto all’elaborazione automatica.
Soggetto, predicato, valore: a livello grafico, elaborare una frase RDF significa adoperare dei grafi che uniscono i nodi “soggetto” e “valore” con un arco che identifica il predicato. Nella risposta con il modello RDF viene usato quindi un database a grafo (Triple Store o RDF Store) i cui dati smart, prima dell’inserimento in tale database vanno “puliti”, cioè resi strutturati e convertiti in altri formati.
Una smart platform data ha al suo interno tool di pulizia e un processo di ETL – Extract, Transform and Load, ovvero di estrazione, trasformazione e caricamento dati. Questo individua gli smart data d’interesse per la ricerca, partendo dai big data iniziali, processandoli e unendoli per ampie categorie, prima di caricarli in una repository.
Per queste operazioni si usa di solito un data lake, il quali può avere al suo interno dati proveniente da più fonti e che verranno correlati tra loro e ampliati per inferenza, attraverso specifici algoritmi.
Le operazioni di “Data Linking and Reasoning” sono fondamentali per creare il grafo RDF e rispondere alle query, che sono formulabili attraverso apposite interfaccia e API.