Data Science

La Data Science è l'insieme dei principali metodi e tecniche di diverse discipline, che analizzano ed interpretano le informazioni (dati) presenti all'interno di un archivio. Le diverse tecniche permettono di estrarre conoscenza ed informazioni aggiuntive, attraverso la relativa fase di analisi / elaborazione. Questo di solito avviene tramite aiuto di uno o più esperti o tramite applicazioni progettate su misura.
Il processo di data science viene eseguito mediante analisi e interpretazione dei dati.
Il processo di analisi e interpretazione sia iterativo che lineare o il tipico flusso utilizzato per un progetto di creazione dei modelli prevede le seguenti fasi:
- Pianificazione: definire il progetto e i risultati potenziali
- Preparazione: creare l'ambiente assicurandosi che i data scientist abbiano gli strumenti giusti, accedano ai dati giusti e ad altre risorse, come la capacità di elaborazione
- Inserimento: caricare i dati nell'ambiente di lavoro
- Esplorazione: analizzare, esplorare e visualizzare i dati
- Creazione di modelli: creare, preparare e convalidare i modelli in modo che vengano eseguiti come richiesto
- Implementazione: implementare i modelli in produzione
Cosa fanno i professioni che si occupano di Data science?
Nata grazie alla massiccia diffusione della tecnologia e del web e grazie al fatto che oggi le aziende raccolgono un enorme numero di dati, che possono essere analizzati per ricavarne informazioni fondamentali per il business.
Il Data Scientist raccoglie i dati da varie fonti, come applicazioni di business tipo ERP, CRM, banche dati, web analytics, social media, da sensori del mondo IOT, e successivamente li organizzano in strutture eterogenei in formati organizzati e accessibili.