La Data Science è l'insieme dei principali metodi e tecniche di diverse discipline, che analizzano ed interpretano le informazioni (dati) presenti all'interno di un archivio.  Le diverse tecniche permettono di estrarre conoscenza ed informazioni aggiuntive, attraverso la relativa fase di analisi / elaborazione. Questo di solito avviene tramite aiuto di uno o più esperti o tramite applicazioni progettate su misura.

Il processo di data science viene eseguito mediante analisi e interpretazione dei dati.

Il processo di analisi e interpretazione sia iterativo  che lineare o il tipico flusso  utilizzato per un progetto di creazione dei modelli  prevede le seguenti fasi:

  • Pianificazione: definire il progetto e i risultati potenziali
  • Preparazione: creare l'ambiente assicurandosi che i data scientist abbiano gli strumenti giusti, accedano ai dati giusti e ad altre risorse, come la capacità di elaborazione
  • Inserimento: caricare i dati nell'ambiente di lavoro
  • Esplorazione: analizzare, esplorare e visualizzare i dati
  • Creazione di modelli: creare, preparare e convalidare i modelli in modo che vengano eseguiti come richiesto
  • Implementazione: implementare i modelli in produzione

Cosa fanno i professioni che si occupano di Data science?

Nata grazie alla massiccia diffusione della tecnologia e del web e grazie al fatto che oggi le aziende raccolgono un enorme numero di dati, che possono essere analizzati per ricavarne informazioni fondamentali per il business.

Il Data Scientist raccoglie i dati da varie fonti, come applicazioni di business tipo ERP, CRM, banche dati, web analytics, social media, da sensori del mondo IOT, e successivamente li organizzano in strutture  eterogenei in formati organizzati e accessibili.