Risposte alle tue domande. Il nostro obiettivo è costruire un grande data base di risposte.

Tags


API Object Detection di TensorFlow

28th June 2017

Sai che cosa è TensorFlow?

TensorFlow è un software per l'apprendimento automatico in diversi tipi di ambienti sia visivi che di comprensione del linguaggio. Già si parla di una seconda generazione di API, librerie che diversi team Google sta già usando sia in ambito di ricerca che di produzione all'interno di prodotti commerciali Google, come il riconoscimento vocale, Gmail, Google Foto, e Google Search. Il padre di TensorFlow fu DistBelief, una prima generazione di API. TensorFlow è stato sviluppato dal team Google Brain e rilasciato sotto la licenza open source Apache 2.0 il 9 novembre 2015.

Tensoflow Berlino

Google sviluppa sistemi avanzati di machine learning (ML) per la visione artificiale che possono essere utilizzati per migliorare alcuni servizi. Una delle ultime sfide fatte da Google è la creazione di modelli machine learning accurati, in grado di localizzare e identificare più oggetti in un'unica immagine.

Google già da ottobre 2016 ha utilizzato il sistema di rilevamento degli oggetti in-house ottenendo ottimi risultati, tali da essere primo nella competizione di rilevamento COCO. Questo sistema già ha generato risultati per diverse pubblicazioni di ricerca ed è stato utilizzato in prodotti come: NestCam, Google Ricerca Immagine nella funzionalità Oggetti simili e idee di stile, il rilevamento del numero civico e del nome in Street View.

TensorFlow seconda generazione di API

Adesso lo stesso Google rendere disponibile questo sistema a una comunità di ricerca più ampia attraverso l'API Object Detection di TensorFlow.

Si tratta di un framework open source basato su TensorFlow che semplifica la creazione, formazione e distribuzione dei modelli di rilevamento degli oggetti.

La prima versione del framework include una selezione di modelli di rilevamento addestrabili, tra cui:

  • Single Shot Multibox Detector (SSD) con MobileNets
  • SSD con Inception V2
  • Region-Based Fully Convolutional Networks (R-FCN) con Resnet 101
  • Faster RCNN con Resnet 101
  • Faster RCNN con Inception Resnet v2

Un altro set di modelli sono:

  • I carichi calibrati e fissati addestrati in base al set di dati COCO

  • Convenienti script di formazione locali nonché pipeline di formazione e di valutazione distribuite tramite Google Cloud

  • Jupyter Notebook per eseguire l'inferenza predefinita con uno dei modelli rilasciati

Evidenziamo un set di modelli dedicati al segmento mobile, si tratta di MobileNet che sono leggeri e progettati per essere eseguiti in tempo reale sui dispositivi mobili.

Sullivan
AUTHOR

Sullivan

View Comments