Esercitazione su ML.NET - Come iniziare in 10 minuti

Esegui training del modello

A questo punto, sarà possibile eseguire il training del modello con il set di dati yelp_labelled.txt.

Model Builder valuta molti modelli con algoritmi e impostazioni diverse in base alla quantità di tempo di formazione specificata per compilare il modello di esecuzione ottimale.

  1. Modificare il valore di Tempo di training, ovvero la quantità di tempo da concedere a Model Builder per esplorare diversi modelli, impostandolo su 60 secondi. È possibile provare a incrementare questo numero se non vengono trovati modelli dopo il training. Si noti che per set di dati di dimensioni più grandi il tempo di training sarà più lungo. Model Builder modifica automaticamente il tempo di training time in base alle dimensioni del set di dati.

  2. È possibile aggiornare la metrica di ottimizzazione e gli algoritmi usati nelle opzioni di training avanzate ; tuttavia, per questo esempio non è necessario eseguire questa operazione.

  3. Seleziona Avvia il training per avviare il processo di training. Dopo l'avvio, è possibile visualizzare il tempo rimanente.

  4. Training di Model Builder

Risultati del training

Al termine del training, è possibile visualizzare un riepilogo dei risultati del training.

Training su Model Builder completato

  • MacroAccuracy ottimale : mostra l'accuratezza del modello migliore individuato da Model Builder. Una maggiore accuratezza indica che la previsione eseguita dal modello sui dati di test è più corretta.
  • Miglior modello: mostra quale algoritmo ha ottenuto le migliori prestazioni durante l'esplorazione di Model Builder.
  • Tempo di training: indica la quantità totale di tempo impiegato per il training o l'esplorazione dei modelli.
  • Modelli esplorati (totale): mostra il numero totale di modelli esplorati da Model Builder nella quantità di tempo specificata.
  • Code-behind generato: mostra i nomi dei file generati per consentire l'utilizzo del modello o il training di un nuovo modello.

Se vuoi, puoi esaminare maggiori informazioni sulla sessione di training nella finestra di output del Machine Learning.

Al termine del training del modello, vai al passaggio Evaluate.

Nel terminale eseguire questo comando nella cartella myMLApp:

Command prompt
mlnet classification --dataset "yelp_labelled.txt" --label-col 1 --has-header false --name SentimentModel  --train-time 60

Cosa significano questi comandi?

Il comando mlnet classification esegue ML.NET con AutoML per esplorare numerose iterazioni dei modelli di classificazione nel tempo di training specificato, con combinazioni diverse di trasformazioni di dati, algoritmi e opzioni di algoritmi, quindi sceglie il modello con le prestazioni più elevate.

  • --dataset: È stato scelto yelp_labelled.txt come set di dati (internamente, l'interfaccia della riga di comando dividerà il set di dati in set di dati di training e test).
  • --label-col: È necessario specificare la colonna di destinazione da prevedere (o l'etichetta). In questo caso, si vuole prevedere il sentiment nella seconda colonna (le colonne con indice zero indicano che si tratta della colonna "1").
  • --has-header: Usare questa opzione per specificare se il set di dati ha un'intestazione. In questo caso, il set di dati non ha un'intestazione, quindi è false.
  • --name: Usare questa opzione per specificare un nome per il modello di Machine Learning e gli asset correlati. In questo caso, tutte le risorse associate al modello di Machine Learning avranno SentimentModel nel nome.
  • --train-time: È inoltre necessario specificare il tempo di esplorazione dei diversi modelli da parte di ML.NET CLI. In questo caso, 60 secondi (si può provare ad aumentare tale numero se non viene trovato alcun modello dopo il training). Si noti che per set di dati più grandi, è necessario impostare un tempo di training più lungo.

Stato

Durante l'esplorazione di modelli diversi da parte dell'interfaccia della riga di comando di ML.NET, vengono visualizzati i dati seguenti:

  • Avvio training - questa sezione illustra ogni iterazione del modello, inclusi il trainer (algoritmo) usato e le metriche di valutazione per tale iterazione.
  • Tempo rimanente e la barra di stato indicheranno la quantità di tempo rimanente nel processo di training in secondi.
  • Algoritmo migliore - Mostra l'algoritmo che finora ha offerto le prestazioni migliori.
  • Punteggio migliore: mostra le prestazioni del modello migliore finora. Una maggiore accuratezza indica che il modello è stato stimato in modo più corretto sui dati di test.

Volendo, maggiori informazioni sulla sessione di training sono disponibili nel file di log generato dall'interfaccia della riga di comando.

Continua