Esercitazione su ML.NET - Come iniziare in 10 minuti

Scarica e aggiungi dati

Scarica i set di dati Sentiment Labelled Sentences dal Repository Machine Learning UCI. Decomprimi sentiment labelled sentences.zip e salva il file yelp_labelled.txt nella directory myMLApp.

Il Esplora soluzioni dovrebbe essere simile al seguente:

Esplora soluzioni di Visual Studio

Ogni riga in yelp_labelled.txt rappresenta una recensione diversa di un ristorante lasciata da un utente su Yelp. La prima colonna rappresenta il commento lasciato dall'utente e la seconda colonna rappresenta la valutazione del testo (0 è negativo, 1 è positivo). Le colonne sono separate da tabulazioni e il set di dati non contiene intestazioni. I dati sono simili ai seguenti:

yelp_labelled.txt
Wow... Loved this place.	        1
Crust is not good.	        0
Not tasty and the texture was just nasty.	        0

Aggiungi dati

In Model Builder puoi aggiungere dati da un file locale o connetterti a un database di SQL Server. In questo caso, aggiungerai yelp_labelled.txt da un file.

  1. Seleziona File come tipo di origine dati di input.

  2. Cerca yelp_labelled.txt. Dopo aver selezionato il set di dati, verrà visualizzata un'anteprima dei dati nella sezione Anteprima dei dati. Poiché il set di dati non ha un'intestazione, le intestazioni vengono generate automaticamente ("col0" e "col1").

  3. In Colonna da prevedere (etichetta) , selezionare "col1". L'etichetta è ciò che si vuole prevedere, che in questo caso è il sentiment trovato nella seconda colonna ("col1") del set di dati.

  4. Le colonne utilizzate per stimare l'etichetta sono denominate Funzionalità. Tutte le colonne del set di dati oltre all'etichetta vengono selezionate automaticamente come Funzionalità. In questo caso, la colonna del commento di revisione ("col0") è la colonna Funzionalità. È possibile aggiornare le colonne Funzionalità e modificare altre opzioni di caricamento dei dati in Opzioni dati avanzate, ma non è necessario per questo esempio.

Passaggio dati Model Builder

Dopo aver aggiunto i dati, andare al passaggio Eseguire il training.

Continua