Tutorial ML.NET - Mulai dalam 10 menit

Unduh dan tambahkan data

Unduh himpunan data Kalimat Berlabel Sentimen dari Repositori Pembelajaran Mesin UCI. Buka zip sentiment labelled sentences.zip dan simpan file yelp_labelled.txt ke direktori myMLApp.

Penjelajah Solusi Anda harus seperti di berikut ini:

Penjelajah Solusi Visual Studio

Setiap baris dalam yelp_labelled.txt mewakili ulasan lain tentang restoran yang ditinggalkan oleh pengguna di Yelp. Kolom pertama mewakili komentar yang ditinggalkan oleh pengguna, dan kolom kedua mewakili sentimen teks (0 negatif, 1 positif). Kolom dipisahkan oleh tab, dan himpunan data tidak memiliki header. Data terlihat seperti berikut:

yelp_labelled.txt
Wow... Loved this place.	        1
Crust is not good.	        0
Not tasty and the texture was just nasty.	        0

Tambahkan data

Di Pembuat Model, Anda dapat menambahkan data dari file lokal atau menyambungkan ke database SQL Server. Dalam hal ini, Anda akan menambahkan yelp_labelled.txt dari file.

  1. Pilih File sebagai jenis sumber data input.

  2. Telusuri yelp_labelled.txt. Setelah memilih himpunan data, pratinjau data akan muncul di bagian Pratinjau Data. Karena himpunan data Anda tidak memiliki header, header dibuat secara otomatis ("col0" dan "col1").

  3. Pada Kolom yang akan diprediksi (Label), pilih "col1". Label adalah apa yang Anda prediksi, yang dalam hal ini adalah sentimen yang ditemukan di kolom kedua ("col1") himpunan data.

  4. Kolom yang digunakan untuk membantu memprediksi Label disebut Fitur. Semua kolom dalam himpunan data selain Label secara otomatis dipilih sebagai Fitur. Dalam hal ini, kolom komentar tinjauan ("col0") adalah kolom Fitur. Anda dapat memperbarui kolom Fitur dan mengubah opsi pemuatan data lainnya di Opsi data lanjutan, tetapi tidak diperlukan untuk contoh ini.

Langkah Data Pembuat Model

Setelah menambahkan data, masuk ke langkah Latih.

Melanjutkan