Tutorial ML.NET - Mulai dalam 10 menit

Latih model Anda

Sekarang, Anda akan melatih model Anda dengan himpunan data yelp_labelled.txt.

Model Builder mengevaluasi banyak model dengan algoritma dan pengaturan yang bervariasi berdasarkan jumlah waktu pelatihan yang diberikan untuk membuat model berkinerja terbaik.

  1. Ubah Waktu untuk melatih, yang merupakan jumlah waktu yang Anda inginkan agar Model Builder menjelajahi berbagai model, ke 60 detik (Anda dapat mencoba meningkatkan jumlah ini jika tidak ada model yang ditemukan setelah pelatihan) . Perhatikan bahwa untuk himpunan data yang lebih besar, waktu pelatihan akan lebih lama.Model Builder secara otomatis menyesuaikan waktu pelatihan berdasarkan ukuran himpunan data.

  2. Anda dapat memperbarui metrik optimalisasi dan algoritma yang digunakan dalam opsi Pelatihan tingkat lanjut, tetapi hal ini tidak diperlukan untuk contoh ini.

  3. Pilih Mulai pelatihan untuk memulai proses pelatihan. Setelah pelatihan dimulai, Anda dapat melihat sisa waktu.

  4. Pelatihan Pembuat Model

Hasil pelatihan

Setelah pelatihan selesai, Anda dapat melihat ringkasan hasil pelatihan.

Pelatihan Pembuat Model Selesai

  • MacroAccuracy Terbaik - Ini menunjukkan akurasi model terbaik yang ditemukan Pembuat Model. Akurasi yang lebih tinggi berarti model memprediksi lebih tepat pada data pengujian.
  • Model terbaik - Ini menunjukkan algoritma mana yang berkinerja paling baik selama eksplorasi Model Builder.
  • Waktu pelatihan - Ini menunjukkan jumlah total waktu yang dihabiskan untuk melatih/menjelajahi model.
  • Model yang dijelajahi (total) - Ini menunjukkan jumlah total model yang dijelajahi oleh Pembuat Model dalam jumlah waktu tertentu.
  • Kode belakang yang dihasilkan - Ini menunjukkan nama file yang dihasilkan untuk membantu menggunakan model atau melatih model baru.

Bila perlu, Anda dapat melihat informasi selengkapnya tentang sesi pelatihan di jendela Output Pembelajaran Mesin.

Setelah pelatihan model selesai, masuk ke langkah Evaluasi.

Di terminal Anda, jalankan perintah berikut (di folder myMLApp Anda):

Command prompt
mlnet classification --dataset "yelp_labelled.txt" --label-col 1 --has-header false --name SentimentModel  --train-time 60

Apa arti perintah ini?

Perintah mlnet classification menjalankan ML.NET dengan AutoML untuk mengeksplorasi banyak iterasi model klasifikasi dalam jumlah waktu pelatihan tertentu dengan berbagai kombinasi transformasi data, algoritma, dan opsi algoritma, lalu memilih model dengan performa tertinggi.

  • --dataset: Anda memilih yelp_labelled.txt sebagai himpunan data (secara internal, CLI akan membagi satu himpunan data menjadi himpunan data pelatihan dan pengujian).
  • --label-col: Anda harus menentukan kolom target yang ingin Anda prediksi (atau Label). Dalam hal ini, Anda ingin memprediksi sentimen di kolom kedua (kolom terindeks nol berarti ini adalah kolom "1").
  • --has-header: Gunakan opsi ini untuk menentukan apakah himpunan data memiliki header. Dalam hal ini, himpunan data tidak memiliki header, sehingga salah.
  • --name: Gunakan opsi ini untuk memberikan nama untuk model pembelajaran mesin dan aset terkait Anda. Dalam hal ini, semua aset yang terkait dengan model pembelajaran mesin ini akan memiliki SentimentModel dalam namanya.
  • --train-time: Anda juga harus menentukan jumlah waktu yang diinginkan agar ML.NET CLI menjelajahi model yang berbeda. Dalam hal ini, 60 detik (Anda dapat mencoba meningkatkan angka ini jika tidak ada model yang ditemukan setelah pelatihan). Perhatikan bahwa untuk himpunan data yang lebih besar, Anda harus mengatur waktu pelatihan yang lebih lama.

Progres

Saat ML.NET CLI menjelajahi berbagai model, ini menampilkan data berikut:

  • Mulai pelatihan - Bagian ini menampilkan setiap iterasi model, termasuk metrik pelatih (algoritma) yang digunakan dan evaluasi untuk iterasi tersebut.
  • Waktu tersisa - Ini dan bilah kemajuan akan menunjukkan berapa lama waktu yang tersisa dalam proses pelatihan dalam detik.
  • Algoritma terbaik - Ini menunjukkan kepada Anda algoritma mana yang memiliki performa terbaik sejauh ini.
  • Skor terbaik - Ini menunjukkan kinerja model terbaik sejauh ini. Akurasi yang lebih tinggi berarti model memprediksi dengan lebih tepat pada data pengujian.

Jika menginginkannya, Anda dapat melihat informasi selengkapnya tentang sesi pelatihan dalam file log yang dihasilkan oleh CLI.

Melanjutkan