ML.NET 教學課程 - 10 分鐘入門

下載並新增資料

下載 Sentiment Labelled Sentences 資料集 (下載來源為 UCI 機器學習存放庫)。將 sentiment labelled sentences.zip 解壓縮,並將 yelp_labelled.txt 檔案儲存到 myMLApp 目錄。

您的方案總管看起來應如下所示:

Visual Studio 方案總管

yelp_labelled.txt 中的每個資料列代表使用者在 Yelp 上對某間餐廳留下的不同評論。第一個資料行代表使用者留下的評論,第二個資料行代表文字的情緒 (0 代表負面,1 代表正面)。資料行會以索引標籤分隔,且資料集沒有標頭。資料會看起來如下所示:

yelp_labelled.txt
Wow... Loved this place.	        1
Crust is not good.	        0
Not tasty and the texture was just nasty.	        0

新增資料

在 Model Builder 中,您可以從本機檔案新增資料,或連線到 SQL Server 資料庫。在此情況下,您將從檔案新增 yelp_labelled.txt

  1. 選取 [檔案] 作為輸入資料來源類型。

  2. 瀏覽 yelp_labelled.txt。選取資料集後,資料的預覽會出現在 [資料預覽] 區段。因為資料集沒有標頭,會自動產生標頭 ("col0" 和 "col1")。

  3. 在 [要預測的資料行 (標籤)] 下,請選取 ["col1"]。[標籤] 是您要預測的項目,在本例中指的是在資料集第二個資料行 ("col1") 中找到的情緒。

  4. 用來協助預測標籤的資料行稱為 [功能]。資料集中除了標籤以外的所有資料行,都會自動選取為功能。在此情況下,[審閱批註資料行] ("col0") 會是 [功能] 資料行。您可以更新功能資料行,並修改 [進階資料選項] 中的其他資料載入選項,但此範例並不需要。

Model Builder 資料步驟

新增資料之後,請前往訓練步驟。

繼續