ML.NET チュートリアル | 概要を 10 分で

データをダウンロードして追加する

UCI Machine Learning Repository から Sentiment Labelled Sentences データセットをダウンロードします。sentiment labelled sentences.zip を解凍し、yelp_labelled.txt ファイルを myMLApp ディレクトリに保存します。

ソリューション エクスプローラーは次のようになります:

Visual Studio ソリューション エクスプローラー

yelp_labelled.txt の各行は、Yelp でユーザーが残したレストランのさまざまなレビューを表します。最初の列はユーザーが残したコメントを表し、2 番目の列はテキストの感情を表します (0 はマイナス、1 はプラス)。列はタブで区切られ、データセットにはヘッダーがありません。データは次のようになります:

yelp_labelled.txt
Wow... Loved this place.	        1
Crust is not good.	        0
Not tasty and the texture was just nasty.	        0

データの追加

Model Builder では、ローカル ファイルからデータを追加したり、SQL Server データベースに接続したりできます。 この場合、ファイルから yelp_labelled.txt を追加します。

  1. 入力データソースの種類として ファイル を選択します。

  2. yelp_labelled.txt を参照します。データセットを選択すると、Data Preview セクションにデータのプレビューが表示されます。データセットにはヘッダーがないため、ヘッダーは自動生成されます ("col0" および "col1")。

  3. [予測 (ラベル) の列 で、"col1" を選択します。ラベル は予測対象のことで、この場合、データセットの 2 番目の列 ("col1") にあるセンチメントです。

  4. ラベルの予測に使用される列は、特徴 と呼ばれます。ラベル以外のデータセット内のすべての列は、自動的に特徴として選択されます。この場合、レビュー コメント列 ("col0") が特徴の列です。特徴の列を更新し、詳細データ オプションで他のデータ読み込みオプションを変更できますが、この例では必要ありません。

Model Builder データ手順

データを追加した後、トレーニングの手順に進みます。

続行