Didacticiel ML.NET - Démarrage en 10 minutes

Télécharger et ajouter des données

Téléchargez les ensembles de données Sentiment Labelled Sentences à partir du référentiel d'apprentissage automatique UCI. Décompressez sentiment labelled sentences.zip et enregistrez le fichier yelp_labelled.txt dans le répertoire myMLApp.

Votre Explorateur de solutions devrait ressembler à ce qui suit :

Explorateur de solutions Microsoft Visual Studio

Chaque ligne dans yelp_labelled.txt représente un avis différent sur un restaurant laissé par un utilisateur sur Yelp. La première colonne représente le commentaire laissé par l'utilisateur et la deuxième colonne représente le sentiment du texte (0 est négatif, 1 est positif). Les colonnes sont séparées par des tabulations et le jeu de données n'a pas d'en-tête. Les données ressemblent à ce qui suit :

yelp_labelled.txt
Wow... Loved this place.	        1
Crust is not good.	        0
Not tasty and the texture was just nasty.	        0

Ajouter des données

Dans Model Builder, vous pouvez ajouter des données à partir d’un fichier local ou vous connecter à une base de données SQL Server. Dans ce cas, vous allez ajouter yelp_labelled.txt à partir d’un fichier.

  1. Sélectionnez Fichier comme type de source de données d'entrée.

  2. Recherchez yelp_labelled.txt. Une fois que vous avez sélectionné votre ensemble de données, un aperçu de vos données apparaît dans la section Aperçu des données. Étant donné que votre ensemble de données n'a pas d'en-tête, les en-têtes sont générés automatiquement ("col0" et "col1").

  3. Sous Colonne pour prédire (Étiquette), select "col1". L’ Étiquette est ce que vous prévoyez, qui dans ce cas correspond au sentiment trouvé dans la deuxième colonne ("col1") du jeu de données.

  4. Les colonnes utilisées pour prédire le libellé sont appelées Caractéristiques. Toutes les colonnes du jeu de données en plus de l'étiquette sont automatiquement sélectionnées en tant qu'entités. Dans ce cas, la colonne de commentaire de révision ("col0") est la colonne Fonctionnalité. Vous pouvez mettre à jour les colonnes de fonctionnalité et modifier d'autres options de chargement de données dans Options de données avancées, mais cela n'est pas nécessaire pour cet exemple.

Étape de données du générateur de modèles

Après avoir ajouté vos données, passez à l'étape Entraîner.

Continuer