Tutorial de ML.NET: comience en 10 minutos

Entrenar el modelo

Ahora, entrenará el modelo con el set de datos yelp_labelled.txt.

Model Builder evalúa muchos modelos con distintos algoritmos y configuraciones en función de la cantidad de tiempo de entrenamiento proporcionado para compilar el modelo de mejor rendimiento.

  1. Cambiar el Tiempo de entrenamiento, que es la cantidad de tiempo que le gustaría que Model Builder explore varios modelos, a 60 segundos (puede intentar aumentar este número si no se encuentra ningún modelo después del entrenamiento). Tenga en cuenta que, para conjuntos de datos más grandes, el tiempo de entrenamiento será más largo. Model Builder ajusta automáticamente el tiempo de entrenamiento en función del tamaño del conjunto de datos.

  2. Puede actualizar la métrica de optimización y los algoritmos usados en Opciones avanzadas de entrenamiento , pero no es necesario para este ejemplo.

  3. Seleccione Iniciar el entrenamiento para iniciar el proceso de entrenamiento. Una vez iniciado el entrenamiento, puede ver el tiempo restante.

  4. Entrenamiento de Model Builder

Resultados del entrenamiento

Una vez finalizado el entrenamiento, puede ver un resumen de los resultados del entrenamiento.

Entrenamiento Model Builder realizado

  • Best MacroAccuracy : muestra la precisión del mejor modelo que Model Builder encuentra. Una mayor precisión significa que el modelo predijo más correctamente en los datos de prueba.
  • Mejor modelo - Esto muestra qué algoritmo realizó mejor durante la exploración de Model Builder.
  • Tiempo de entrenamiento: esto muestra la cantidad total de tiempo dedicado a entrenar o explorar modelos.
  • Modelos explorados (total) : muestra el número total de modelos explorados por Model Builder en el período de tiempo especificado.
  • Código subyacente generado : se programan los nombres de los archivos generados para ayudar a consumir el modelo o entrenar un nuevo modelo.

Si lo desea, puede ver más información sobre la sesión de entrenamiento en la ventana Machine Learning Salida.

Una vez finalizado el entrenamiento del modelo, vaya al paso Evaluar.

En el terminal, ejecute el siguiente comando (en la carpeta myMLApp):

Command prompt
mlnet classification --dataset "yelp_labelled.txt" --label-col 1 --has-header false --name SentimentModel  --train-time 60

¿Qué significan estos comandos?

El comando mlnet classification se ejecuta ML.NET con AutoML para explorar muchas iteraciones de modelos de clasificación en la cantidad determinada de tiempo de entrenamiento con distintas combinaciones de transformaciones de datos, algoritmos y opciones de algoritmo y, a continuación, elige el modelo de mayor rendimiento.

  • --dataset: Ha elegido yelp_labelled.txt como conjunto de datos (internamente, la CLI dividirá el conjunto de datos en conjuntos de datos de entrenamiento y de prueba).
  • --label-col: Debe especificar la columna objetivo que desea predecir (o la etiqueta). En este caso, quiere predecir el sentimiento de la segunda columna (las columnas con índice cero significan que es la columna "1").
  • --has-header: Utilice esta opción para especificar si el conjunto de datos tiene un encabezado. En este caso, el conjunto de datos no tiene encabezado por lo que es falso.
  • --name: Utilice esta opción para proporcionar un nombre para su modelo de aprendizaje automático y los activos relacionados. En este caso, todos los activos asociados a este modelo de aprendizaje automático tendrán SentimentModel en el nombre.
  • --train-time: También debe especificar la cantidad de tiempo que desea que la CLI de ML.NET explore diferentes modelos. En este caso, 60 segundos (puede intentar aumentar este número si no se encuentran modelos después del entrenamiento). Tenga en cuenta que para conjuntos de datos más grandes, debe establecer un tiempo de entrenamiento más largo.

Progreso

Mientras la CLI de ML.NET está explorando diferentes modelos, muestra los siguientes datos:

  • Iniciar el entrenamiento: en esta sección se muestra cada iteración del modelo, incluido el instructor (algoritmo) usado y las métricas de evaluación para esa iteración.
  • Tiempo restante este y la barra de progreso indicará cuánto tiempo queda en el proceso de entrenamiento en segundos.
  • Mejor algoritmo: muestra qué algoritmo ha funcionado mejor hasta ahora.
  • Mejor puntuación: esto muestra el rendimiento del mejor modelo hasta ahora. Una mayor precisión significa que el modelo ha predicho con mayor exactitud en los datos de prueba.

Si lo desea, puede ver más información sobre la sesión de entrenamiento en el archivo de registro generado por la CLI.

Continuar