Tutorial do ML.NET: comece a usar em 10 minutos

Treinar seu modelo

Agora, você treinará seu modelo com o conjunto de dados yelp_labelled.txt.

O Model Builder avalia muitos modelos com configurações e algoritmos variados com base na quantidade de tempo de treinamento fornecido para criar o modelo com melhor desempenho.

  1. Altere o Tempo para treinar, que é a quantidade de tempo que você gostaria que o Model Builder explorasse vários modelos, para 60 segundos (você pode tentar aumentar esse número se nenhum modelo for encontrado após o treinamento). Observe que para os conjuntos de dados maiores, o tempo de treinamento será maior. O Model Builder ajusta automaticamente o tempo de treinamento com base no tamanho do conjunto de dados.

  2. Você pode atualizar a métrica de otimização e os algoritmos usados em Opções de treinamento avançadas, mas isso não é necessário para esse exemplo.

  3. Selecione inciar treinamento para iniciar o processo de treinamento. Depois que o treinamento for iniciado, você poderá ver o tempo restante.

  4. Treinamento do Model Builder

Resultados do treinamento

Quando o treinamento for concluído, você poderá ver um resumo dos resultados de treinamento.

Treinamento do Model Builder Concluído

  • Best MacroAccuracy - Mostra a precisão do melhor modelo encontrado pelo Model Builder. Maior precisão significa que o modelo previu mais corretamente nos dados de teste.
  • Melhor modelo - isto mostra qual algoritmo teve o melhor desempenho durante a exploração do Model Builder.
  • Tempo de treinamento – Isso mostra a quantidade total de tempo gasto no treinamento/exploração de modelos.
  • Modelos explorados (total) - isto mostra o número total de modelos explorados pelo Model Builder em um determinado período de tempo.
  • Generated code-behind - Mostra os nomes dos arquivos gerados para ajudar a consumir o modelo ou treinar um novo modelo.

Se desejar, você pode exibir mais informações sobre a sessão de treinamento na janela de saída de Machine Learning.

Após a conclusão do treinamento do modelo, vá para a etapa Avaliar.

No seu terminal, execute o seguinte comando (em sua myMLApppasta):

Command prompt
mlnet classification --dataset "yelp_labelled.txt" --label-col 1 --has-header false --name SentimentModel  --train-time 60

O que esses comandos significam?

O comando mlnet classification executa o ML.NET com AutoML para explorar muitas iterações de modelos de classificação no tempo de treinamento especificado com combinações variáveis de transformações de dados, algoritmos e opções de algoritmo e, em seguida, escolhe o modelo com o maior desempenho.

  • --dataset: Você escolheu yelp_labelled.txt como o conjunto de dados (internamente, a CLI dividirá o conjunto de dados em conjuntos de dados de treinamento e teste).
  • --label-col: Especifique a coluna de destino que deseja prever (ou o rótulo). Nesse caso, você deseja prever o sentimento na segunda coluna (colunas indexadas com zero significa que esta é a coluna "1").
  • --has-header: Use esta opção para especificar se o conjunto de dados tem um cabeçalho. Nesse caso, o conjunto de dados não tem um cabeçalho, portanto, ele é falso.
  • --name: Use esta opção para fornecer um nome para seu modelo de machine learning e ativos relacionados. Neste caso, todos os ativos associados a este modelo de machine learning terão SentimentModel no nome.
  • --train-time: Você também deve especificar o período de tempo que você gostaria que a CLI do ML.NET explorasse diferentes modelos. Nesse caso, 60 segundos (você pode tentar aumentar este número se nenhum modelo for encontrado após o treinamento). Observe que para conjuntos de dados maiores, você deve definir um tempo de treinamento mais longo.

Andamento

Enquanto a CLI do ML.NET está explorando modelos diferentes, ela exibe os seguintes dados:

  • Iniciar treinamento - Esta seção mostra cada iteração de modelo, incluindo o treinador (algoritmo) usado e as métricas de avaliação para essa iteração.
  • Tempo restante – Isso e a barra de progresso indicarão quanto tempo resta no processo de treinamento em segundos.
  • Melhor algoritmo-mostra qual algoritmo executou melhor até agora.
  • Melhor pontuação – Isso mostra o desempenho do melhor modelo até o momento. Maior precisão significa que o modelo previu mais corretamente nos dados de teste.

Se desejar, você pode exibir mais informações sobre a sessão de treinamento no arquivo de log gerado pela CLI.

Continuar