O Power BI identifica os principais influenciadores usando o ML.NET
Cliente
Power BI (Microsoft)
Produtos e serviços
ML.NET
Setor
Tecnologia
Tamanho da Organização
Grande (mais de 1000 funcionários)
País/região
EUA
Power BI é uma solução de análise de negócios desenvolvida pela Microsoft que permite que os usuários visualizem seus dados e compartilhem insights entre suas organizações ou os incorporem em seus aplicativos. Power BI fornece uma variedade de visualizações, como gráficos e medidores, para ajudar os usuários a criar relatórios a partir de seus dados. Recentemente, o Power BI tem usando o aprendizado de máquina para simplificar tarefas complexas para seus usuários, a fim de capacitar todos nas organizações a aproveitar o poder da IA para tomar melhores decisões. Em fevereiro de 2019, o Power BI pré-visualizou sua primeira visualização alimentada por IA, Influenciadores chave, que usa o ML.NET em segundo plano para raciocinar sobre os dados e obter insights de superfície de uma forma natural.
Problema de negócios
Para qualquer negócio, identificar e entender os principais influenciadores (os principais motivadores para o desempenho e os resultados dos negócios) e segmentos de clientes é fundamental para tomar decisões estratégicas de negócios, priorizar alterações nos negócios e obter vantagem competitiva. Analisar os principais influenciadores pode revelar quais fatores têm o maior impacto sobre o desempenho dos negócios e pode ajudar uma empresa a responder perguntas como "quais fatores levam os clientes a deixar revisões negativas sobre esse serviço?" ou "o que influencia os preços da casa a aumentar?"
No entanto, esse processo de análise de dados para os principais influenciadores e a segmentação de clientes exigem muito tempo, esforço e especialização; geralmente envolve codificação de várias funções, amostragem, testes de significância e resultados de classificação. Portanto, o Power BI recorreu a uma solução de machine learning para permitir que seus usuários acelerem o processo de obter insights significativos e poder fazer a análise estatística sem precisar gastar tempo escrevendo código complexo.
Influenciadores chave e ML.NET
O Power BI criou a visualização de principais influenciadores como uma solução de machine learning para permitir que as empresas aproveitem a IA para analisarem dados em menos tempo e tomar decisões comerciais mais rápidas. Em outras palavras, os usuários podem usar os principais influenciadores para passar menos tempo analisando dados e gastam mais tempo atuando nas informações coletadas da visualização da IA.
Após um usuário ter escolhido um KPI (indicador chave de desempenho) para analisar (por exemplo, taxa de retenção, taxa de cliques e assim por diante), a visualização dos Influenciadores Principais usa algoritmos de aprendizado de máquina fornecidos pelo ML.NET para descobrir o que é mais importante para impulsionar as métricas, além de encontrar segmentos interessantes para investigação futura. Os Principais Influenciadores analisam os dados de um usuário, classificam os fatores importantes, comparam a importância relativa desses fatores e os exibem como principais influenciadores e principais segmentos tanto para métricas categóricas quanto numéricas.
Arquitetura da solução
Power BI é enviado em vários formulários. A visualização dos Principais Influenciadores tem suporte nos formulários de serviço premium, área de trabalho, área de trabalho e dispositivos móveis.
Quando um usuário adiciona colunas ao visual dos principais influenciadores, um fluxo é acionado no qual os dados de treinamento são enviados para o Analysis Services (o mecanismo de banco de dados por trás do Power BI). O Analysis Services executa o ML.NET para treinar modelos de machine learning e os resultados são retornados. Portanto, o modelo é treinado sempre que um usuário atualiza os recursos selecionados. O objetivo geral é executar a análise em alguns segundos, possibilitando uma experiência interativa.
O fluxo geral é mostrado abaixo:
O ML.NET é consumido como uma biblioteca .NET Framework e é executado localmente (se usado no Power BI Desktop) ou na nuvem (se usado no serviço do Power BI). Os conjuntos de dados Power BI são armazenados em um formato binário nativo para Analysis Services.
Principais influenciadores categóricos
As métricas categóricas podem incluir itens como classificações ou pontuações. No exemplo abaixo, a métrica é Classificação e a visualização determinou que a Função na Organização é consumidor é o principal fator único que influencia a probabilidade de uma classificação baixa. A visualização exibe informações adicionais no painel direito, tais como:
- 14,93% dos consumidores dão uma pontuação baixa.
- Em média, todas as outras funções dão uma pontuação baixa 5,78% do tempo.
- Os consumidores têm 2,57 vezes mais chance de fornecer uma pontuação baixa em comparação com todas as outras funções.
Os Principais Influenciadores usam o ML.NET para executar a regressão logística para métricas categóricas, usando a codificação One-Hot, as transformações de dados Substituir valores ausentes e Normalizar variação média e o algoritmo de Regressão Logística L-BFGS. Nesse caso, o algoritmo busca padrões nos dados e examina como os clientes que deram uma classificação baixa podem ser diferentes dos clientes que deram uma classificação alta. Pode descobrir, por exemplo, que os clientes com mais tíquetes de suporte têm um percentual mais alto de classificações baixas do que os clientes com poucos ou nenhum tíquete de suporte.
Principais influenciadores numéricos
As métricas numéricas podem incluir itens como números de preço ou vendas. No exemplo a seguir, a métrica é Preço da Casa, e a visualização determinou que a Qualidade da Cozinha é Excelente é o principal fator único que influencia a probabilidade de um aumento no preço da casa.
Os Principais Influenciadores usam o ML.NET para executar a regressão linear, usando as mesmas transformações de dados que os principais influenciadores categóricos e usando o algoritmo de regressão do SDCA. Nesse caso, o algoritmo examina como o preço da casa muda com base em fatores explicativos, como o número de quartos ou a metragem quadrada. Nesse caso, ele examina o impacto que uma cozinha excelente exercerá sobre o preço da casa.
Calculando segmentos principais
Os principais segmentos mostram os principais grupos que contribuem para o valor de métrica selecionado. Um segmento é composto de uma combinação de valores. Por exemplo, o segmento abaixo são pessoas que são consumidores ou administradores, que têm mais de 4 tíquetes de suporte e que têm sido clientes por mais de 29 meses. 74,3% dos clientes neste segmento forneciam uma baixa classificação, em comparação com o cliente médio, que deu uma classificação baixa 11,7% do tempo.
Os principais segmentos usam ML.NET para executar uma árvore de decisão, usando algoritmos de Árvore rápida (categórica e numeric) para encontrar subgrupos interessantes. O objetivo é terminar com um subgrupo de pontos de dados que seja relativamente alto na métrica de interesse. Isso pode ser um cliente com classificações baixas ou casas com preços altos.
O algoritmo pega cada fator explicativo e tenta racionar qual fator lhe dá a melhor divisão. Após a árvore de decisão fazer uma divisão, ele pega o subgrupo de dados e determina a próxima melhor divisão para esses dados. Nesse caso, o subgrupo são os clientes que comentaram sobre a segurança. Após cada divisão, ele também considera se tem pontos de dados suficientes para que este grupo seja representativo o suficiente para inferir um padrão ou se é uma anomalia nos dados e não um segmento real. Depois que a árvore de decisão termina de funcionar, ele toma todas as divisões, tais como comentários de segurança e grandes empresas, e cria segmentos.
Power BI usa o ML.NET para ajudar seus clientes a identificar facilmente os principais influenciadores em seus negócios, economizando tempo e esforço e permitindo que eles se concentrem em fazer alterações e decisões de negócios com base na análise e nos insights produzidos a partir dos modelos ML.NET.
Pronto para começar?
Nosso tutorial passo-a-passo irá ajudá-lo a usar o ML.NET em seu computador.