Power BI identifie les influenceurs clés à l'aide de ML.NET
Client
Power BI (Microsoft)
Produits & services
ML.NET
Secteur
Technologie
Taille de l’organisation
Grand (1000+ employés)
Pays/région
États-Unis
Power BI est une solution d'analyse commerciale développée par Microsoft qui permet aux utilisateurs de visualiser leurs données et de partager des informations au sein de leurs organisations ou de les intégrer dans leurs applications. Power BI fournit une variété de visualisations, telles que des graphiques, des graphiques et des jauges, pour aider les utilisateurs à créer des rapports à partir de leurs données. Récemment, Power BI a utilisé l'apprentissage automatique pour simplifier les tâches complexes de ses utilisateurs afin de permettre à chacun dans les organisations d'exploiter la puissance de l'IA pour prendre de meilleures décisions. En février 2019, Power BI a présenté en avant-première sa première visualisation basée sur l'IA, Key Influencers, qui utilise ML.NET en arrière-plan pour raisonner sur les données et faire émerger des insights de manière naturelle.
Problème d’entreprise
Pour toute entreprise, l’identification et la compréhension des influenceurs clés (principaux facteurs de performances et de résultats opérationnels) et des segments de clients sont essentiels pour prendre des décisions stratégiques, hiérarchiser les modifications apportées à l’entreprise et bénéficier d’un avantage concurrentiel. L’analyse des influenceurs clés peut révéler quels facteurs ont le plus d’impact sur les performances de l’entreprise et peut aider une entreprise à répondre à des questions telles que "quels facteurs amènent les clients à laisser des avis négatifs sur ce service ?" ou "qu’est-ce qui influence les prix des maisons pour augmenter ?"»
Toutefois, ce processus d’analyse des données pour les influenceurs clés et la segmentation des clients prend beaucoup de temps, d’efforts et d’expertise ; Il implique souvent le codage de plusieurs fonctions, l’échantillonnage, les tests de précision et le classement des résultats. Par conséquent, Power BI tourné vers une solution machine learning pour permettre à ses utilisateurs d’accélérer le processus d’obtention d’Insights significatives et de pouvoir effectuer une analyse statistique sans devoir consacrer du temps à écrire du code complexe.
Influenceurs clés et ML.NET
Power BI a créé la visualisation Key Influencers en tant que solution d'apprentissage automatique pour permettre aux entreprises de tirer parti de l'IA afin qu'elles puissent analyser leurs données en moins de temps et prendre des décisions commerciales clés plus rapidement. En d'autres termes, les utilisateurs peuvent utiliser les influenceurs clés pour passer moins de temps à analyser les données et passer plus de temps à agir sur les informations recueillies à partir de la visualisation de l'IA.
Une fois qu’un utilisateur choisit un indicateur de performance clé (KPI) à analyser (par exemple, taux de rétention, taux de clics, etc.), la visualisation influenceurs clés utilise des algorithmes d’apprentissage automatique fournis par ML.NET pour déterminer ce qui est le plus important dans la conduite des métriques, ainsi que pour rechercher des segments intéressants pour une investigation plus approfondie. Les influenceurs clés analysent les données d’un utilisateur, classent les facteurs qui comptent, comparent l’importance relative de ces facteurs et les affichent comme influenceurs clés et segments principaux pour les métriques catégorielles et numériques.
Architecture de la solution
Power BI est expédié sous plusieurs formes. La visualisation des influenceurs clés est prise en charge dans les formulaires de service mobile, de bureau, partagé et Premium.
Lorsqu’un utilisateur ajoute des colonnes au visuel Influenceur de clé, un flux est déclenché dans lequel les données d’entraînement sont envoyées à Analysis Services (le moteur de base de données derrière Power BI). Analysis Services exécute ML.NET pour entraîner des modèles Machine Learning, et les résultats sont retournés. Par conséquent, le modèle est formé chaque fois qu’un utilisateur met à jour les fonctionnalités sélectionnées. L’objectif global est d’effectuer l’analyse en quelques secondes, ce qui permet une expérience interactive.
Le flux global est illustré ci-dessous :
ML.NET est consommé en tant que bibliothèque .NET Framework et s’exécute localement (s’il est utilisé dans Power BI Desktop) ou dans le cloud (s’il est utilisé dans le service Power BI). Les jeux de données dans Power BI sont stockés dans un format binaire natif pour Analysis Services.
Influenceurs clés catégoriques
Les métriques catégorielles peuvent inclure des éléments tels que des notes ou des classements. Dans l'exemple ci-dessous, l’indicateur de performance est Note, et la visualisation a déterminé que Le rôle dans l'organisation est consommateur est le principal facteur qui influence la probabilité d'une note faible. La visualisation affiche des informations supplémentaires dans le volet de droite, telles que :
- 14,93 % des consommateurs donnent une note faible.
- En moyenne, tous les autres rôles donnent un score faible 5,78 % du temps.
- les consommateurs sont plus de 2,57 fois plus susceptibles de donner un faible score par rapport à tous les autres rôles.
Key Influencers utilise ML.NET pour exécuter une régression logistique pour les métriques catégorielles, en utilisant le Codage à chaud, Remplacer la valeur manquante et Normaliser la variance moyenne les transformations de données et les Algorithme de régression logistique L-BFGS. Dans ce cas, l'algorithme recherche des modèles dans les données et examine en quoi les clients qui ont donné une note faible peuvent différer des clients qui ont donné une note élevée. Il peut s'avérer, par exemple, que les clients avec plus de tickets d'assistance donnent un pourcentage plus élevé d'évaluations faibles que les clients avec peu ou pas de tickets d'assistance.
Influenceurs clés numériques
Les mesures numériques peuvent inclure des éléments tels que le prix ou les chiffres de vente. Dans l'exemple ci-dessous, la mesure est le prix de la maison et la visualisation a déterminé que la qualité de la cuisine est excellente est le principal facteur qui influence la probabilité d'une augmentation du prix de la maison.
Les influenceurs clés utilisent ML.NET pour exécuter une régression linéaire, en utilisant les mêmes transformations de données que les influenceurs clés catégorielles et en utilisant l’algorithme régression SDCA. Dans ce cas, l’algorithme examine la façon dont le prix de la maison change en fonction de facteurs explicatifs, tels que le nombre de chambres ou de mètres carrés. Dans ce cas, il examine l’impact d’une excellente cuisine sur le prix de la maison.
Calcul des principaux segments
Les principaux segments montrent les principaux groupes qui contribuent à la valeur de métrique sélectionnée. Un segment est constitué d’une combinaison de valeurs. Par exemple, le segment ci-dessous concerne les personnes qui sont des consommateurs ou des administrateurs, qui ont plus de 4 tickets de support et qui ont été clients pendant plus de 29 mois. 74,3 % des clients de ce segment ont donné une évaluation faible, par rapport au client moyen, ce qui a donné une évaluation faible de 11,7 % du temps.
Top Segments utilise ML.NET pour exécuter un arbre de décision, à l'aide d'algorithmes Fast tree (catégoriels et numériques), afin de trouver des sous-groupes intéressants. L'objectif est de se retrouver avec un sous-groupe de points de données qui est relativement élevé dans la métrique d'intérêt. Il peut s'agir de clients avec de faibles notes ou de maisons avec des prix élevés.
L’algorithme prend chaque facteur explicatif et tente de déterminer quel facteur lui donne le meilleur fractionnement. Une fois que l’arbre de décision effectue un fractionnement, il prend le sous-groupe de données et détermine le fractionnement le mieux adapté à ces données. Dans ce cas, le sous-groupe est celui des clients qui ont commenté la sécurité. Après chaque fractionnement, il détermine également s’il a suffisamment de points de données pour que ce groupe soit suffisamment représentatif pour déduire un modèle ou s’il s’agit d’une anomalie dans les données et non d’un segment réel. Une fois l’exécution de l’arbre de décision terminée, il prend toutes les fractionnements, tels que les commentaires de sécurité et les grandes entreprises, et crée des segments.
Power BI utilise ML.NET pour aider leurs clients à identifier facilement les influenceurs clés dans leurs activités, ce qui leur permet de gagner du temps et des efforts, et de se concentrer sur la prise de modifications et de décisions métier basées sur les analyses et les insights générés à partir des modèles ML.NET.
Prêt à démarrer ?
Notre tutoriel étape par étape vous aidera à démarrer ML.NET sur votre ordinateur.