Power BI определяет ключевых влиятельных лиц с помощью ML.NET
Клиент
Power BI (Microsoft)
Продукты и службы
ML.NET
Промышленность
Технологии
Размер организации
Большой (1000+ сотрудников)
Страна/регион
США
Power BI — это решение для бизнес-аналитики, разработанное Microsoft, которое позволяет пользователям визуализировать свои данные и обмениваться информацией в своих организациях или встраивать их в свои приложения. Power BI предоставляет различные средства визуализации, такие как диаграммы, графики и датчики, которые помогают пользователям создавать отчеты на основе своих данных. В последнее время Power BI использует машинное обучение для упрощения сложных задач для своих пользователей, чтобы дать возможность всем в организациях использовать возможности ИИ для принятия более эффективных решений. В феврале 2019 года Power BI представила свою первую визуализацию на основе ИИ, Key Influencers, которая за кулисами использует ML.NET для обоснования данных и поверхностных идей естественным образом.
Бизнес-проблема
Для любого бизнеса определение и понимание ключевых факторов влияния (основных движущих сил эффективности и результатов бизнеса) и сегментов клиентов имеет решающее значение для принятия стратегических бизнес-решений, определения приоритетов изменений в бизнесе и получения конкурентного преимущества. Анализ ключевых факторов влияния может выявить, какие факторы оказывают наибольшее влияние на эффективность бизнеса, и может помочь бизнесу ответить на такие вопросы, как «какие факторы заставляют клиентов оставлять негативные отзывы об этой услуге?» или «что влияет на рост цен на жилье?» "
Однако этот процесс анализа данных для ключевых влиятельных лиц и сегментации клиентов требует много времени, усилий и опыта; это часто включает в себя кодирование нескольких функций, выборку, тесты значимости и ранжирование результатов. Таким образом, Power BI обратилась к решению для машинного обучения, чтобы они могли позволить своим пользователям ускорить процесс получения значимой информации и иметь возможность выполнять статистический анализ, не тратя время на написание сложного кода.
Ключевые авторитетные специалисты и ML.NET
Power BI создала визуализацию Key Influencers как решение для машинного обучения, позволяющее предприятиям использовать ИИ, чтобы они могли анализировать свои данные за меньшее время и быстрее принимать ключевые бизнес-решения. Другими словами, пользователи могут использовать Key Influencers, чтобы тратить меньше времени на анализ данных и тратить больше времени на действия, полученные в результате визуализации ИИ.
Как только пользователь выбирает ключевой показатель эффективности (KPI) для анализа (например, коэффициент удержания, рейтинг кликов и т. д.), визуализация ключевых факторов влияния использует алгоритмы машинного обучения, предоставляемые ML.NET, чтобы выяснить, что важнее всего в ключевых показателях, а также найти интересные сегменты для дальнейшего изучения. Ключевые IT-эксперты анализируют данные пользователя, ранжируют важные факторы, сравнивают относительную важность этих факторов и отображают их в качестве ключевых влиятельных лиц и основных сегментов как для категориальных, так и для числовых показателей.
Архитектура решения
Power BI поставляется в нескольких формах. Визуализация ключевых влиятельных лиц поддерживается в формах для мобильных устройств, настольных компьютеров, общих служб и платных служб.
Когда пользователь добавляет столбцы в визуальный элемент Key Influencer, запускается поток, в котором обучающие данные отправляются в службы Analysis Services (ядро базы данных Power BI). Службы Analysis Services запускают ML.NET для обучения моделей машинного обучения, и возвращают результаты. Таким образом, модель обучается всякий раз, когда пользователь обновляет выбранные функции. Общая цель состоит в том, чтобы выполнить анализ за несколько секунд, обеспечивая интерактивный опыт.
Ниже показан общий поток:
ML.NET используется как библиотека .NET Framework локально (в Power BI Desktop) или в облаке (в службе Power BI). Наборы данных хранятся в Power BI в собственном двоичном формате Analysis Services.
Ключевые факторы влияния категории
Категориальные метрики могут включать в себя такие вещи, как рейтинги или рейтинги. В приведенном ниже примере метрикой является рейтинг, а визуализация определила, что роль в организации — потребитель – это главный фактор, влияющий на вероятность низкого рейтинга. Визуализация отображает дополнительную информацию на правой панели, например:
- 14.93 % клиентов поставили низкую оценку.
- В среднем все остальные роли дают низкую оценку в 5,78% случаев.
- Потребители в 2,57 раза чаще ставят низкую оценку по сравнению со всеми другими ролями.
Ключевые авторитетные специалисты используют ML.NET для запуска логистической регрессии для категориальные признаки, используя кодирование One-hot, Замену отсутствующего значения, а также преобразования данных нормализации "Mean/Variance" и алгоритм логистической регрессии L-BFGS. В этом случае алгоритм ищет закономерности в данных и ищет, чем клиенты, поставившие низкую оценку, могут отличаться от клиентов, поставивших высокую оценку. Например, может оказаться, что клиенты с большим количеством запросов в службу поддержки дают более высокий процент низких оценок, чем клиенты с небольшим количеством запросов в службу поддержки или без них.
Числовые ключевые факторы влияния
Числовые показатели могут включать в себя такие вещи, как цена или количество продаж. В приведенном ниже примере метрикой является цена дома, и визуализация определила, что отличное качество кухни является главным фактором, влияющим на вероятность повышения цены дома.
Ключевые влиятельные лица используют ML.NET для запуска линейной регрессии, используя те же преобразования данных, что и категориальные ключевые влиятельные лица, и используя алгоритм регрессии SDCA. В этом случае алгоритм смотрит, как меняется цена дома, на основе объясняющих факторов, таких как количество спален или площадь в квадратных футах. В этом случае рассматривается влияние отличной кухни на цену дома.
Расчет верхних сегментов
Основные сегменты показывают основные группы, которые вносят вклад в выбранное значение показателя. Сегмент состоит из комбинации значений. Например, сегмент ниже — это люди, которые являются потребителями или администраторами, у которых есть более 4 обращений в службу поддержки и которые являются клиентами более 29 месяцев. 74,3% клиентов в этом сегменте дали низкую оценку по сравнению со средним клиентом, который дал низкую оценку в 11,7% случаев.
Top Segments использует ML.NET для запуска дерева решений, используя алгоритмы Fast tree (категориальные и числовые) для поиска интересных подгрупп. Цель состоит в том, чтобы получить подгруппу точек данных с относительно высокими показателями интереса. Это могут быть клиенты с низким рейтингом или дома с высокими ценами.
Алгоритм берет каждый объясняющий фактор и пытается выяснить, какой фактор обеспечивает наилучшее разделение. После разделения дерево решений берет подгруппу данных и определяет следующее лучшее разделение для этих данных. В данном случае подгруппа — это клиенты, прокомментировавшие безопасность. После каждого разделения он также рассматривает, достаточно ли точек данных для этой группы, чтобы быть достаточно репрезентативной, чтобы вывести закономерность, или это аномалия в данных, а не реальный сегмент. После того, как дерево решений завершит работу, оно берет все разбиения, такие как комментарии по безопасности и крупные предприятия, и создает сегменты.
Power BI использует ML.NET, чтобы помочь своим клиентам легко определить ключевых влиятельных лиц в их бизнесе, экономя их время и усилия и позволяя им сосредоточиться на внесении изменений и бизнес-решений на основе аналитики и информации, полученной с помощью моделей ML.NET.
Готовы приступить?
Наше пошаговое руководство поможет вам запустить ML.NET на вашем компьютере.