Power BI 使用 ML.NET 識別關鍵影響因素
Power BI 是 Microsoft 所開發的商務分析解決方案,可讓使用者視覺化其資料,並在其組織中共用見解,或將其內嵌到應用程式中。Power BI 提供各種視覺化效果,例如圖表、圖形和量測計,以協助使用者從其資料建立報表。最近,Power BI 已利用機器學習功能為其使用者簡化複雜工作,以讓組織中的所有人都能利用 AI,以提供更好的決策。在 2019 年 2 月,Power BI 預覽其第一個 AI 提供的視覺效果,關鍵意見領袖,它使用 ML.NET 在幕後以自然的方式推理資料並讓深入解析浮出。
商務問題
對於任何企業而言,識別和理解關鍵影響因素 (企業效能和成果的主要驅動因素) 以及客戶區隔對於制定策略性業務決策、確定企業變革的優先順序以及獲取競爭優勢至關重要。分析關鍵影響因素可以顯示哪些因素對企業效能的影響最大,並可以有助於企業回答諸如「哪些因素會導致客戶對這項服務留下負面評論?」或「什麼會影響房價上漲?」等問題。
不過,對關鍵意見領袖和客戶分割進行資料分析,會花費大量的時間、工作量及專業技能;這通常涉及為多個函式、取樣、重要測試和排名結果進行編碼。因此,Power BI 已轉變為機器學習解決方案,讓他們可以讓其使用者加快取得有意義見解的流程,以及在不需要花費時間編寫複雜程式碼的情況下,進行統計分析。
關鍵影響因數和 ML.NET
Power BI 建立了可讓企業利用 AI 做為機器學習解決方案的關鍵影響因素視覺效果,以便他們以較少的時間分析資料,並更快速地制定關鍵商務決策。換句話說,使用者可使用關鍵影響因數來花費較少的分析資料時間,而對從 AI 視覺效果收集的深入解說花費更多採取行動的時間。
當使用者挑選了要分析的關鍵效能指標 (KPI) (例如保留率、點擊率等等),關鍵影響因素視覺效果會使用 ML.NET 所提供的機器學習演算法以找出驅動計量的最重要因素,並找出值得注意的區段以供進一步調查。關鍵影響因數會分析使用者的資料、排名重要的因素、為這些因素的相關重要性進行對比,並將它們顯示為類別和數值計量的關鍵影響因素與最上層區段。
解決方案架構
Power BI 會以多種形式提供。行動裝置、桌面、共用服務及進階服務表單都支援關鍵影響因數視覺效果。
當使用者將資料行新增至 [關鍵影響因素] 視覺效果時,會觸發於其中會將訓練資料傳送至 Analysis Services (Power BI 背後的資料庫引擎) 的流程。Analysis Services 執行 ML.NET 來訓練機器學習模型,且結果會傳回。因此,每當使用者更新選取的功能時,就會訓練模型。整體目標是在幾秒內執行分析,以實現互動式體驗。
整體流程顯示如下:
ML.NET 會作為 .NET Framework 程式庫形式取用,並且執行內部部署 (如果用於 Power BI Desktop) 或雲端 (如果用於 Power BI 服務)。Power BI 中的資料集會以 Analysis Services 原生的二進位格式儲存。
可分類的主要意見領袖
分類計量可以包含評分或排名等項目。在下列範例中,計量為 [評分],且視覺效果判定 在組織中的角色是消費者 是影響低評等可能性的最單一因素。視覺效果會在右窗格中顯示其他資訊,例如:
- 14.93% 的 消費者會給出低分。
- 平均來說,5.78% 的時間,所有其他角色會給予低分。
- 相較於所有其他角色,消費者提供較低分數的可能性是其他人的 2.57 倍。
關鍵影響因數使用 ML.NET 對分類計量執行羅吉斯迴歸,會使用 單一熱編碼、取代遺漏的值,以及正常化平均變異數資料轉換和 L-BFGS 邏輯迴歸演算法。在此情況下,演算法會搜尋資料中的模式,並尋找給出低評分的客戶和給出高評分的客戶之間有何差異。結果可能會發現,例如,和有較少或沒有支援票證的客戶相比,有較多支援票證的客戶給出低評分的百分比較高。
數值關鍵意見領袖
數值計量可能包含價格或銷售數目等事物。在下面的範例中,計量指房屋價格,而且視覺效果判定廚房品質非常優異,是影響房屋價格上漲可能性的首要單一因素。
關鍵影響因數使用 ML.NET 執行線性迴歸 (使用與類別關鍵影響因素相同的資料轉換,並使用 SDCA 迴歸演算法)。在此情況下,演算法會依據說明性因數 (例如房間或平方英尺的數目) 查看房屋價格的變更方式。還會看看具有出色廚房對房屋價格的影響。
正在計算前幾個區段
熱門區段會顯示構成選取之計量值的熱門群組。區段是由值組合組成。例如,以下區段是消費者或系統管理員的人員,其為客戶或系統管理員,他們的支援票證超過 4 個,且已是客戶超過 29 個月。與平均客戶相比,此區段中 74.3% 的客戶給與了較低的評分 (平均客戶當時的評分為 11.7%)。
頂端區段使用 ML.NET 來執行決策樹,使用快速樹狀結構演算法 (分類和數值),以尋找有趣的子群組。目標是最終有一個資料點的子群組,該點在相關計量中相當高。這可能是低評分或高價房屋的客戶。
演算法會採用每個說明因素,並嘗試讓哪一個因素提供最佳分割。在決策樹進行分割之後,它會接受資料的子群組,並判斷該資料的下一個最佳分割。在此案例中,子群組是註解安全性的客戶。每次分割之後,它也會考慮它是否有足夠的資料點,讓此群組有足夠的代表性來推斷模式,或者它是否為資料中的異常狀況,而不是實際區隔。當決策樹狀結構完成運作之後,它會接受所有分割,例如安全性註解和大型企業,並建立區隔。
Power BI 使用 ML.NET 來協助他們的客戶輕鬆識別其企業中的關鍵影響因素,讓他們節省時間及精力,並讓他們可專注於根據從 ML.NET 模型產生的分析及深入解析做出變更及商務決策。
準備開始了嗎?
我們的逐步教學課程可協助您讓 ML.NET 在電腦上執行。