WilliamsMullen が ML.NET で生産性を向上
製品とサービス
ML.NET
Azure
Visual Studio
SQL Server
Office 365
業界
法律 / プロフェッショナル サービス
組織の規模
中規模 (従業員数 100-1000 名)
国/地域
アメリカ合衆国
企業法、訴訟、財務、不動産を専門とするフル サービスの企業法務会社、Williams Mullen は、弁護士が何百万ものドキュメントを探し回るのにかかる時間により実際にクライアントの仕事を行う時間が少なくなっていることに気づきました。それがきっかけで、会社は機械学習ソリューションを調査しました。多くの問題が本当に分類の問題であるということが判明したので、ML.NET をさらに探求してみることにしました。
ビジネスの問題
技術に関しては、弁護士は主に Word と Outlook の 2 つのアプリケーションを使用します。これは、数十年分のデジタル情報を含むドキュメント管理システムに、Word 文書、PDF、電子メールの形式で、非常に大量の非構造化データが保存されていることを意味します。これは、弁護士がこれらのドキュメント内の特定の情報を見つけたい場合の課題となります。つまり、欠落した、正しくない、あるいは古い情報のドキュメント メタデータを検索しなければなりません。
この手作業によるプロセスが原因で、William Mullen では何百万ものドキュメントで簡単に検索することができない問題が見つかりました。それにより、弁護士の時間を浪費し、収益の損失につながっていることに気づきました。
ML.NET を選ぶ理由
法律業界では、テクノロジの選択について、Microsoft 中心になっています。Williams Mullen も同様で、同社の開発者は C# を多用しています。彼らが機械学習ソリューションを検討し始めたのは、ML.NET が発表されたのと同時期だったため、分類シナリオに ML.NET を使い始めるのは自然な流れでした。
ML.NET の影響
調査を通して、William Mullen はシステム内のドキュメントの 20% (たとえば数百万のドキュメント) に、ドキュメントを簡単に検索できない問題があり、これによって弁護士は時間を浪費し、収益の損失につながっていることがわかりました。ML.NET がない場合は、同社はこのプロジェクトをまったく引き受けなかったか、あるいはこれらの問題を手作業で修正するために、実際の業務から人手を借りる必要がありました。その結果、プロジェクトに何十万ドルものコストがかかった可能性があります。
ML.NET を使用すると、モデルのトレーニング後、すぐにコード内でテストすることができます。すべてのツールが一箇所にあるため、新しい変更の発送が高速化されます。"
ソリューション アーキテクチャ
ML.NET を使用してアプリケーションを作成する
アーキテクチャは、2 つの .NET Core コンソール アプリケーションと 1 つのデータベースだけです。1 つのコンソール アプリがトレーニング データを取得し、データを準備し、モデルをトレーニングします。もう 1 つのコンソール アプリは、モデルに対して実行する必要のあるデータをプルダウンし、モデルを読み込んでデータを分類し、データをデータベースに戻す前にオフにしました。
このプロジェクトの喜びは、いかに簡単に始められるかであり、実際にそれほど複雑なものは必要ありませんでした。実際に、トレーニング アプリは、コメントやログなどを含めて、合計 200 行のコードであり、モデルを実行するためのアプリはさらに小さなものでした。最も大きな部分は変換コードで、13 行のコードで構成されていました。"
データ処理
約 200 万件のドキュメントから構成されるトレーニング データは、法律会社のドキュメント管理システムから取得されました。データ自体には、クリーンアップされるフィールドに応じて、ドキュメント、タイトル、作成者、受信者 (電子メール用)、およびその他のメタデータのビットからのコンテンツが含まれます。
データ変換と機械学習アルゴリズム
Williams Mullen は、いくつかの異なるアプリケーションで、いくつかの異なるデータ変換と学習アルゴリズムを試してみました。データ変換には、NormalizeText、TokenizeWords、RemoveDefaultStopWords、OneHotHashEncoding、FeaturizeText、ExtractWordEmbeddings、ProduceNGrams などがあります。学習には、主に StochasticDualCoordinateAscent と OneVersusAll の分類アルゴリズムを使用しています。
ML.NET のデータ変換とアルゴリズムを使用して機械学習ソリューションをビルドすることで、Williams Mullen は何百万もの文書を検索力を向上させました。その結果、弁護士の生産性を向上させることができました。
準備はできましたか?
このステップ バイ ステップ チュートリアルは、あなたのコンピューターで ML.NET を実行するのに役立ちます。