ML.NET으로 생산성을 개선한 Williams Mullen
제품 및 서비스
ML.NET
Azure
Visual Studio
SQL Server
Office 365
업계
법률 업무/전문 서비스
조직 규모
중간(직원 100~1,000명)
국가/지역
미국
기업법, 소송, 금융 및 부동산을 전문으로 하는 풀 서비스 기업 로펌인 Williams Mullen은 변호사가 수백만 건의 문서를 샅샅이 살펴보는 것이 고객을 위해 실제로 일하는 데 시간이 걸린다는 것을 깨달았습니다. 이로 인해 회사는 기계 학습 솔루션을 연구하게 되었습니다. 많은 문제가 실제로 분류 문제라는 것을 깨닫고 ML.NET으로 더 자세히 살펴보기로 결정했습니다.
비즈니스 문제
기술 분야에서 변호사는 주로 Word와 Outlook의 두 가지 응용 프로그램을 사용합니다. 이는 문서 관리 시스템에 배치되는 Word 문서, PDF 및 전자 메일 형태의 상당히 많은 양의 비정형 데이터로 번환되며, 여기에는 수십 년 분량의 디지털 정보가 포함될 수 있습니다. 이는 변호사가 정보가 종종 누락되거나 부정확하거나 오래된 문서 메타데이터를 검색하여 이러한 문서에서 특정 정보를 찾고자 할 때 문제가 됩니다.
이 수동 프로세스로 인해 William Mullen은 수백만 개의 문서에 문서를 쉽게 검색할 수 없는 문제가 있어 변호사 시간을 낭비하고 수익 손실에 기여한다는 사실을 발견했습니다.
왜 ML.NET를 사용해야 하나요?
법률 산업은 기술 선택과 관련하여 오히려 Microsoft 중심적입니다. Williams Mullen도 다르지 않습니다. 그들의 개발자는 큰 C# 사용자입니다. 그들은 ML.NET이 발표된 시기에 기계 학습 솔루션을 조사하기 시작했기 때문에 분류 시나리오에 ML.NET을 사용하기 시작하는 것이 자연스러운 일이었습니다.
ML.NET의 영향
연구를 통해 William Mullen은 시스템에 있는 문서의 20%(예: 수백만 개의 문서)에 문서를 쉽게 검색할 수 없는 문제가 있어 변호사 시간을 낭비하고 수익 손실을 초래한다는 사실을 발견했습니다. ML.NET을 사용하지 않았다면 이 회사는 프로젝트를 전혀 맡지 않았을 수도 있고, 이러한 문제를 수동으로 해결하기 위해 실제 작업으로부터 사람들을 끌어내야 했을 수도 있으며, 이로 인해 프로젝트에 수십만 달러의 비용이 발생할 수도 있었습니다.
ML.NET을 사용하면 모델을 훈련시킨 다음 코드 내에서 즉시 테스트할 수 있습니다. 모든 도구가 한 곳에 함께 있기 때문에 새로운 변경 사항을 더 빨리 전달할 수 있습니다."
솔루션 아키텍처
ML.NET을 사용하여 애플리케이션 만들기
아키텍처는 단지 두 개의 .NET Core 콘솔 애플리케이션과 데이터베이스입니다. 하나의 콘솔 앱이 학습 데이터를 끌어오고, 데이터를 준비하고, 모델을 학습합니다. 다른 콘솔 앱은 모델을 실행하는 데 필요한 데이터를 끌어오고, 데이터를 분류하기 위해 모델을 로드한 다음, 데이터베이스에 데이터를 다시 넣기 전에 제거했습니다.
이 프로젝트의 기쁨은 진행이 매우 간단해서 더 복잡한 것이 필요하지 않았다는 것입니다. 즉 교육 앱은 주석, 로깅 등이 포함된 총 200줄의 코드였습니다. 모델을 실행하는 앱은 훨씬 더 작았습니다. 전체의 가장 큰 부분은 13줄의 코드로 들어오는 변환 코드였습니다."
데이터 처리
약 2백만 개의 문서인 교육 데이터는 법률 회사의 문서 관리 시스템에서 가져왔습니다. 데이터 자체에는 정리되고 있는 필드에 따라 문서, 제목, 작성자, 받는 사람(전자 메일용) 및 기타 메타데이터 비트의 콘텐츠가 포함됩니다.
데이터 변환 및 기계 학습 알고리즘
Williams Mullen은 몇 가지 다른 응용 프로그램에 대해 여러 가지 다른 데이터 변환 및 교육 알고리즘을 시도했습니다. 데이터 변환에는 NormalizeText, TokenizeWords, RemoveDefaultStopWords, OneHotHashEncoding, FeaturizeText, ExtractWordEmbeddings 및 ProduceNGrams가 포함됩니다. 학습을 위해서는 주로 StochasticDualCoordinateAscent 및 OneVersusAll 분류 알고리즘을 사용합니다.
ML.NET의 데이터 변환 및 알고리즘을 사용하여 기계 학습 솔루션을 만든 Williams Mullen은 수백만 개의 문서를 더 쉽게 검색할 수 있게 했으며, 이는 결과적으로 변호사의 생산성을 높이는 데 도움이 되었습니다.
시작할 준비가 되셨나요?
단계별 자습서는 컴퓨터에서 ML.NET을(를) 실행하는 데 도움이 될 것입니다.