Williams Mullen meningkatkan produktivitas dengan ML.NET
Pelanggan
Williams Mullen
Produk & jasa
ML.NET
Azure
Visual Studio
SQL Server
Office 365
Industri
Praktek Hukum/Layanan Profesional
Ukuran Organisasi
Sedang (100-1000 karyawan)
Negara/wilayah
AMERIKA SERIKAT
Williams Mullen, firma hukum perusahaan layanan lengkap yang berspesialisasi dalam hukum perusahaan, litigasi, keuangan, dan real estat, menyadari bahwa memiliki pengacara yang menyisir jutaan dokumen membutuhkan waktu untuk benar-benar melakukan pekerjaan untuk klien mereka. Hal ini menyebabkan perusahaan meneliti solusi pembelajaran mesin. Setelah mereka menyadari bahwa banyak masalah mereka benar-benar masalah klasifikasi, mereka memutuskan untuk menjelajahi lebih lanjut dengan ML.NET.
Masalah bisnis
Dalam hal teknologi, pengacara kebanyakan menggunakan dua aplikasi: Word dan Outlook. Ini berarti sejumlah besar data tidak terstruktur dalam bentuk dokumen Word, PDF, dan email yang ditempatkan ke dalam sistem manajemen dokumen, yang dapat berisi informasi digital bernilai puluhan tahun. Hal ini menjadi tantangan ketika pengacara ingin mencari informasi spesifik dalam dokumen-dokumen tersebut, yang mereka lakukan dengan mencari metadata dokumen di mana informasi sering hilang, salah, atau ketinggalan zaman.
Karena proses manual ini, William Mullen menemukan bahwa jutaan dokumen memiliki masalah yang mencegah dokumen mudah dicari, yang membuang-buang waktu pengacara dan berkontribusi pada hilangnya pendapatan.
Mengapa ML.NET?
Industri hukum lebih berfokus pada Microsoft dalam hal pilihan teknologi. Williams Mullen tidak berbeda; pengembang mereka adalah pengguna C# besar. Mereka mulai mencari solusi pembelajaran mesin pada waktu yang sama saat ML.NET diumumkan, sehingga sangat cocok untuk mulai menggunakan ML.NET untuk skenario klasifikasi mereka.
Dampak ML.NET
Melalui riset mereka, William Mullen menemukan bahwa 20% dokumen dalam sistem mereka (misalnya, jutaan dokumen) memiliki masalah yang mencegah dokumen mudah dicari, yang membuang waktu pengacara dan berkontribusi pada hilangnya pendapatan. Jika tidak untuk ML.NET, perusahaan tidak akan melakukan proyek sama sekali, atau mereka harus menarik orang dari pekerjaan aktual untuk memperbaiki masalah ini secara manual, yang dapat menyebabkan biaya ratusan ribu dolar untuk proyek.
Dengan ML.NET, kami dapat melatih model dan segera mengujinya di dalam kode kami. Ini membuat pengiriman perubahan baru lebih cepat karena semua alat tergabung di satu tempat."
Arsitektur solusi
Membuat aplikasi dengan ML.NET
Arsitektur hanyalah dua aplikasi konsol .NET Core dan database. Satu aplikasi konsol menarik data pelatihan, menyiapkan data, dan melatih model. Aplikasi konsol lain menarik data yang diperlukan untuk menjalankan model, memuat model untuk mengklasifikasikan data, dan menonaktifkannya sebelum mengembalikan data ke database.
Keunggulan proyek ini adalah betapa sederhananya prosesnya sehingga kami tidak membutuhkan hal yang lebih kompleks. Maksud saya, total panjang aplikasi pelatihan hanya 200 baris kode, dengan komentar, pencatatan log, dll. Sementara aplikasi untuk menjalankan model malah lebih kecil. Bagian terpanjang dari semuanya adalah kode transformasi yang hanya 13 baris kode."
Pemrosesan data
Data pelatihan, yang berjumlah sekitar 2 juta dokumen, berasal dari sistem manajemen dokumen firma hukum. Data itu sendiri mencakup konten dari dokumen, judul, penulis, penerima (untuk email), dan bit metadata lainnya tergantung pada bidang mana yang sedang dibersihkan.
Transformasi data dan algoritma pembelajaran mesin
Williams Mullen telah mencoba beberapa transformasi data dan algoritma pelatihan yang berbeda pada beberapa aplikasi yang berbeda. Transformasi data meliputi NormalizeText, TokenizeWords, RemoveDefaultStopWords, OneHotHashEncoding, FeaturizeText, ExtractWordEmbeddings, dan ProduceNGrams. Untuk pelatihan, mereka terutama menggunakan algoritme klasifikasi StochasticDualCoordinateAscent dan OneVersusAll.
Menggunakan transformasi dan algoritma data ML.NET untuk membuat solusi pembelajaran mesin, Williams Mullen dapat membuat jutaan dokumen lebih mudah dicari, yang pada gilirannya membantu pengacara mereka untuk lebih produktif.
Siap untuk memulai?
Tutorial langkah demi langkah kami akan membantu Anda menjalankan ML.NET di komputer.