La ML.NET consente di migliorare la produttività
Cliente
Williams Mullen
Prodotti e servizi
ML.NET
Azure
Visual Studio
SQL Server
Office 365
Settore
Procedure legali/Servizi professionali
Dimensioni dell'organizzazione
Media (100-1000 dipendenti)
Paese/area geografica
Stati Uniti
Williams Mullen, uno studio legale che offre servizi completi alle aziende specializzato in diritto societario, contenzioso, finanza e immobiliare, si è accorto che l'analisi di milioni di documenti da parte degli avvocati richiedeva molto tempo impedendo loro di dedicarsi efficacemente alle pratiche dei clienti. Lo studio legale ha quindi deciso di cercare una soluzione di Machine Learning. Dopo aver compreso che la maggior parte dei problemi riguardava effettivamente la classificazione, ha scelto esplorare ulteriormente con ML.NET.
Problema aziendale
Quando si tratta di tecnologia, gli avvocati usano principalmente due applicazioni: Word e Outlook. Questo approccio genera una quantità abbastanza elevata di dati non strutturati sotto forma di documenti di Word, file PDF e messaggi di posta elettronica che vengono inseriti in un sistema di gestione di documenti, che può contenere decenni di informazioni digitali. Ciò costituisce un problema quando gli avvocati vogliono trovare informazioni specifiche in questi documenti ed eseguono tale operazione tramite una ricerca nei metadati dei documenti, in cui le informazioni sono spesso mancanti, non corrette oppure obsolete.
A causa di questo processo manuale, William Mullen ha rilevato che milioni di documenti hanno riscontrato problemi che hanno impedito la facilità di ricerca di essi, con perdita di tempo da parte dell'avvocato e con conseguente perdita di ricavi.
Perché ML.NET?
Il settore legale è piuttosto incentrato su Microsoft per quanto riguarda le scelte tecnologiche. Williams Mullen non è diverso; gli sviluppatori sono grandi utenti C#. Hanno iniziato a esaminare le soluzioni di Machine Learning nello stesso momento in cui è stato annunciato ML.NET, quindi era naturale iniziare a usare ML.NET per il proprio scenario di classificazione.
Impatto di ML.NET
Attraverso le sue ricerche, William Mullen ha scoperto che il 20% dei documenti presenti nel suo sistema (ad esempio, milioni di documenti) presentava problemi che ne impedivano la facile ricerca, facendo perdere tempo agli avvocati e contribuendo alla perdita di fatturato. Se non fosse stato per ML.NET, la società non avrebbe intrapreso affatto il progetto o avrebbe dovuto sottrarre persone al lavoro effettivo per risolvere manualmente questi problemi, il che avrebbe potuto comportare costi pari a centinaia di migliaia di dollari per il progetto.
Grazie a ML.NET, è possibile eseguire il training del modello e quindi eseguirne immediatamente il test all'interno del codice. Questo approccio consente di distribuire nuove modifiche più rapidamente perché tutti gli strumenti si trovano in un'unica posizione."
Architettura della soluzione
Creazione di un'applicazione con ML.NET
L'architettura è composta solo da due applicazioni console .NET Core e un database. Un'app della console estrae i dati di addestramento, li prepara e addestra il modello. L'altra app della console ha estratto i dati necessari per eseguire il modello, ha caricato il modello per classificare i dati ed è stata disattivata prima di reinserirli nel database.
La soddisfazione di questo progetto è stata un'operazione semplice, quindi non abbiamo bisogno di nulla di più complesso. Voglio dire che l'app di formazione era un totale di 200 righe di codice, con commenti, registrazione e così via. e l'app per eseguire il modello era ancora più piccola. La parte più grande dell'intera operazione è il codice di trasformazione disponibile in 13 righe di codice."
Elaborazione dati
I dati di training, ovvero circa 2 milioni di documenti, provengono dal sistema di gestione dei documenti dello studio legale. I dati includono il contenuto del documento, il titolo, l'autore, il destinatario (per i messaggi di posta elettronica) e altri bit di metadati a seconda dei campi da pulire.
Trasformazioni dei dati e algoritmi di Machine Learning
Williams Mullen ha provato diverse trasformazioni di dati e algoritmi di training su un paio di applicazioni diverse. Le trasformazioni dei dati includono NormalizeText, TokenizeWords, RemoveDefaultStopWords, OneHotHashEncoding, FeaturizeText, ExtractWordEmbeddings e ProduceNGrams. Per la formazione, utilizzano principalmente gli algoritmi di classificazione StochasticDualCoordinateAscent e OneVersusAll.
Usando le trasformazioni di dati e gli algoritmi di ML.NET per creare una soluzione di Machine Learning, Williams Mullen è riuscito a rendere più ricercabili milioni di documenti, il che a sua volta ha contribuito a rendere più produttivi i suoi legali.
Pronti per iniziare?
Questa esercitazione dettagliata ti aiuterà a ottenere ML.NET in esecuzione nel computer.