Brazilian Journal of Empirical Legal Studies (Jan 2023)
Técnicas de aprendizado de máquinas aplicadas à classificação de decisões judiciais
Abstract
A análise de processos judiciais é uma tarefa cara, que requer muito tempo de juizes e assessores, seja para tomar decisões, seja para classificar de acordo com a jurisprudência vigente. Porém, esse processo é repetitivo e extrair a semântica desse corpus pode ser uma etapa de apoio a esse processo. O objetivo desta pesquisa é desenvolver uma metodologia capaz de gerar automaticamente classificações de documentos jurídicos, utilizando técnicas de processamento de linguagem natural. Primeiramente, coletamos 430.000 sentenças de tribunais trabalhistas brasileiros de 2006 a 2018. Então propomos o uso de técnicas de geração de representação de palavras para representação de dados. Em seguida, usamos técnicas de agrupamento para agrupar semanticamente as decisões judiciais semelhantes. Finalmente, os grupos são usados para criar rótulos artificiais para cada documento. Por fim, utilizamos técnicas de classificação para produzir modelos capazes de captar a semântica do texto judicial. Os resultados são promissores na captura do contexto semântico dos textos jurídicos e, portanto, essa metodologia pode ser utilizada como suporte para o processo decisório brasileiro.
Keywords