Avaliação de modelo de Machine Learning para classificação de informações sigilosas: um estudo dos dados do Governo Federal

Visualizar/ Abrir
Data
2025-02-26Autor
Costa, Rafaella Weiss Siqueira
http://lattes.cnpq.br/0873144815473807
Metadata
Mostrar registro completoResumo
Nos últimos anos, a Administração Pública tem avançado fortemente na modernização dos sistemas governamentais alinhada à política de Governo Digital. Esse movimento incentiva o uso de novas tecnologias disruptivas, como automações e aprendizado de máquina, que possam contribuir para eficiência dos processos administrativos e para qualidade do serviço público. Nesse contexto, um dos temas centrais é o tratamento de dados, que deve estar em conformidade com a Lei de Acesso à Informação (LAI) e Lei Geral de Proteção de Dados (LGPD). Além disso, é necessária a rigorosa observação de tratativas de segurança da informação na proteção de dados sensíveis. O presente artigo teve como objetivo a avaliação de um modelo de machine learning para classificação de informações sigilosas com base em dados históricos do Governo Federal. O modelo Random Forest apresentou bom desempenho na classificação de informações sigilosas, atingindo 94,39% de acurácia. Outras métricas, como a Precisão-Recall (PRC), foram analisadas. No entanto, desafios no desbalanceamento de classes e na diferenciação entre categorias de sigilo foram identificados, destacando a necessidade de refinamento futuro na modelagem, de coleta de um maior volume representativo de amostras e seleção de características.
Collections
Os arquivos de licença a seguir estão associados a este item: