Discente do PPEE defende dissertação sobre detecção de dados pessoais em código-fonte utilizando Transformers e Grandes Modelos de Linguagem

O Programa de Pós-Graduação Profissional em Engenharia Elétrica (PPEE) informa que o discente Fabiano Damasceno Sousa Falcão realizou, no dia 26 de maio de 2026, a defesa de sua dissertação de mestrado intitulada “Evaluating Architectural Strategies for Personal Data Detection in Java Source Code Using Transformer Classifiers and Large Language Models”, concluindo mais uma importante etapa de sua trajetória acadêmica no Programa.

A pesquisa aborda um tema de crescente relevância na engenharia de software orientada à privacidade: a detecção de informações de identificação pessoal (PII) em código-fonte. Diante do aumento das exigências regulatórias e da adoção cada vez maior de ferramentas baseadas em Inteligência Artificial no desenvolvimento de software, o trabalho investiga diferentes estratégias para identificar dados sensíveis em aplicações Java, contribuindo para o fortalecimento da proteção de dados e da conformidade em ambientes de desenvolvimento.

A dissertação avaliou três abordagens arquiteturais distintas: um pipeline baseado exclusivamente em classificadores fundamentados em modelos Transformers, uma arquitetura híbrida que combina classificadores e Grandes Modelos de Linguagem (LLMs) e uma abordagem centrada em LLMs com extração estruturada e validação determinística. Para garantir uma comparação rigorosa e reproduzível, o estudo adotou um framework experimental unificado, contemplando pré-processamento compartilhado, inferência determinística, avaliação em nível de valor e preservação dos artefatos experimentais.

Os resultados demonstram que as decisões arquiteturais adotadas nos pipelines de detecção exercem influência significativa sobre os níveis de precisão e cobertura na identificação de dados pessoais, muitas vezes superando o impacto da escolha de modelos individuais. Além de fornecer evidências empíricas sobre o uso combinado de Transformers e LLMs para análise de código-fonte orientada à privacidade, o trabalho contribui com um framework reproduzível para avaliação de soluções baseadas em Inteligência Artificial na engenharia de software. O PPEE parabeniza o discente Fabiano Damasceno Sousa Falcão pela relevante contribuição científica e deseja sucesso em sua trajetória profissional e acadêmica.