Janus: uma arquitetura de middleware para detecção e anonimização de PII em grandes modelos de linguagem no contexto da LGPD

creativework.keywordsEngenharias
creativework.keywordsEngenharia de Software
creativework.publisherPró-Reitoria de Graduação, Extensão e Ação Comunitária
creativework.publisherEscola de Engenharias e Arquitetura
dc.contributor.authorOliveira, Denilson Xavier
dc.contributor.authorDeiró, Diego Andrade
dc.contributor.authorSantana, João Victor Aziz Lima de
dc.contributor.authorSantos, Loren Vitória Cavalcante
dc.contributor.authorCarvalho, Neillane de
dc.contributor.authorPereira, Mario Jorge (Orient.)
dc.contributor.authorAssis, Semiramis Ribeiro de (Membro da Banca)
dc.contributor.authorDusse, Flávio (Membro da Banca)
dc.date.accessioned2026-05-14T20:23:04Z
dc.date.available2026-05-14T20:23:04Z
dc.date.issued2025-12-18
dc.description.abstractA integração de Grandes Modelos de Linguagem (LLMs) em ambientes corporativos oferece ganhos significativos de produtividade, mas introduz riscos críticos à privacidade e à conformidade com a Lei Geral de Proteção de Dados (LGPD), especialmente no manuseio de Informações Pessoais Identificáveis (PII). Este trabalho propõe e valida a arquitetura Janus, um middleware de segurança projetado para interceptar, anonimizar e restaurar dados sensíveis em interações com provedores de IA externos. A solução adota uma estratégia de "Defesa em Profundidade", orquestrando três camadas de filtragem: determinística (Expressões Regulares), probabilística (Reconhecimento de Entidades Nomeadas - NER) e semântica (LLM Local Llama 3). A metodologia experimental envolveu testes de estresse progressivos, culminando na análise de 500 prompts do domínio de Recursos Humanos (RH), totalizando mais de 4.500 entidades processadas. Os resultados demonstraram que o sistema atinge uma estabilidade operacional com um F1-Score global próximo a 0.60 em cenários de alta complexidade. A análise evidenciou que, embora o filtro NER apresente desafios de precisão, a arquitetura prioriza a segurança (Recall), mitigando o risco de vazamento de dados. Conclui-se que o sistema Janus oferece uma solução viável de "Privacidade por Design", permitindo o uso seguro de IA Generativa sem comprometer o sigilo das informações corporativas.pt
dc.identifier.urihttps://ri.ucsal.br/handle/123456789/5918
dc.language.isopt
dc.publisherUCSal - Universidade Católica do Salvador
dc.subjectLGPD
dc.subjectLarge language models
dc.subjectPrivacidade de dados
dc.subjectMascaramento de PII
dc.subjectArquitetura de software
dc.subjectJanus
dc.titleJanus: uma arquitetura de middleware para detecção e anonimização de PII em grandes modelos de linguagem no contexto da LGPDpt
dc.typeTrabalho de Conclusão de Curso

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCCDENILSONOLIVEIRA ET AL.pdf
Tamanho:
1.75 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: