Janus: uma arquitetura de middleware para detecção e anonimização de PII em grandes modelos de linguagem no contexto da LGPD

Oliveira, Denilson Xavier; Deiró, Diego Andrade; Santana, João Victor Aziz Lima de; Santos, Loren Vitória Cavalcante; Carvalho, Neillane de; Pereira, Mario Jorge (Orient.); Assis, Semiramis Ribeiro de (Membro da Banca); Dusse, Flávio (Membro da Banca)

Janus: uma arquitetura de middleware para detecção e anonimização de PII em grandes modelos de linguagem no contexto da LGPD

creativework.keywords	Engenharias
creativework.keywords	Engenharia de Software
creativework.publisher	Pró-Reitoria de Graduação, Extensão e Ação Comunitária
creativework.publisher	Escola de Engenharias e Arquitetura
dc.contributor.author	Oliveira, Denilson Xavier
dc.contributor.author	Deiró, Diego Andrade
dc.contributor.author	Santana, João Victor Aziz Lima de
dc.contributor.author	Santos, Loren Vitória Cavalcante
dc.contributor.author	Carvalho, Neillane de
dc.contributor.author	Pereira, Mario Jorge (Orient.)
dc.contributor.author	Assis, Semiramis Ribeiro de (Membro da Banca)
dc.contributor.author	Dusse, Flávio (Membro da Banca)
dc.date.accessioned	2026-05-14T20:23:04Z
dc.date.available	2026-05-14T20:23:04Z
dc.date.issued	2025-12-18
dc.description.abstract	A integração de Grandes Modelos de Linguagem (LLMs) em ambientes corporativos oferece ganhos significativos de produtividade, mas introduz riscos críticos à privacidade e à conformidade com a Lei Geral de Proteção de Dados (LGPD), especialmente no manuseio de Informações Pessoais Identificáveis (PII). Este trabalho propõe e valida a arquitetura Janus, um middleware de segurança projetado para interceptar, anonimizar e restaurar dados sensíveis em interações com provedores de IA externos. A solução adota uma estratégia de "Defesa em Profundidade", orquestrando três camadas de filtragem: determinística (Expressões Regulares), probabilística (Reconhecimento de Entidades Nomeadas - NER) e semântica (LLM Local Llama 3). A metodologia experimental envolveu testes de estresse progressivos, culminando na análise de 500 prompts do domínio de Recursos Humanos (RH), totalizando mais de 4.500 entidades processadas. Os resultados demonstraram que o sistema atinge uma estabilidade operacional com um F1-Score global próximo a 0.60 em cenários de alta complexidade. A análise evidenciou que, embora o filtro NER apresente desafios de precisão, a arquitetura prioriza a segurança (Recall), mitigando o risco de vazamento de dados. Conclui-se que o sistema Janus oferece uma solução viável de "Privacidade por Design", permitindo o uso seguro de IA Generativa sem comprometer o sigilo das informações corporativas.	pt
dc.identifier.uri	https://ri.ucsal.br/handle/123456789/5918
dc.language.iso	pt
dc.publisher	UCSal - Universidade Católica do Salvador
dc.subject	LGPD
dc.subject	Large language models
dc.subject	Privacidade de dados
dc.subject	Mascaramento de PII
dc.subject	Arquitetura de software
dc.subject	Janus
dc.title	Janus: uma arquitetura de middleware para detecção e anonimização de PII em grandes modelos de linguagem no contexto da LGPD	pt
dc.type	Trabalho de Conclusão de Curso

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: TCCDENILSONOLIVEIRA ET AL.pdf
Tamanho:: 1.75 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Engenharia de Software