Anonimitzador de documents al navegador i en local

Anonimització segura, local i sota control humà

Aquesta documentació mostra la viabilitat d’una utilita capaç de detectar i anonimitzar automàticament dades personals en documents habituals de l’administració (PDF, Word, TXT…), sense que cap informació surti del navegador de l’usuari. Tot el processament es realitza en local, garantint el màxim nivell de privacitat i seguretat.

👉🏼 Accedeix a la utilitat i ajuda'ns a millorar-la! 

Objectiu i necessitat

La gestió documental de les administracions públiques exigeix complir estrictament el RGPD i la LOPDGDD, però l’anonimització manual és lenta, repetitiva i propensa a errors. Les solucions existents sovint obliguen a pujar documents a servidors externs, amb el risc que això comporta. Aquesta utilitat respon a aquesta necessitat amb una solució automatitzada, supervisada i 100% local.

Com funciona?

La utilitat analitza els documents i detecta dades sensibles com DNI/NIE, noms i cognoms, correus electrònics, telèfons, adreces o comptes bancaris, combinant:

  • Regles i patrons (Regex)
  • Llistats de noms i cognoms
  • Catàlegs d’ens i municipis per evitar falsos positius (per exemple, no anonimitzar institucions públiques)

Abans d’aplicar els canvis, l’usuari disposa d’una revisió manual interactiva, que li permet validar o descartar cada detecció, assegurant control total del resultat final.

Arquitectura i tecnologia

La solució es basa en una arquitectura de client pur, sense backend:

  • JavaScript, HTML5 i CSS3 per a la lògica i la interfície
  • PDF.js i Mammoth.js per al processament de documents
  • jsPDF per generar els documents anonimitzats

Tot el càlcul es fa al navegador, utilitzant fins i tot Web Workers per millorar el rendiment en PDFs complexos.

Resultats obtinguts

  • Anonimització de documents complexos en qüestió de segons
  • Alta precisió en dades estructurades
  • Reducció significativa del temps de revisió manual
  • Aplicació real del principi de“Privacitat des del Disseny”, eliminant riscos de filtracions de dades

Conclusions i futur

La documentació confirma que és possible disposar d’una eina d’anonimització potent, segura i fàcil d’utilitzar, sense dependència de servidors externs ni solucions de pagament. Com a passos futurs, es proposa:

  • Integrar OCR local per tractar documents escanejats
  • Millorar la detecció amb models de llenguatge locals
  • Connectar l’eina amb sistemes de gestió documental existents