Skip to content

AI Privacy Anonymizer v0.2.0

Choose a tag to compare

@sedoglia sedoglia released this 07 May 17:49
· 21 commits to main since this release

AI Privacy Anonymizer v0.2.0

Release di pulizia e packaging — pronta per la pubblicazione su PyPI e per la divulgazione pubblica del progetto.


Cosa cambia rispetto a v0.1.0

Codebase pulito

  • Rimossi import e variabili inutilizzati (verificato con pyflakes e vulture)
  • 446 test passano (363 core + 83 API), zero warning bloccanti
  • Compilazione pulita su tutti i 30 file Python di src/ e tests/

Metadati PyPI completi

  • Aggiunti classifiers (Beta, MIT, Italian, Security, Office/Business, Python 3.11–3.13)
  • Aggiunti keywords (privacy, pii, gdpr, gliner, ocr, redaction, ...)
  • Aggiunti [project.urls] (Homepage, Repository, Issues, Releases)
  • Wheel e sdist passano twine check → pronti per twine upload

Versionamento allineato

  • pyproject.toml, tool_version nell'audit JSON, FastAPI app, MCP serverInfo e i README IT/EN ora riportano coerentemente 0.2.0.

Installazione

Metodo 1 — Python (Windows / macOS / Linux)

Richiede Python ≥ 3.11.

# Da PyPI (quando pubblicato)
pip install "ai-privacy-anonymizer[full]"

# Oppure dai wheel allegati a questa release
pip install ai_privacy_anonymizer-0.2.0-py3-none-any.whl

Uso:

privacy-anonymizer documento.pdf            # CLI
privacy-anonymizer-web                       # Web UI Gradio
uvicorn privacy_anonymizer.api:app           # REST API
privacy-anonymizer-mcp                       # MCP server stdio

Metodo 2 — Eseguibile standalone Windows (no Python richiesto)

Per chi non ha Python installato, è disponibile un eseguibile .exe pronto all'uso aggiornato a v0.2.0.

Il file supera il limite di 2 GB di GitHub e viene distribuito tramite Google Drive.

⬇ Scarica privacy-anonymizer.exe (Google Drive, ~2.68 GB)

Dopo il download, eseguire dal terminale:

privacy-anonymizer.exe documento.pdf

Architettura

Pipeline ibrida a 3 livelli (invariata):

  • Layer 1 — OpenAI Privacy Filter (OPF): contesto semantico, 8 categorie
  • Layer 2 — GLiNER: NER multi-PII italiano, 60+ categorie
  • Layer 3 — Pattern italiani: regex + checksum (CF, P.IVA, IBAN, targa, tessera sanitaria, INPS, ...)

Tutti i livelli sono opzionali e configurabili. Vedi il README per i dettagli.


File allegati

  • ai_privacy_anonymizer-0.2.0-py3-none-any.whl — wheel universale Python 3.11+
  • ai_privacy_anonymizer-0.2.0.tar.gz — sdist (sorgente)

Entrambi verificati con twine checkPASSED.