Skip to content
This repository has been archived by the owner on Jun 28, 2023. It is now read-only.

JobtechSwe/anonymisering

Repository files navigation

Enklare anonymisering av svensk text

Tar bort hela meningar från text som innehåller 1) telefonnummer, 2) e-postadresser samt 3) namn eller andra manuellt definierade nyckelord.

  • Använder nltk för svensk tokenisering av meningar.
  • Vanligaste svenska för- och efternamnen enligt SCBs namnstatistik.

Se test1.py för exempelanvändning.

Install

pip install -r requirements.txt python setup.py develop

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages