Tar bort hela meningar från text som innehåller 1) telefonnummer, 2) e-postadresser samt 3) namn eller andra manuellt definierade nyckelord.
- Använder nltk för svensk tokenisering av meningar.
- Vanligaste svenska för- och efternamnen enligt SCBs namnstatistik.
Se test1.py för exempelanvändning.
pip install -r requirements.txt python setup.py develop