Skip to content

SenatoDellaRepubblica/PArSe

Repository files navigation

PArSe: Parser Articolato Senato

License Build

PArSe è un parser del solo articolato dei progetti o disegni di legge parlamentari. Sviluppato dal Servizio dell'Informatica del Senato della Repubblica.

Getting started

Per eseguire il parser:

  1. Assicurarsi di aver installato Python 3.11
  2. Checkout del progetto git clone https://github.com/SenatoDellaRepubblica/PArSe.git && cd PArSe
  3. Installazione delle librerire richieste mediante pip per Python3 pip3 install -r requirements.txt
  4. Per eseguire l'interfaccia Web (sono necessarie delle variabili di ambiente)
    • ENV=development|production
    • SERVER_PORT=127.0.0.1
    • python3 parse_web.py
  5. Per eseguire il parser a riga di comando python3 parse_cli.py -h

Live demo

PArSe live: https://www.senato.it/japp/serv/parse/app

Librerie esterne

Per la trasformazione di documenti PArSe utilizza Antiword per i .DOC e Tika per i .DOCX.

Nel progetto non sono presenti i compilati dei due prodotti. Per Tika è necessario il runtime Java.

Autore

Senato della Repubblica - Servizio dell'Informatica

Licenza

CC BY 3.0