# VERIFICA FINALE

## Obiettivi

Creazione di uno script in Python che esegua le seguenti operazioni:

- leggere un file contenente dati strutturati in formato CSV, JSON oppure XML e ottenere un oggetto Python manipolabile;
- filtrare i record provenienti dal file secondo uno o più criteri;
- contare i record trovati applicando i suddetti filtri;
- restituire all'utente un report con il conteggio, in un formato prestabilito.

Lo script può essere scritto un file nativo di Python (formato `.py`) oppure in una cella di codice all'interno di un file di Jupyter Notebook (formato `.ipynb`).

## Dati di input

I dati di input (nome file e parametri dei filtri) possono essere:

- scritti direttamente all'interno del codice, come variabili;
- provenienti dall'utente, utilizzando `input()` e/o `sys.argv`.

Scegli solo una una delle due precedenti modalità.

## Requisiti

Moduli built-in `csv`, `json` o `lxml` (terze parti).

## Consegna

Il Comune di Torino ha pubblicato un [*dataset* contenente dati riguardanti le attività commerciali](http://www.datiopen.it/it/opendata/Comune_di_Torino_Attivit_commerciali) sul suo terrirorio. Il dataset contiene un elenco di negozi e attività commerciali con vari dati, tra cui l'anno di inizio attività, la superficie occupata in metri quadrati e il Codice di Avviamento Postale (CAP).

> Il tuo obiettivo è quello di contare quante attività commerciali del Comune di Torino sono state avviate dopo il 2011, hanno una superficie maggiore o uguale a 150 metri quadrati e si trovano nelle zone di Millefonti, Lingotto e Filadelfia, che corrispondono grosso modo ai CAP 10126, 10127 e 10134. Guardando sullo stradario, decidi che questi CAP rappresentano in modo accettabile l'area territoriale di tuo interesse.

Schematizzando, devi ottenere la seguente informazione:

- Numero di attività commerciali che hanno le seguenti caratteristiche:
    - L'anno di inizio dell'attività (`Anno inizio attivita`) è uguale o successivo al `2011`.
    - La superficie "`Mq tot locale`" è maggiore o uguale a `150` mq.
    - Il codice di avviamento postale `Cap` è `10126` oppure `10127` oppure `10134`.

## Dataset

I dati sono disponibili in vari formati: CSV, JSON e XML.

http://www.datiopen.it/it/opendata/Comune_di_Torino_Attivit_commerciali

- [Comune-di-Torino---Attivita-commerciali.csv](http://www.datiopen.it/export/csv/Comune-di-Torino---Attivita-commerciali.csv)
- [Comune-di-Torino---Attivita-commerciali.json](http://www.datiopen.it/export/json/Comune-di-Torino---Attivita-commerciali.json)
- [Comune-di-Torino---Attivita-commerciali.xml](http://www.datiopen.it/export/xml/Comune-di-Torino---Attivita-commerciali.xml)

Scaricate il formato a voi più congeniale e su quella base di dati scrivete il vostro programma in Python.

## Campi

Ricapitolando, i dati che ti interessano sono:

- anno dell'inizio dell'attività commerciale: campo `Anno inizio attivita`.
- superficie totale dei locali dell'attività commerciale: campo `Mq tot locale`.
- codice di avviamento postale: campo `Cap`.


## Output atteso (report):

Il tuo programma dovrebbe restituire il seguente output (stampato a monitor):
<pre>
Numero di attività commerciali trovate: TUO RISULTATO
</pre>

## Svolgimento

Scrivi lo script qua sotto e consegna questo file, altrimenti crea un nuovo file `.py` e consegna lo script.

In [5]:
import csv
from pprint import pprint

# Contatori per il report
tot_attivita = 0
#percorso assoluto
#with open(r'C:\PPBC02\PPBC02\_personale\Esame\Comune-di-Torino---Attivita-commerciali.csv',"r") as data:
#percorso relativo
with open(r'.\Comune-di-Torino---Attivita-commerciali.csv',"r") as data:
    data_to_dict = csv.DictReader(data, delimiter=";")
    for line in data_to_dict:
        if (line["Anno inizio attivita"]).isnumeric():
            if int(line["Anno inizio attivita"])>=2011:
                if (line["Mq tot locale"]).isnumeric():
                    if int(line["Mq tot locale"])>=150:
                        if int(line["Cap"])in [10126,10127,10134]:
                            tot_attivita+=1
                    
    print("Numero di attività commerciali trovate: ",tot_attivita)


Numero di attività commerciali trovate:  35


## Filtro dinamico

Creo il filtro dinamico su anno, MQ e cap

In [6]:
import csv
from pprint import pprint

# Contatori per il report
tot_attivita = 0
annomin=3000
annomax=0
MQmin=3000
MQmax=0
capzone=set()
#percorso assoluto
#with open(r'C:\PPBC02\PPBC02\_personale\Esame\Comune-di-Torino---Attivita-commerciali.csv',"r") as data:
#percorso relativo
with open(r'.\Comune-di-Torino---Attivita-commerciali.csv',"r") as data:
    data_to_dict = csv.DictReader(data, delimiter=";")
    for line in data_to_dict:
        if (line["Anno inizio attivita"]).isnumeric():
            if int(line["Anno inizio attivita"])>=annomax:
                annomax=int(line["Anno inizio attivita"])
            if int(line["Anno inizio attivita"])<=annomin:
                annomin=int(line["Anno inizio attivita"])
        if (line["Mq tot locale"]).isnumeric():
            if int(line["Mq tot locale"])>=MQmax:
                MQmax=int(line["Mq tot locale"])
            if int(line["Mq tot locale"])<=MQmin:
                MQmin=int(line["Mq tot locale"])
        if (line["Cap"]).isnumeric():
            capzone.add((line["Cap"]))
    #print(annomax,annomin,MQmax,MQmin)
    #pprint(capzone)
annofilt=int(input(f"Inserisci l'anno di filtro compreso tra:{annomin} e {annomax}: "))
if annofilt>annomax or annofilt<annomin:
    print("dato errato")
Mqflit=int(input(f"Inserisci l'anno di filtro compreso tra:{MQmin} e {MQmax}: "))
if Mqflit>MQmax or Mqflit<MQmin:
    print("dato errato")
#pprint(capzone)
Capflit=str(input("Inserisci dei cap dalla lista precedente separati da virgola: "))
print(Capflit)
Capfilt=Capflit.split(",")
print(Capflit)
for _ in Capflit:
    if int(_) not in capzone :
        print("dato errato")
print(Capflit)
    
    

for line in data_to_dict:
    if int(line["Anno inizio attivita"])>=2011:
        if (line["Mq tot locale"]).isnumeric():
            if int(line["Mq tot locale"])>=150:
                if int(line["Cap"])in [10126,10127,10134]:
                    tot_attivita+=1
                
print("Numero di attività commerciali trovate: ",tot_attivita)

10126,10127,10134
10126,10127,10134
dato errato
dato errato
dato errato
dato errato
dato errato


ValueError: invalid literal for int() with base 10: ','