# Analisi ANAC legge 190

Per il momento, le analisi riportate su questo notebook sono effettuate su un campione di dati in attesa di ricevere i dati completi. 

__Ad oggi non compare l'analisi della qualità dei dati in quanto si attende di ricevere maggiori informazioni rispetto i campi. Tali informazioni sono cruciali per la presenza di anomalie nei dati stessi.__

##### ToC

1. [Incidenza % in volume degli affidamenti diretti di importo >= 40.000 € sul totale degli appalti per stazione appaltante](#pt1)


In [1]:
import os
import math

import pandas as pd
from bokeh.io import output_notebook
from bokeh.plotting import figure, show

from src.classes import Gara, StazioneAppaltante

In [12]:
# Get the list of json files in the folder
list_files = [f for f in os.listdir('data/') if f.endswith('.json')]

In [3]:
# Get the unique dataframe
list_df = [pd.read_json(file) for file in list_files]
df = pd.concat(list_df, ignore_index=True)

In [4]:
df.rename(index=str, 
          columns= {'CF_AMMINISTRAZIONE': 'CodiceFiscaleAmministrazione',
                    'SA_cap': 'CapStazioneAppaltante',
                    'SA_citta': 'CittaStazioneAppaltante',
                    'SA_descrizione_natura_giuridica': 'NaturaGiuridicaStazioneAppaltante',
                    'SA_indirizzo': 'IndirizzoStazioneAppaltante',
                    'SA_provincia': 'ProvianciaStazioneAppaltante',
                    'URL': 'UrlPubblicazione',
                    'categoriaPrevalente_BDNCP': 'CategoriaPrevalente',
                    'cig': 'CIG',
                    'cig_accordoQuadro': 'CigAccordoQuadro',
                    'cpv_BDNCP': 'CPV' ,
                    'denominazione_amministrazione': 'DenominazioneStazioneAppaltante',
                    'denominazione_cc': 'DenominazioneStazioneAppaltante_cc',
                    'fakecig': 'EsisteCIG',
                    'importoAggiudicazione': 'ImportoAggiudicazioneGara',
                    'importoAggiudicazione_bdncp': 'ImportoAggiudicazioneGara_2' ,
                    'importoSommeLiquidate': 'ImportoSommeLiquidate',
                    'localita_BDNCP': 'Localita',
                    'n_aggiudicatari': 'NumeroAggiudicatari',
                    'n_partecipanti': 'NumeroPartecipanti',
                    'numero_gara': 'NumeroGara',
                    'oggetto_gara': 'OggettoGara',
                    'oggetto_lotto': 'OggettoLotto',
                    'partecipanti': 'Partecipanti',
                    'sceltaContraente': 'SceltaContraente',
                    'sceltaContraente_BDNCP': 'SceltaContraente_2'}, 
         inplace=True)

In [5]:
df.head(3)

Unnamed: 0,CodiceFiscaleAmministrazione,CapStazioneAppaltante,CittaStazioneAppaltante,NaturaGiuridicaStazioneAppaltante,IndirizzoStazioneAppaltante,ProvianciaStazioneAppaltante,UrlPubblicazione,CategoriaPrevalente,CIG,CigAccordoQuadro,...,Localita,NumeroAggiudicatari,NumeroPartecipanti,NumeroGara,OggettoGara,OggettoLotto,Partecipanti,SceltaContraente,SceltaContraente_2,ts
0,157770918,8014,BIRORI,ENTI PUBBLICI NON ECONOMICI,VIA S ANDREA 18,IT-NU,tbd,,X86111F3CA,,...,,1,1,,,"L.R. 20.09.2006, n. 14, art. 21, comma 2, lett...","[{'aggiudicatario': '1', 'gruppo': 'n.a.', 'ru...",04-PROCEDURA NEGOZIATA SENZA PREVIA PUBBLICAZI...,,2018-09-16 04:41:30.143
1,224110098,17043,CARCARE,ENTI PUBBLICI NON ECONOMICI,P CAVARADOSSI 26,IT-SV,tbd,,ZF01B137BD,,...,tdb,1,1,ZF01B137BD,ACQUISTO 2 REGISTRI UNIONI CIVILI E 1 REGISTRO...,ACQUISTO 2 REGISTRI UNIONI CIVILI E 1 REGISTRO...,"[{'aggiudicatario': '1', 'gruppo': 'n.a.', 'ru...",23-AFFIDAMENTO IN ECONOMIA - AFFIDAMENTO DIRETTO,AFFIDAMENTO IN ECONOMIA - AFFIDAMENTO DIRETTO,2018-09-16 05:20:25.69
2,224110098,17043,CARCARE,ENTI PUBBLICI NON ECONOMICI,P CAVARADOSSI 26,IT-SV,tbd,,ZD01C7AC6D,,...,tdb,1,1,ZD01C7AC6D,Nuovo allaccio energia elettrica,Nuovo allaccio energia elettrica,"[{'aggiudicatario': '1', 'gruppo': 'n.a.', 'ru...",23-AFFIDAMENTO IN ECONOMIA - AFFIDAMENTO DIRETTO,AFFIDAMENTO IN ECONOMIA - AFFIDAMENTO DIRETTO,2018-09-16 05:20:27.453


* Rimozione delle righe duplicate non tenendo in considerazione la lista dei partecipanti ed il time stamp

In [6]:
lista_attr_esluso_partecipanti = list(df.columns)
lista_attr_esluso_partecipanti.remove('Partecipanti')
lista_attr_esluso_partecipanti.remove('ts')

prev_len = df.shape[0]
df.drop_duplicates(lista_attr_esluso_partecipanti, inplace=True)

print ("""Il numero di righe duplicate è pari a """, prev_len - len(df))

Il numero di righe duplicate è pari a  127


## Incidenza % in volume degli affidamenti diretti di importo maggiore o uguale a 40.000 € sul totale degli appalti per stazione appaltante <a  id='pt1' />

Definiamo l'elenco di tipologie di scelta del contraente che corrispondono agli affidamenti diretti.

In [7]:
affidamenti_diretti = ['23-AFFIDAMENTO IN ECONOMIA - AFFIDAMENTO DIRETTO',
                       '26-AFFIDAMENTO DIRETTO IN ADESIONE AD ACCORDO QUADRO/CONVENZIONE',
                       '17-AFFIDAMENTO DIRETTO EX ART. 5 DELLA LEGGE N.381/91',
                       "24-AFFIDAMENTO DIRETTO A SOCIETA' IN HOUSE",
                       "25-AFFIDAMENTO DIRETTO A SOCIETA' RAGGRUPPATE/CONSORZIATE O CONTROLLATE NELLE CONCESSIONI DI LL.PP"]

Quindi, per ogni stazione appaltante si musura la percentuale di appalti, sul totale della stazione, con affidamento diretto ed importo maggiore di 40.000€.

In [8]:
SA_perc = []
for sa in df.CodiceFiscaleAmministrazione.unique():
    SA = StazioneAppaltante(df, sa)
    den = SA.__dict__['denominazione']
    if len(str(den)) != 0:
        perc = SA._percentuale_appalti_tipologia_y_su_totale_appalti(affidamenti_diretti, 40000)
        SA_perc += [(sa, den, perc)]    

In [9]:
sorted_SA_perc = sorted(SA_perc, key=lambda x: x[2], reverse=True)

In [10]:
denominazioni = [d[1] for d in sorted_SA_perc][:10]
percentuali = [d[2] for d in sorted_SA_perc][:10]

# output to static HTML file
output_notebook()

# create a new plot with a title and axis labels
p = figure(x_range=denominazioni,
           plot_height=700,
           plot_width=700,
           #toolbar_location=None,
           #tools="",
           title="% volume di appalti >= 40.000€ con assegnazione diretta", 
           x_axis_label='Denominazione Stazione Appaltante',
           y_axis_label='Percentuale (%)')


p.vbar(x=denominazioni,
       top=percentuali,
       width=0.5)

p.xgrid.grid_line_color = None
p.y_range.start = 0
p.xaxis.major_label_orientation = 45
p.xaxis.major_label_text_font_size = "5pt"
# show the results
show(p)