<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"></ul></div>

<img src="mioti.png" style="height: 100px">
<center style="color:#888">Data Science with Python</center>

# DSPy3 Pandas basics. Challenge.

**Inicialización**

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline 

Vamos a trabajar con un dataset que contiene las multas de circulación que el Ayuntamiento de Madrid ha tramitado durante el mes de octubre de 2022. Se encuentra en el fichero `Multas_octubre_2022.csv`. Mas información [aqui](https://datos.madrid.es/portal/site/egob).

<img src="multa.jpg" style="width:500px">

In [8]:
df = pd.read_csv("Multas_octubre_2022.csv", sep=',')
df['IMP_BOL'].value_counts()

IMP_BOL
200.0     86109
90.0      66556
100.0     38209
30.0      20285
60.0      17703
300.0      2471
50.0       1874
500.0       683
1000.0      578
400.0       454
Name: count, dtype: int64

In [3]:
# show data types all columns
df.dtypes

CALIFICACION     object
LUGAR            object
MES               int64
ANIO              int64
HORA            float64
IMP_BOL         float64
DESCUENTO        object
PUNTOS            int64
DENUNCIANTE      object
HECHO-BOL        object
VEL_LIMITE      float64
VEL_CIRCULA     float64
COORDENADA-X     object
COORDENADA-Y     object
dtype: object

In [11]:
df['DESCUENTO']

0         SI
1         SI
2         SI
3         SI
4         SI
          ..
234917    SI
234918    SI
234919    NO
234920    NO
234921    NO
Name: DESCUENTO, Length: 234922, dtype: object

In [4]:
df['DENUNCIANTE'].value_counts()

DENUNCIANTE
SER                     88423
AGENTES DE MOVILIDAD    82192
POLICIA MUNICIPAL       62433
SACE                     1874
Name: count, dtype: int64

**Ejercicio 1:** Muestra un dataframe con las 10 multas con mayor sanción y el motivo de la multa.

In [5]:
higher_fines = df.nlargest(10, 'IMP_BOL')[['IMP_BOL', 'HECHO-BOL']]
higher_fines

Unnamed: 0,IMP_BOL,HECHO-BOL
130796,1000.0,CONDUCIR CON UNA TASA DE ALCOHOL NO PERMITIDA ...
130825,1000.0,CONDUCIR CON PRESENCIA DE DROGAS EN EL ORGANIS...
130884,1000.0,CONDUCIR CON UNA TASA DE ALCOHOL NO PERMITIDA ...
130894,1000.0,CONDUCIR CON UNA TASA DE ALCOHOL NO PERMITIDA ...
130926,1000.0,CONDUCIR CON UNA TASA DE ALCOHOL NO PERMITIDA ...
130933,1000.0,CONDUCIR CON UNA TASA DE ALCOHOL NO PERMITIDA ...
130950,1000.0,CONDUCIR CON UNA TASA DE ALCOHOL NO PERMITIDA ...
130952,1000.0,CONDUCIR CON UNA TASA DE ALCOHOL NO PERMITIDA ...
130955,1000.0,CONDUCIR CON UNA TASA DE ALCOHOL NO PERMITIDA ...
130959,1000.0,CONDUCIR CON UNA TASA DE ALCOHOL NO PERMITIDA ...


**Ejercicio 2:** Encuentra la mayor diferencia en % de velocidad entre la velocidad permitida y a la que se circulaba.

In [6]:
df['pct_exceso'] = (df['VEL_CIRCULA'] - df['VEL_LIMITE']) / df['VEL_LIMITE'] * 100

max_pct = df['pct_exceso'].max()

print(f"The highest speed excess was {max_pct:.1f}%")
print("\nViolation details:")
print(df.loc[df['pct_exceso'] == max_pct, ['VEL_LIMITE', 'VEL_CIRCULA', 'pct_exceso', 'LUGAR']])


El mayor exceso de velocidad fue del 146.7%

Detalles de la infracción:
        VEL_LIMITE  VEL_CIRCULA  pct_exceso  \
191192        30.0         74.0  146.666667   

                                           LUGAR  
191192     MADR CR ACCESO ESTACION A              


**Ejercicio 3:** ¿Y la multa en la que se cirbulaba a mayor velocidad?

In [19]:
max_speed = df['VEL_CIRCULA'].max()

print(f"The highest recorded speed was {max_speed:.0f} km/h")
print("\nViolation details:")
print(df.loc[df['VEL_CIRCULA'] == max_speed, ['VEL_LIMITE', 'VEL_CIRCULA', 'LUGAR']])


The highest recorded speed was 154 km/h

Violation details:
        VEL_LIMITE  VEL_CIRCULA                                     LUGAR
168291        90.0        154.0  M-30 CALZADA 2 KM 27.000                
177227        90.0        154.0  M-30 C-2 KM 7,800 CR-CRAL               


**Ejercicio 4:** De todas las multas tramitadas en Octubre, ¿cuántas han sido tramitadas por agentes de movilidad?

In [8]:
df['DENUNCIANTE'] = df['DENUNCIANTE'].astype('category')
october_fines_mobility_agents = df[(df['MES'] == 10) & (df['DENUNCIANTE'] == 'AGENTES DE MOVILIDAD')]
print(f"Number of fines by mobility agents in October: {len(october_fines_mobility_agents)}")
october_fines_mobility_agents


Number of fines by mobility agents in October: 82192


Unnamed: 0,CALIFICACION,LUGAR,MES,ANIO,HORA,IMP_BOL,DESCUENTO,PUNTOS,DENUNCIANTE,HECHO-BOL,VEL_LIMITE,VEL_CIRCULA,COORDENADA-X,COORDENADA-Y,pct_exceso
3901,GRAVE,AV ANDALUCIA ESQ ALCOCER,10,2022,7.28,200.0,SI,4,AGENTES DE MOVILIDAD,REBASAR UN SEMÁFORO EN FASE ROJA. ...,,,,,
3902,GRAVE,MENENDEZ PELAYO H. NIÑO JESUS,10,2022,7.36,200.0,SI,4,AGENTES DE MOVILIDAD,REBASAR UN SEMÁFORO EN FASE ROJA. ...,,,,,
3903,GRAVE,AV MEDITERRANEO 32,10,2022,7.38,200.0,SI,4,AGENTES DE MOVILIDAD,REBASAR UN SEMÁFORO EN FASE ROJA. ...,,,,,
3907,GRAVE,JOSE ABASCAL - SANTA ENGRACIA,10,2022,7.48,200.0,SI,4,AGENTES DE MOVILIDAD,REBASAR UN SEMÁFORO EN FASE ROJA. ...,,,,,
4071,GRAVE,AV POBLADOS-EST. ALUCHE F 56,10,2022,7.48,200.0,SI,4,AGENTES DE MOVILIDAD,REBASAR UN SEMÁFORO EN FASE ROJA. ...,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
234902,GRAVE,"KM M ,7 PO EXTREMADURA",10,2022,8.43,100.0,SI,0,AGENTES DE MOVILIDAD,SOBREPASAR LA VELOCIDAD MÁXIMA EN VÍAS LIMITAD...,70.0,79.0,,,12.857143
234903,GRAVE,"KM M ,7 PO EXTREMADURA",10,2022,8.59,100.0,SI,0,AGENTES DE MOVILIDAD,SOBREPASAR LA VELOCIDAD MÁXIMA EN VÍAS LIMITAD...,70.0,83.0,,,18.571429
234904,GRAVE,"KM M ,7 PO EXTREMADURA",10,2022,9.01,100.0,SI,0,AGENTES DE MOVILIDAD,SOBREPASAR LA VELOCIDAD MÁXIMA EN VÍAS LIMITAD...,70.0,77.0,,,10.000000
234905,GRAVE,"KM M ,7 PO EXTREMADURA",10,2022,9.04,100.0,SI,0,AGENTES DE MOVILIDAD,SOBREPASAR LA VELOCIDAD MÁXIMA EN VÍAS LIMITAD...,70.0,76.0,,,8.571429


**Ejercicio 5:** ¿Cuánto % de multas han tenido descuento por pronto pago?

In [17]:
total_fines = len(df)
fines_with_discount = len(df[df['DESCUENTO'] == 'SI'])

discount_percentage = (fines_with_discount / total_fines) * 100

print(f"Percentage of fines with discount: {discount_percentage:.2f}%")


Percentage of fines with discount: 95.36%


**Ejercicio 6:** ¿Se recauda más con las multas pronto pago o con las pagadas fuera de plazo? (recuerda que el importe de las pronto pago lleva un descuento del 50%)

In [18]:
early_payment = df[df['DESCUENTO'] == 'SI']['IMP_BOL'].sum() * 0.5
regular_payment = df[df['DESCUENTO'] == 'NO']['IMP_BOL'].sum()

print(f"Total collected with early payment (50% discount): {early_payment:,.2f}€")
print(f"Total collected without discount: {regular_payment:,.2f}€")

if early_payment > regular_payment:
    print("\nMore money is collected from early payment fines")
else:
    print("\nMore money is collected from late payment fines")


Total collected with early payment (50% discount): 14,316,180.00€
Total collected without discount: 2,007,210.00€

More money is collected from early payment fines
