<img src='portada.png'>

<h1 align=center><font size=7>Case study - Counting crimes 👩‍✈️</font></h1>

<h4 align=center><font size=3>Estudio de caso para poner en práctica lo aprendido en el curso "Data Types for Data Science in Python". </font></h4>


## Primera parte
**Pregunta objetivo: ¿cuáles son las cinco ubicaciones de delitos más comunes por mes?**

In [109]:
# Importar modulos necesarios

import csv
from datetime import datetime
from collections import Counter
from collections import defaultdict

#### Obtener los datos del csv

In [110]:
# Crear una lista vacia
crime_data = []

# Abrir el csv
with open('Chicago_crime.csv', newline='') as csvfile:
    reader = csv.reader(csvfile)
    
    # Alimentar la lista 
    for row in list(reader):
        tuple_row = tuple(row)
        crime_data.append(tuple_row) 

print(crime_data[0:4])

[('Date', 'Block', 'Primary Type', 'Description', 'Location Description', 'Arrest', 'Domestic', 'District'), ('05/23/2016 05:35:00 PM', '024XX W DIVISION ST', 'ASSAULT', 'SIMPLE', 'STREET', 'False', 'True', '14'), ('03/26/2016 08:20:00 PM', '019XX W HOWARD ST', 'BURGLARY', 'FORCIBLE ENTRY', 'SMALL RETAIL STORE', 'False', 'False', '24'), ('04/25/2016 03:05:00 PM', '001XX W 79TH ST', 'THEFT', 'RETAIL THEFT', 'DEPARTMENT STORE', 'True', 'False', '6')]


In [111]:
# Eliminar de forma segura el primer elemento de la lista (los encabezados)
crime_data.pop(0)

('Date',
 'Block',
 'Primary Type',
 'Description',
 'Location Description',
 'Arrest',
 'Domestic',
 'District')

In [112]:
print(crime_data[:5])

[('05/23/2016 05:35:00 PM', '024XX W DIVISION ST', 'ASSAULT', 'SIMPLE', 'STREET', 'False', 'True', '14'), ('03/26/2016 08:20:00 PM', '019XX W HOWARD ST', 'BURGLARY', 'FORCIBLE ENTRY', 'SMALL RETAIL STORE', 'False', 'False', '24'), ('04/25/2016 03:05:00 PM', '001XX W 79TH ST', 'THEFT', 'RETAIL THEFT', 'DEPARTMENT STORE', 'True', 'False', '6'), ('04/26/2016 05:30:00 PM', '010XX N PINE AVE', 'BATTERY', 'SIMPLE', 'SIDEWALK', 'False', 'False', '15'), ('06/19/2016 01:15:00 AM', '027XX W AUGUSTA BLVD', 'BATTERY', 'AGGRAVATED: HANDGUN', 'SIDEWALK', 'False', 'False', '12')]


#### Obtener crimenes por mes

In [113]:
# Crear un objeto contador para los meses
crimes_by_month = Counter()


for row in crime_data:    
    # Convertir el primer elemento en un objeto datetime
    date = datetime.strptime(row[0], '%m/%d/%Y %I:%M:%S %p')    
    # Incrementar el contador para el mes de cada fila
    crimes_by_month[date.month] += 1
    
# Imprimir los 3 meses más comunes de crimenes
print(crimes_by_month.most_common(3))


[(1, 1948), (2, 1862), (7, 1257)]


#### Obtener total de crimenes por localización por mes

In [114]:
# Crear un diccionario que por defecto sea una lista
locations_by_month = defaultdict(list)

for row in crime_data:
    date = datetime.strptime(row[0], '%m/%d/%Y %I:%M:%S %p')
    
    if date.year == 2016:
        # Establecer la key del diccionario en el mes y agregar la ubicación a la lista
        locations_by_month[date.month].append(row[4]) 

In [115]:
# Conteo de crimenes por localización

for month, locations in list(locations_by_month.items()):
    
    location_count = Counter(locations)
    
    print(month)
    print(location_count.most_common(5))

5
[('STREET', 241), ('RESIDENCE', 175), ('APARTMENT', 128), ('SIDEWALK', 111), ('OTHER', 41)]
3
[('STREET', 240), ('RESIDENCE', 190), ('APARTMENT', 139), ('SIDEWALK', 99), ('OTHER', 52)]
4
[('STREET', 213), ('RESIDENCE', 171), ('APARTMENT', 152), ('SIDEWALK', 96), ('OTHER', 40)]
6
[('STREET', 245), ('RESIDENCE', 164), ('APARTMENT', 159), ('SIDEWALK', 123), ('PARKING LOT/GARAGE(NON.RESID.)', 44)]
7
[('STREET', 309), ('RESIDENCE', 177), ('APARTMENT', 166), ('SIDEWALK', 125), ('OTHER', 47)]
10
[('STREET', 248), ('RESIDENCE', 206), ('APARTMENT', 122), ('SIDEWALK', 92), ('OTHER', 62)]
12
[('STREET', 207), ('RESIDENCE', 158), ('APARTMENT', 136), ('OTHER', 47), ('SIDEWALK', 46)]
1
[('STREET', 196), ('RESIDENCE', 160), ('APARTMENT', 153), ('SIDEWALK', 72), ('PARKING LOT/GARAGE(NON.RESID.)', 43)]
9
[('STREET', 279), ('RESIDENCE', 183), ('APARTMENT', 144), ('SIDEWALK', 121), ('OTHER', 39)]
11
[('STREET', 236), ('RESIDENCE', 182), ('APARTMENT', 154), ('SIDEWALK', 75), ('OTHER', 41)]
8
[('STREET',

## Segunda parte
**Pregunta objetivo: ¿cuántos delitos ocurrieron por distrito?**

#### Obtener datos por distrito

In [116]:
crimes_by_district = defaultdict(list)

# Iterar sobre un DictReader del archivo CSV
with open('Chicago_crime.csv', newline='') as csvfile:    
    reader = csv.DictReader(csvfile)
    
    for row in reader:        
    # Eliminar el distristo en cada row
        district = row.pop('District')        
    # Establecer el distrito como key del diccionario y agregar el resto de elementos de row
        crimes_by_district[district].append(row)

#### Obtener total de arrestos por año por distrito

In [117]:
# Iterar sobre el diccioario de crimenes por distrito
for district, crimes in crimes_by_district.items():
    print(district)
    
    # Crear contador vacio
    year_count = Counter()
    
    # Iterar sobre el item crimes
    for crime in crimes:
        # Si hubo arresto
        if crime['Arrest'] == 'True':
            # Convertir a un objeto datetime y obtener el año
            year = datetime.strptime(crime['Date'], '%m/%d/%Y %I:%M:%S %p').year
            # Incrementar el contador
            year_count[year] += 1
            
    print(year_count)

14
Counter({2016: 59, 2017: 8})
24
Counter({2016: 51, 2017: 10})
6
Counter({2016: 157, 2017: 32})
15
Counter({2016: 154, 2017: 16})
12
Counter({2016: 72, 2017: 9})
7
Counter({2016: 181, 2017: 27})
1
Counter({2016: 124, 2017: 15})
11
Counter({2016: 275, 2017: 53})
18
Counter({2016: 92, 2017: 17})
22
Counter({2016: 78, 2017: 12})
5
Counter({2016: 149, 2017: 30})
16
Counter({2016: 66, 2017: 9})
9
Counter({2016: 116, 2017: 17})
8
Counter({2016: 124, 2017: 26})
3
Counter({2016: 98, 2017: 18})
2
Counter({2016: 84, 2017: 15})
19
Counter({2016: 88, 2017: 11})
10
Counter({2016: 144, 2017: 20})
4
Counter({2016: 134, 2017: 15})
17
Counter({2016: 38, 2017: 5})
20
Counter({2016: 27, 2017: 8})
25
Counter({2016: 150, 2017: 26})
31
Counter({2016: 1})


#### Obtener crimes por bloque de la ciudad

In [118]:
# Diccionario de tipos primarios de crimen por bloque
crimes_by_block = defaultdict(list)

with open('Chicago_crime.csv', newline='') as csvfile:    
    reader = csv.DictReader(csvfile)
    
    for row in reader:        
    # Eliminar el distristo en cada row
        district = row.pop('Block')     
        primary_type = row.pop('Primary Type') 
    # Establecer el distrito como key del diccionario y agregar el resto de elementos de row
        crimes_by_block[district].append(primary_type)


#### Obtener lista de crimenes unicos de los bloques '001XX N STATE ST' y '0000X W TERMINAL ST'

In [119]:
# Lista unica de crimenes en el bloque 001XX N STATE ST
n_state_st_crimes = set(crimes_by_block['001XX N STATE ST'])

print(n_state_st_crimes)

{'ROBBERY', 'BATTERY', 'ASSAULT', 'DECEPTIVE PRACTICE', 'CRIMINAL DAMAGE', 'CRIMINAL TRESPASS', 'THEFT', 'OTHER OFFENSE'}


In [120]:
# Lista unica de crimenes en el bloque 0000X W TERMINAL ST
w_terminal_st_crimes = set(crimes_by_block['0000X W TERMINAL ST'])

print(w_terminal_st_crimes)

{'NARCOTICS', 'PUBLIC PEACE VIOLATION', 'ASSAULT', 'DECEPTIVE PRACTICE', 'CRIMINAL DAMAGE', 'CRIMINAL TRESPASS', 'THEFT', 'OTHER OFFENSE'}


In [121]:
# Encontrar los crimenes cometidos en 001XX N STATE ST que no se cometieron en 0000X W TERMINAL ST
crime_differences = n_state_st_crimes.difference(w_terminal_st_crimes)

print(crime_differences)

{'BATTERY', 'ROBBERY'}
