# Setup

In [9]:
%load_ext sql

The sql extension is already loaded. To reload it, use:
  %reload_ext sql


In [10]:
%alias dropdb docker exec -i postgres_container dropdb -U postgres 
%alias createdb docker exec -i postgres_container createdb -U postgres 

In [11]:
dropdb bicicletas

In [12]:
createdb bicicletas

In [13]:
%sql postgresql://postgres:postgres@localhost/bicicletas

# Carga de datos en Pandas

In [14]:
import pandas as pd

df = pd.read_excel("data/accidentes.xlsx")
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 614 entries, 0 to 613
Data columns (total 5 columns):
 #   Column          Non-Null Count  Dtype         
---  ------          --------------  -----         
 0   num_expediente  614 non-null    object        
 1   fecha           614 non-null    datetime64[ns]
 2   distrito        614 non-null    object        
 3   tipo_accidente  614 non-null    object        
 4   sexo            614 non-null    object        
dtypes: datetime64[ns](1), object(4)
memory usage: 24.1+ KB


In [15]:
df.head()

Unnamed: 0,num_expediente,fecha,distrito,tipo_accidente,sexo
0,2020S000044,2020-01-02,SAN BLAS-CANILLEJAS,Colisión frontal,Hombre
1,2020S000151,2020-01-04,TETUÁN,Caída,Hombre
2,2020S000212,2020-01-04,FUENCARRAL-EL PARDO,Caída,Hombre
3,2020S003622,2020-01-04,RETIRO,Caída,Mujer
4,2020S000326,2020-01-05,CARABANCHEL,Colisión fronto-lateral,Hombre


Verificamos que no hay expedientes duplicados ...

In [16]:
sum(df.groupby("num_expediente").size() > 1)

0

## Creacción de estructrura en Postgres

In [17]:
%sql DROP TABLE accidentes

 * postgresql://postgres:***@localhost/bicicletas
(psycopg2.errors.UndefinedTable) table "accidentes" does not exist

[SQL: DROP TABLE accidentes]
(Background on this error at: http://sqlalche.me/e/13/f405)


In [18]:
%%sql 
CREATE TABLE accidentes (
    num_expediente  varchar(20) not null PRIMARY KEY,
    fecha          DATE,
    distrito       varchar(40),
    tipo_accidente varchar(40),
    sexo           varchar(40)
);

 * postgresql://postgres:***@localhost/bicicletas
Done.


[]

## Carga de datos en la Base de datos

In [19]:
from sqlalchemy import create_engine

In [20]:
engine = create_engine('postgresql://postgres:postgres@localhost:5432/bicicletas')

In [21]:
df.to_sql('accidentes', engine, if_exists = 'append', index = False)

## Resolución del caso de uso

### Datos del número de expediente 2020S000044

In [22]:
%%sql 
select *
from accidentes
where num_expediente = '2020S000044'

 * postgresql://postgres:***@localhost/bicicletas
1 rows affected.


num_expediente,fecha,distrito,tipo_accidente,sexo
2020S000044,2020-01-02,SAN BLAS-CANILLEJAS,Colisión frontal,Hombre


### Accidentes que ocurren en el distrito de Moratalaz ordenados por fecha

In [23]:
%%sql 
select *
from accidentes
where distrito = 'MORATALAZ'
order by fecha desc

 * postgresql://postgres:***@localhost/bicicletas
9 rows affected.


num_expediente,fecha,distrito,tipo_accidente,sexo
2020S014930,2020-10-22,MORATALAZ,Caída,Hombre
2020S013510,2020-09-29,MORATALAZ,Caída,Hombre
2020S013471,2020-09-28,MORATALAZ,Caída,Mujer
2020S012562,2020-09-12,MORATALAZ,Caída,Hombre
2020S010126,2020-07-19,MORATALAZ,Caída,Hombre
2020S008969,2020-06-27,MORATALAZ,Caída,Mujer
2020S008582,2020-06-21,MORATALAZ,Caída,Hombre
2020S008440,2020-06-18,MORATALAZ,Caída,Hombre
2020S001078,2020-01-16,MORATALAZ,Colisión fronto-lateral,Hombre


### Número de accidentes por tipo

In [24]:
%%sql 
select tipo_accidente, count(*)
from accidentes
group by tipo_accidente

 * postgresql://postgres:***@localhost/bicicletas
9 rows affected.


tipo_accidente,count
Colisión frontal,13
Alcance,78
Choque contra obstáculo fijo,20
Atropello a animal,2
Colisión lateral,46
Vuelco,1
Otro,20
Caída,281
Colisión fronto-lateral,153


### Número de accidentes cuyo tipo es colisión frontal

In [25]:
%%sql 
select tipo_accidente, count(*)
from accidentes
where tipo_accidente = 'Colisión frontal'
group by tipo_Accidente

 * postgresql://postgres:***@localhost/bicicletas
1 rows affected.


tipo_accidente,count
Colisión frontal,13
