# Foro de consultas de la Semana 2

> ¿Cómo podemos crear una Base de Datos desde Jupyter notebook?

Python tiene varias maneras de crear bases de datos, como ejemplo, voy a crear una base de datos en base a DataFrames de pandas. Pandas es la librería que vamos a estar usando la mayoría del curso.

## Datos de prueba

Una base de datos vacia no tiene sentido, por lo que voy a descargar un conjunto de datos para guardar luego en la base de datos.

En este caso, usaremos datos de los [vacunados](https://www.mspbs.gov.py/xweb/vacunados.csv) con vacunas anticovid del Paraguay.

In [1]:
import pandas as pd

link_datos = "https://drive.google.com/uc?export=download&id=1xK_f9acogAWJ2ePle3KyqX7aeM1niA1D"
vacunados_df = pd.read_csv(link_datos, nrows=10000) # Limitamos porque el archivo es muy pesado

In [2]:
vacunados_df.head() # Vemos algunos datos

Unnamed: 0,nombre,apellido,establecimiento,fecha_aplicacion,cedula,dosis,descripcion_vacuna,actualizado_al
0,LUIS GERMAN,DUARTE BALBUENA,Estacionamiento Paseo 1811 (masivo),2021-07-21 00:00:00,4952581,1,PFIZER - COVID -19,2021-08-03 18:20:22
1,CLAUDIO LIBERATO,BAEZ FIGUEREDO,USF - GRAL. BRUGUEZ,2021-05-20 00:00:00,835724,1,ASTRAZENECA-CHADOX1-S - COVID-19,2021-08-03 18:20:22
2,MONICA,ABENTE ARRELLAGA,Sanatorio Migone,2021-07-14 00:00:00,1237293,1,PFIZER - COVID -19,2021-08-03 18:20:22
3,GLADYS,CESPEDES DE ALVAREZ,H.D.- DR. JUAN MANUEL FRUTOS,2021-06-15 00:00:00,1102847,1,ASTRAZENECA-CHADOX1-S - COVID-19,2021-08-03 18:20:22
4,MARIO,RODAS,Centro Médico La Costa,2021-06-09 00:00:00,660094,1,HAYAT VAX COVID-19,2021-08-03 18:20:22


## Creación de base de datos con sqlalchemy

[Sqlalchemy](https://www.sqlalchemy.org/) es una librería que funciona como un [ORM (Object Relational Mapper)](https://es.wikipedia.org/wiki/Asignaci%C3%B3n_objeto-relacional), y nos permite crear y manipular una base de datos.

Primero se debe crear el motor que nos permitirá usar nuestra base de datos, para esto podemos usar la función `create_engine()`

In [3]:
from sqlalchemy import create_engine
engine = create_engine('sqlite:///:memory:') # Creamos un motor sqlite desde la memoria

`create_engine()` produce un objeto basado en una URL. Estas URLs siguen el estandar [RFC-1738](https://rfc.net/rfc1738.html), y usualmente incluyen el nombre de usuario, la contraseña, el hostname, nombre de base de datos y otras configuraciones adicionales.

La forma típica de una URL de base de datos es algo así:

> ```dialect+driver://username:password@host:port/database```

En nuestro caso, utilizamos **sqlite**, y como creamos la base de datos en memoria, podemos obviar muchos parametros.

> ```sqlite:///:memory:```

Ahora que tenemos el motor, podemos crear una base de datos a partir del dataframe con la lista de vacunas. Para esto, usamos la función `.to_sql`.

Pandas, a través de Sqlalchemy, se encarga de crear el esquema de la base de datos. No hace falta hacer un `CREATE TABLE`, pues pandas ya lo hace gratis.

In [4]:
vacunados_df.to_sql('vacunados', engine) 
# 1er Argumento: nombre de tabla, 2do Argumento: motor

Ahora podemos ver que la tabla vacunados esta en la base de datos

In [5]:
from sqlalchemy import inspect
inspect(engine).get_table_names()

['vacunados']

## Consultas a la base de datos

Pandas permite realizar consultas sql directamente sobre la base de datos, así como también leer directamente la tabla sin utilizar sentencias sql.

In [6]:
query = "SELECT * FROM vacunados WHERE dosis = 2"
pd.read_sql(query, engine) # Lectura con sentencia

Unnamed: 0,index,nombre,apellido,establecimiento,fecha_aplicacion,cedula,dosis,descripcion_vacuna,actualizado_al
0,10,DALIA ROSA,CASANOVA OZUNA,CS Yby Yau,2021-08-02 00:00:00,3215549,2,PFIZER - COVID -19,2021-08-03 18:20:22
1,12,MARIA DORILA,GINI GONZALEZ,PIRIBEBUY,2021-07-24 00:00:00,1164623,2,MODERNA - COVID -19,2021-08-03 18:20:22
2,15,RAMONA,GONZALEZ ARCE,VACUNATORIO COVID HRCDE,2021-06-04 00:00:00,1415013,2,COVAXIN COVID-19,2021-08-03 18:20:22
3,16,MYRIAN RAQUEL,MALDONADO GAONA,CVC - Costanera,2021-08-03 00:00:00,1722146,2,PFIZER - COVID -19,2021-08-03 18:20:22
4,17,DARDO OCTAVIO,RODRIGUEZ ESPINOLA,IPS Central,2021-06-02 00:00:00,987882,2,COVAXIN COVID-19,2021-08-03 18:20:22
...,...,...,...,...,...,...,...,...,...
1689,9978,ALFONZO,AMARILLA,H.D. - EUSEBIO AYALA,2021-05-27 00:00:00,247387,2,COVAXIN COVID-19,2021-08-03 18:20:22
1690,9985,HERMINIO DARIO,SANCHEZ,C.S.- ARROYOS Y ESTEROS,2021-06-25 00:00:00,649949,2,HAYAT VAX COVID-19,2021-08-03 18:20:22
1691,9993,FRANCISCO ISMAEL,VILLALBA DUARTE,USF Cap. Miranda,2021-07-29 00:00:00,1017210,2,MODERNA - COVID -19,2021-08-03 18:20:22
1692,9995,JESSICA GABRIELA,ROMERO LOPEZ,H.R.- PEDRO JUAN CABALLERO,2021-07-02 00:00:00,4848841,2,HAYAT VAX COVID-19,2021-08-03 18:20:22


In [7]:
pd.read_sql_table('vacunados', engine) # Leer tabla entera

Unnamed: 0,index,nombre,apellido,establecimiento,fecha_aplicacion,cedula,dosis,descripcion_vacuna,actualizado_al
0,0,LUIS GERMAN,DUARTE BALBUENA,Estacionamiento Paseo 1811 (masivo),2021-07-21 00:00:00,4952581,1,PFIZER - COVID -19,2021-08-03 18:20:22
1,1,CLAUDIO LIBERATO,BAEZ FIGUEREDO,USF - GRAL. BRUGUEZ,2021-05-20 00:00:00,835724,1,ASTRAZENECA-CHADOX1-S - COVID-19,2021-08-03 18:20:22
2,2,MONICA,ABENTE ARRELLAGA,Sanatorio Migone,2021-07-14 00:00:00,1237293,1,PFIZER - COVID -19,2021-08-03 18:20:22
3,3,GLADYS,CESPEDES DE ALVAREZ,H.D.- DR. JUAN MANUEL FRUTOS,2021-06-15 00:00:00,1102847,1,ASTRAZENECA-CHADOX1-S - COVID-19,2021-08-03 18:20:22
4,4,MARIO,RODAS,Centro Médico La Costa,2021-06-09 00:00:00,660094,1,HAYAT VAX COVID-19,2021-08-03 18:20:22
...,...,...,...,...,...,...,...,...,...
9995,9995,JESSICA GABRIELA,ROMERO LOPEZ,H.R.- PEDRO JUAN CABALLERO,2021-07-02 00:00:00,4848841,2,HAYAT VAX COVID-19,2021-08-03 18:20:22
9996,9996,TOMAS,SANTACRUZ LOPEZ,USF-SIMON BOLIVAR,2021-05-27 00:00:00,1480679,1,HAYAT VAX COVID-19,2021-08-03 18:20:22
9997,9997,BLANCA RAMONA,ARRUA GARAY,PS J. A. Saldivar,2021-07-16 00:00:00,3565727,1,PFIZER - COVID -19,2021-08-03 18:20:22
9998,9998,MARTINA,GUERRERO BRIZUELA,HG - SAN LORENZO,2021-05-24 00:00:00,3396919,1,SPUTNIK V COVID-19,2021-08-03 18:20:22


In [8]:
pd.read_sql_table('vacunados', engine, columns=['nombre', 'apellido', 'descripcion_vacuna']) # Leer tabla entera pero algunas columnas

Unnamed: 0,nombre,apellido,descripcion_vacuna
0,LUIS GERMAN,DUARTE BALBUENA,PFIZER - COVID -19
1,CLAUDIO LIBERATO,BAEZ FIGUEREDO,ASTRAZENECA-CHADOX1-S - COVID-19
2,MONICA,ABENTE ARRELLAGA,PFIZER - COVID -19
3,GLADYS,CESPEDES DE ALVAREZ,ASTRAZENECA-CHADOX1-S - COVID-19
4,MARIO,RODAS,HAYAT VAX COVID-19
...,...,...,...
9995,JESSICA GABRIELA,ROMERO LOPEZ,HAYAT VAX COVID-19
9996,TOMAS,SANTACRUZ LOPEZ,HAYAT VAX COVID-19
9997,BLANCA RAMONA,ARRUA GARAY,PFIZER - COVID -19
9998,MARTINA,GUERRERO BRIZUELA,SPUTNIK V COVID-19
