# Python con Bases de datos (Database)

Este manual será útil para las personas que quieran acceder a manipular una base de datos MySQL, para ellos existen varios paquetes que pueden servir en este caso se usarán los siguientes paquetes:

- $pymysql$
- $pandas$

## Conexión con el paquete $pymysql$ a la base de datos de MySQL

En el siguiente [link](https://media.readthedocs.org/pdf/pymysql/latest/pymysql.pdf) encuentra material del paquete $pymysql$.

Para generar la conexión a la base de datos de MySQL deben tener en cuenta los parámetros para la conexión como son los siguientes:

- $host$: Es el host que tiene por defecto su computador en la mayoría de los casos 'localhost'.
- $user$: Es el nombre del usuario que tiene configurado en su base de datos.
- $password$: Es la clave de conexión a la base de datos.
- $port$: Es el puerto de conexión que posee para su base de datos.
- $charset$: Es la codificación de la conexión.
- $db$: Nombre de la base de datos a la cual se quiere conectar.

Existen muchos más parámetros los cuales pueden ser consultados en el link anterior, pero por lo general los parámetros acá expuestos son los más necesarios para lograr generar un conexión.

In [2]:
# Generamos una conexión con el paquete pymysql
import pymysql
import pandas as pd

# Conexión
connection = pymysql.connect(host='localhost',
                             user='root',
                             password='root',
                             db='prueba',
                             charset='utf8mb4',
                             cursorclass=pymysql.cursors.DictCursor)


In [8]:
# Vemos la conexión
connection

<pymysql.connections.Connection at 0x2162d42e400>

In [62]:
# Creamos una consulta a la base de datos
with connection.cursor() as cursor:
    sql = "SELECT * FROM prueba.iris"
    cursor.execute(sql)
    #resultados = cursor.fetchone()
    resultados = cursor.fetchall()
    print(resultados)

[{'Sepal_Length': 5.1, 'Sepal_Width': 3.5, 'Petal_Length': 1.4, 'Petal_Width': 0.2, 'Species': 'setosa'}, {'Sepal_Length': 4.9, 'Sepal_Width': 3.0, 'Petal_Length': 1.4, 'Petal_Width': 0.2, 'Species': 'setosa'}, {'Sepal_Length': 4.7, 'Sepal_Width': 3.2, 'Petal_Length': 1.3, 'Petal_Width': 0.2, 'Species': 'setosa'}, {'Sepal_Length': 4.6, 'Sepal_Width': 3.1, 'Petal_Length': 1.5, 'Petal_Width': 0.2, 'Species': 'setosa'}, {'Sepal_Length': 5.0, 'Sepal_Width': 3.6, 'Petal_Length': 1.4, 'Petal_Width': 0.2, 'Species': 'setosa'}, {'Sepal_Length': 5.4, 'Sepal_Width': 3.9, 'Petal_Length': 1.7, 'Petal_Width': 0.4, 'Species': 'setosa'}, {'Sepal_Length': 4.6, 'Sepal_Width': 3.4, 'Petal_Length': 1.4, 'Petal_Width': 0.3, 'Species': 'setosa'}, {'Sepal_Length': 5.0, 'Sepal_Width': 3.4, 'Petal_Length': 1.5, 'Petal_Width': 0.2, 'Species': 'setosa'}, {'Sepal_Length': 4.4, 'Sepal_Width': 2.9, 'Petal_Length': 1.4, 'Petal_Width': 0.2, 'Species': 'setosa'}, {'Sepal_Length': 4.9, 'Sepal_Width': 3.1, 'Petal_Lengt

Otra forma de realizar las consultas a la base de datos es por medio del paquete $pandas$, con las siguientes funciones mirar el siguiente [link](https://pandas.pydata.org/pandas-docs/stable/pandas.pdf):

- $read\_sql\_query$
- $read\_sql\_table$
- $read\_sql$
- $DataFrame.to\_sql$

In [61]:
# Para realizar la consulta de la tabla iris con la función (read_sql_query)
pd.read_sql_query("SELECT * FROM prueba.iris", connection)

Unnamed: 0,Sepal_Length,Sepal_Width,Petal_Length,Petal_Width,Species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa
5,5.4,3.9,1.7,0.4,setosa
6,4.6,3.4,1.4,0.3,setosa
7,5.0,3.4,1.5,0.2,setosa
8,4.4,2.9,1.4,0.2,setosa
9,4.9,3.1,1.5,0.1,setosa


In [60]:
# Prueba de consulta con la función read_sql 
# En este caso seleccionamos la tabla iris completa
pd.read_sql('SELECT * FROM iris', connection)

Unnamed: 0,Sepal_Length,Sepal_Width,Petal_Length,Petal_Width,Species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa
5,5.4,3.9,1.7,0.4,setosa
6,4.6,3.4,1.4,0.3,setosa
7,5.0,3.4,1.5,0.2,setosa
8,4.4,2.9,1.4,0.2,setosa
9,4.9,3.1,1.5,0.1,setosa


In [59]:
# Se realiza una consulta de solo las columnas (Sepal.Length, Sepal.Width) 
pd.read_sql_query("SELECT Sepal_Length, Species FROM prueba.iris", connection)

Unnamed: 0,Sepal_Length,Species
0,5.1,setosa
1,4.9,setosa
2,4.7,setosa
3,4.6,setosa
4,5.0,setosa
5,5.4,setosa
6,4.6,setosa
7,5.0,setosa
8,4.4,setosa
9,4.9,setosa


In [64]:
# Consulta un poco más compleja 
sql = 'SELECT AVG(Sepal_Length) as Prom_Sepal_Length, Species FROM prueba.iris GROUP BY Species'
pd.read_sql_query(sql, connection)

Unnamed: 0,Prom_Sepal_Length,Species
0,5.006,setosa
1,5.936,versicolor
2,6.588,virginica
