# Python + SQL: MySQL Connector/Python

En esta lección vamos a aprender a conectarnos a bases de datos y realizar consultas SQL básicas desde un script de Python gracias al uso de MySQL Connector/Python.


## Conexión a una base de datos usando MySQL Connector:

A continuación vamos a ver cómo podemos conectarnos a una base de datos MySQL existente desde un script de Python usando *connect*.

El constructor de la clase, *connect()* crea una conexión al servidor MySQL y devuelve un objeto de tipo MySQLConnection. Veamos cómo usarlo mediante un ejemplo:


🚨🚨 **NOTA** 🚨🚨 En caso de que la celda de abajo os de error deberéis escribir en la terminal: 

```
pip install mysql-connector

y 

pip install mysql-connector-python
```

Para hacer esto fijaos que en la terminal os ponga "base" y que en el jupyter en la parte de arriba a la derecha ponga "base (y la versión de Python)". Después de esto, volved a ejecutar la celda. 

### Descripción de los argumentos de *connect()*

Antes de empezar, vamos a ver algunos de los argumentos principales que usaremos para la conexión a una base de datos usando el constructor *connect()*. 

- `user`: el nombre de usuario con el que nos queremos autenticar en el servidor MySQL. 

- `password`: la contraseña con la que nos queremos autenticar en el servidor MySQL. 

- `database`: el nombre de la base de datos a la que nos queremos conectar.

- `host`: el nombre o la dirección IP del servidor MySQL. El valor por defecto es "localhost" (o 127.0.0.1 que es lo mismo).

- `port`: el puerto TCP/IP del servidor MySQL. Debe ser un número entero. El valor por defecto es el puerto 3306.

Existen más argumentos que son opcionales o que se usarán cuando queramos configurar la conexión de una manera muy concreta. Podéis consultar la descripción de todos los parámetros [aquí](https://dev.mysql.com/doc/connector-python/en/connector-python-connectargs.html). 

In [1]:
import mysql.connector

cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1',
                              database='tienda')

print(cnx)
cnx.close()

<mysql.connector.connection.MySQLConnection object at 0x000001ACA5716D00>


En ocasiones podemos sufrir errores de conexión, por lo que es interesante añadir manejo de excepciones al código anterior. Usando *errorcode* podemos crear casos para cada tipo de error posible:

In [2]:
# para añadir errores deberemos importarnos la siguiente librería
from mysql.connector import errorcode

# En este código estamos haciendo un try except. Si recordamos esto nos permitía hacer un manejo de los errores, para evitar que nuestro código se pare. Para eso lo que estamos haciendo es
## intenta hacer la conexión son la base de datos de tienda 
try:
  cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1',
                              database='tienda')
# en caso de que no lo consigas por que hay algún error entonces ...
except mysql.connector.Error as err:

  # si es un error con la contraseña devuelveme un mensaje de acceso denegado ya que tenemos problemas con la contraseña
  if err.errno == errorcode.ER_ACCESS_DENIED_ERROR:
    print("Something is wrong with your user name or password")
  
  # si el error no tiene que ver con la contraseña, puede ser porque la base de datos no exista, devuelveme un mensaje de que la base de datos no existe
  elif err.errno == errorcode.ER_BAD_DB_ERROR:
    print("Database does not exist")
  
  # si no es por ninguno de los errores anteriores, printeame cual es el error que estoy teniendo en mi conexión
  else:
    print(err)
else:
  cnx.close()

Otra opción para pasar los argumentos de conexión a *connector()* es crear un diccionario que luego se pase como argumento al constructor:

In [3]:
config = {
  'user': 'root',
  'password': 'AlumnaAdalab',
  'host': '127.0.0.1',
  'database': 'tienda',
  'raise_on_warnings': True
}

cnx = mysql.connector.connect(**config)

cnx.close()


## Desconexión de la base de datos usando MySQLConnector

Una vez hayamos terminado de realizar las consultas o trabajar de cualquier modo con la base de datos a la que nos hemos conectado con el connector, tendremos que desconectarnos usando el método *close()*:

In [4]:

config = {
  'user': 'root',
  'password': 'AlumnaAdalab',
  'host': '127.0.0.1',
  'database': 'tienda',
  'raise_on_warnings': True
}

cnx = mysql.connector.connect(**config)

cnx.close()

En este fragmente de código hemos creado la conexión cnx a la base de datos "tienda". Usando esa conexión podríamos por ejemplo realizar consultas sobre los datos almacenados en sus tablas (más adelante veremos como hacerlo). Una vez hayamos terminado y nos queramos desconectar será necesario usar el método *close()* del objeto connector que hemos definido (en este caso llamado cnx). Este método no recibe argumentos, por lo que su uso es sencillo.

## Realización de queries usando MySQLConnector:

Para realizar consultas a tablas de la base de datos a la que nos hemos conectado usando *connect()*, podemos usar el método *cursor()*. Empecemos viendo un ejemplo sencillo:

In [5]:

# realizamos la conexión con la base de datos que queremos como hemos aprendido hasta ahora
cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1',
                              database='tienda')

# Iniciamos el cursor y lo almacenamos en una variable llamada "cursor". Con esto estaremos creando un objeto de tipo cursor al que luego llamaremos para ejecutar las consultas SQL, 
## es decir, es el que nos va a permitir comunicarnos con la base de datos de SQL
cursor = cnx.cursor()

# El siguiente paso consiste en definir la consulta (query) que queremos realizar. 
## Para ello usamos todos los conocimientos sobre SQL que hemos adquirido durante el curso. La consulta se define como un string o cadena de texto.
### La consulta SQL de este ejemplo es sencilla y estática, pero podría incluir variables (lo veremos más adelante). 

query = ("""SELECT city, state FROM customers 
         WHERE customer_number BETWEEN 121 AND 124""")

# Luego llamamos al método execute() del cursor, al que pasamos como argumento el string que contiene la consulta.
## De esta manera se ejecuta la consulta en la base de datos y si todo va correctamente, el resultado se almacenará en el cursor.
cursor.execute(query)

# es el momento de ver los resultados, como dijimos se almacenan en la variable "cursor". Para ello, usaremos un for loop para acceder a los resultados de una forma "humana". 

# Dependiendo del número de resultados que devuelva la consulta, será más interesante usar un método de acceso a los mismos u otro. 
## En el ejemplo anterior, hemos decidido usar el objeto cursor como un iterable e ir accediendo a cada registro mediante un bucle for. 
### Cada llamada al iterable de esta manera nos ha ido devolviendo un valor para cada atributo seleccionado en la consulta.
####  Más adelante veremos opciones alternativas para acceder a los resultados de las consultas.
for ciudad, estado in cursor:
  print(f"La ciudad {ciudad} pertenece al estado  {estado}")

cursor.close()
cnx.close()

La ciudad Stavern pertenece al estado  None
La ciudad San Rafael pertenece al estado  CA


Imaginemos ahora que nuestro jefe esta interesado en buscar el número de cliente, su estatus, la fecha en la que se realizó y el número de la factura de los pedidos que tenemos en nuestra base de datos. Pero no nos interesa para todas las fechas, solo queremos esta información para los pedidos realizados entre las siguientes fechas: 

- 1 Enero 2003
- 31 Marzo 2003. 

Para esto lo primero que vamos a necesitar son las fechas, pero para esto recordemos que SQL necesita un formato específico (AAAA-MM-DD). Podríamos pasar las fechas a mano, pero esto es muy poco eficaz. Para sacar las fechas en el formato que necesitamos usaremos la librería `datetime`

In [6]:
import datetime

hire_start = datetime.date(2003, 1, 1)
hire_end = datetime.date(2003, 3, 31)

print(f"La fecha de inicio es {hire_start} y la de final es {hire_end}")

La fecha de inicio es 2003-01-01 y la de final es 2003-03-31


`datetime` es una librería suuuper útil cuando queremos trabajar con fechas. [Aquí](https://www.programiz.com/python-programming/datetime) os dejamos más documentación sobre esta librería.

Genial! Ya tenemos nuestras fechas en el formato que necesitamos. Ahora es el momento de ponernos a construir el código que necesitamos como aprendimos hasta ahora. 

In [7]:

# realizamos la conexión con la BBDD que queremos
cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1',
                              database='tienda')

# iniciamos el cursor                               
cursor = cnx.cursor()

# escribimos la query con los datos que querremos extraer. Aquí, si nos fijamos hay una cosa que nos debe llamar la atención, y es la sintaxis que usamos en el WHERE, en conreto el símbolo "%s". 
## esto nos servirá para hacer queries dinámicas. En este caso, al poner estos símbolos lo que hacemos es decirle a SQL que será un valor que puede cambiar. ¿Nuestra duda ahora puede ser, como le pasamos esos valores?
### esto lo haremos cuando ejecutemos en el comando execute, como vemos en la siguiente línea. 
query = ("SELECT customer_number, status, order_date, order_number FROM orders "
         "WHERE order_date BETWEEN %s AND %s")

# si nos fijamos aquí la cosa ha cambiado un poco respecto al ejemplo anterior, y es que vemos que hemos añadido una tupla con las variables de las fechas sobre las que queremos buscar. Así es como especificaremos cuales
## son los valores específicos de nuestra búsqueda.  
cursor.execute(query, (hire_start, hire_end))

# por último mostramos los resultados de la misma forma que en el ejemplo anterior. 
for customer_number, status, order_date, order_number in cursor:
  print(f"El numero de orden {order_number}, esta en estado {status} con fecha {order_date}")

cursor.close()
cnx.close()

El numero de orden 10100, esta en estado Shipped con fecha 2003-01-06
El numero de orden 10101, esta en estado Shipped con fecha 2003-01-09
El numero de orden 10102, esta en estado Shipped con fecha 2003-01-10
El numero de orden 10103, esta en estado Shipped con fecha 2003-01-29
El numero de orden 10104, esta en estado Shipped con fecha 2003-01-31
El numero de orden 10105, esta en estado Shipped con fecha 2003-02-11
El numero de orden 10106, esta en estado Shipped con fecha 2003-02-17
El numero de orden 10107, esta en estado Shipped con fecha 2003-02-24
El numero de orden 10108, esta en estado Shipped con fecha 2003-03-03
El numero de orden 10109, esta en estado Shipped con fecha 2003-03-10
El numero de orden 10110, esta en estado Shipped con fecha 2003-03-18
El numero de orden 10111, esta en estado Shipped con fecha 2003-03-25
El numero de orden 10112, esta en estado Shipped con fecha 2003-03-24
El numero de orden 10113, esta en estado Shipped con fecha 2003-03-26



Cómo detalle, hasta ahora al `cursor` no le hemos pasado ningún parámetro, pero lo podemos hacer. Los argumentos que podemos usar para inicializarlo y algunos métodos útiles que podemos llamar desde nuestro código Python:

```python
cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1',
                              database='tienda')
cursor = cnx.cursor([arg=value[, arg=value]...])
```

Los argumentos que se pueden pasar al método *cursor()* son:

- **buffered**: si es True, el cursor recupera (fetch) todas las filas de la base de datos cuando se ejecuta la query. Este tipo de cursors es útil cuando las consultas devuelven un número pequeño de resultados, o cuando queremos combinar el resultado de múltiples queries. En el caso de que lo configuremos como False, las filas de la base de datos se irán recuperando según se vayan solicitando (por ejemplo cuando usamos el cursor como un iterable). De esta manera no llenaremos la memoria de la máquina cuando las consultas devuelvan un número muy elevado de registros.
 
- **raw**: si lo configuramos como True, el cursor no realizará las conversiones automáticas entre tipos de datos de MySQL y Python (como sí hacía en el caso de las fechas en los ejemplos que hemos visto anteriormente). Un cursor de tipo raw es interesante cuando queremos máxima velocidad o cuando queremos hacer alguna otra conversión diferente a la por defecto.

- **dictionary**: si lo configuramos como True, el cursor devolverá las filas de los resultados como diccionarios. 

- **named_tuple**: si lo configuramos como True, el cursor devolverá las filas de los resultados como named tuples (tuplas con un nombre por el que podemos llamarlas para recuperar su contenido).

- **prepared**: si este argumento tiene el valor True, el cursor se configurará para ejecutar sentencias “prepared”.<!--¿SIGNIFICADO DE ESTO?-->

- **cursor_class**: un argumento que se puede usar para indicar que subclase queremos usar para instanciar el nuevo cursor. Hay varias clases que heredan de MySQLCursor como MySQLCursor Buffered, MySQLCursorRaw, etc. Dependiendo de la combinación de argumentos que pasemos a *cursor()* crearemos un cursor de una u otra de esas clases. Sin embargo, la clase final puede forzarse usando este argumento.


## Conocer las bases de datos del servidor

Si queremos conocer qué bases de datos existen en un servidor concreto, podemos hacerlo con el comando `SHOW DATABASES`, veamos como hacerlo:

In [8]:
# conectamos con la BBDD
mydb = mysql.connector.connect(
                  user='root', password='AlumnaAdalab',
                  host='127.0.0.1',
                  database='tienda')
# iniciamos el cursor
mycursor = mydb.cursor()

# ejecutamos nuestra query para que nos muestre las BBDD que tenemos en nuestro servidor
mycursor.execute("SHOW DATABASES")

for x in mycursor:
  print(x)


('bd_alumna',)
('bd_pruebas',)
('creacion_tienda',)
('information_schema',)
('leccion-1-sql',)
('leccion-2-sql',)
('leccion_10_sql',)
('leccion_11_sql',)
('leccion_12_sql',)
('leccion_13_sql',)
('leccion_14_sql',)
('leccion_3_sql',)
('leccion_4_sql',)
('leccion_5_sql',)
('leccion_6_sql',)
('leccion_7_sql',)
('leccion_8_sql',)
('leccion_9_sql',)
('mysql',)
('northwind',)
('performance_schema',)
('project1',)
('sakila',)
('spotify',)
('tienda',)
('tienda_zapatillas',)
('world',)


Normalmente en todos los servidores MySQL tendremos las bases de datos que hemos creado, y adicionalmente otras bases de datos adicionales llamadas 'mysql', 'sys' 'information_schema' y 'performance_schema'. Esas bases de datos contienen tablas con información acerca del propio servidor, las otras bases de datos y sus tablas, etc. En la siguiente sección por ejemplo usaremos 'information_schema' para conocer las tablas que componen una base de datos concreta.

## Conocer las tablas que componen una base de datos:

También podemos mostrar por pantalla los nombres de las tablas de una de las bases de datos del servidor. Para ello se usará la sentencia` SHOW TABLES`. De esta manera conoceremos mejor la estructura de la base de datos y si las tablas que queremos consultar se encuentran en ella.

In [9]:
# conectamos con el servidor
mydb = mysql.connector.connect(
              user='root', password='AlumnaAdalab',
              host='127.0.0.1',
              database='tienda'
)

# creamos el servidor
mycursor = mydb.cursor()

# ejecutamos la query para ver las tablas de la BBDD que hemos indicado en la conexión
mycursor.execute("SHOW TABLES")

for x in mycursor:
  print(x)

('customers',)
('employees',)
('offices',)
('order_details',)
('orders',)
('payments',)
('product_lines',)
('products',)
('proyectos',)


## Conocer las columnas que componen una tabla:

También podemos mostrar por pantalla la información de las columnas que componen una tabla específica. Podremos realizar esta tarea gracias a la existencia de la base de datos information_schema, cuyo objetivo es contener información acerca de el resto de las bases de datos del servidor y de sus tablas. La consulta que tendremos que realizar será la siguiente:

In [10]:

# conectamos con el servidor
mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  password="AlumnaAdalab",
  database="INFORMATION_SCHEMA" # en este caso tendremos que especificar que queremos información del esquema
)

# iniciamos el cursor
mycursor = mydb.cursor()

## ejecutamos nuestra query, especificando de que tabla queremos la información
mycursor.execute("SELECT * FROM COLUMNS WHERE TABLE_NAME = 'payments'")

for x in mycursor:
  print(x)
  break



('def', 'tienda', 'payments', 'customer_number', 1, None, 'NO', 'int', None, None, 10, 0, None, None, None, 'int', 'PRI', '', 'select,insert,update,references', '', '', None)


## Modos de acceso a los resultados de la consulta

Como vimos al inicio de la lección el uso de *execute()* hace que el cursor se convierta en un iterable al cual podemos acceder de diferentes maneras. En ejemplos anteriores hemos visto como podemos acceder a cada uno de los elemenos del mismo como si fuese una lista mediante un bucle *for*. Sin embargo, MySQL Connector/Python nos proporciona maneras específicas para realizarlo.

### fetchone()

Si lo que queremos es acceder a la primera fila del resultado, se puede utilizar el método *fetchone()*. Este método devolverá la primera fila del resultado de la consulta y avanzará el cursor al siguiente registro del resultado. Debido a esto, la siguiente vez que ejecutemos el método *fetchone()* en el mismo cursor, se mostrarán diferentes datos. Veámoslo con un ejemplo:


In [11]:
# conectamos con el servidor
mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  password="AlumnaAdalab",
  database="tienda"
)

# iniciamos el cursor
mycursor = mydb.cursor()

# ejecutamos nuestra query
mycursor.execute("SELECT * FROM employees")

# en este caso solo nos interesa el primer resultado de nuestra query, por lo que usaremos el método fetchone, para que python solo nos devuelva el primero y después printemos el resultado
myresult = mycursor.fetchone()
print(myresult)

# volvemos a ejecutar el método fetchone, como ya nos mostró el primer resultado, y no hemos cerrado la conexión, al volver a ejecutarlo, nos mostrará el segundo resultado. Pero si nos fijamos, lo hace de uno en uno. 
myresult = mycursor.fetchone()
print(myresult)

(1002, 'Murphy', 'Diane', 'x5800', 'dmurphy@classicmodelcars.com', '1', None, 'President')
(1056, 'Patterson', 'Mary', 'x4611', 'mpatterso@classicmodelcars.com', '1', 1002, 'VP Sales')


### fetchall()

Si por el contrario lo que queremos es seleccionar todos los resultados que ha devuelto una consulta SQL, podemos usar el método *fetchall()*: 

In [27]:
# establecemos la conexión con el servidor
mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  password="AlumnaAdalab",
  database="tienda"
)

# inciamos el cursor
mycursor = mydb.cursor()

# realizamos nuestra query
mycursor.execute("SELECT * FROM employees")

# le decimos a Python que nos devuelva todos los resultados de la query usando el método fetchall
myresult = mycursor.fetchall()
print(myresult)

[(1002, 'Murphy', 'Diane', 'x5800', 'dmurphy@classicmodelcars.com', '1', None, 'President'), (1056, 'Patterson', 'Mary', 'x4611', 'mpatterso@classicmodelcars.com', '1', 1002, 'VP Sales'), (1076, 'Firrelli', 'Jeff', 'x9273', 'jfirrelli@classicmodelcars.com', '1', 1002, 'VP Marketing'), (1088, 'Patterson', 'William', 'x4871', 'wpatterson@classicmodelcars.com', '6', 1056, 'Sales Manager (APAC)'), (1102, 'Bondur', 'Gerard', 'x5408', 'gbondur@classicmodelcars.com', '4', 1056, 'Sale Manager (EMEA)'), (1143, 'Bow', 'Anthony', 'x5428', 'abow@classicmodelcars.com', '1', 1056, 'Sales Manager (NA)'), (1165, 'Jennings', 'Leslie', 'x3291', 'ljennings@classicmodelcars.com', '1', 1143, 'Sales Rep'), (1166, 'Thompson', 'Leslie', 'x4065', 'lthompson@classicmodelcars.com', '1', 1143, 'Sales Rep'), (1188, 'Firrelli', 'Julie', 'x2173', 'jfirrelli@classicmodelcars.com', '2', 1143, 'Sales Rep'), (1216, 'Patterson', 'Steve', 'x4334', 'spatterson@classicmodelcars.com', '2', 1143, 'Sales Rep'), (1286, 'Tseng',

Si después quisieramos acceder a cada registro de los resultados, podemos hacerlo usando myresult como un iterable. Esto nos devolverá cada fila resultado como una tupla:

In [12]:
# conectamos con el servidor
mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  password="AlumnaAdalab",
  database="tienda"
)

# iniciamos el cursor
mycursor = mydb.cursor()

# realizamos la query
mycursor.execute("SELECT * FROM employees")

# le pedimos que nos muestre todos los resultados
myresult = mycursor.fetchall()

# accedemos a cada fila de una en una usando un bucle for. Fijaos que nos devuelve tuplas!!!
for x in myresult:
  print(x)

(1002, 'Murphy', 'Diane', 'x5800', 'dmurphy@classicmodelcars.com', '1', None, 'President')
(1056, 'Patterson', 'Mary', 'x4611', 'mpatterso@classicmodelcars.com', '1', 1002, 'VP Sales')
(1076, 'Firrelli', 'Jeff', 'x9273', 'jfirrelli@classicmodelcars.com', '1', 1002, 'VP Marketing')
(1088, 'Patterson', 'William', 'x4871', 'wpatterson@classicmodelcars.com', '6', 1056, 'Sales Manager (APAC)')
(1102, 'Bondur', 'Gerard', 'x5408', 'gbondur@classicmodelcars.com', '4', 1056, 'Sale Manager (EMEA)')
(1143, 'Bow', 'Anthony', 'x5428', 'abow@classicmodelcars.com', '1', 1056, 'Sales Manager (NA)')
(1165, 'Jennings', 'Leslie', 'x3291', 'ljennings@classicmodelcars.com', '1', 1143, 'Sales Rep')
(1166, 'Thompson', 'Leslie', 'x4065', 'lthompson@classicmodelcars.com', '1', 1143, 'Sales Rep')
(1188, 'Firrelli', 'Julie', 'x2173', 'jfirrelli@classicmodelcars.com', '2', 1143, 'Sales Rep')
(1216, 'Patterson', 'Steve', 'x4334', 'spatterson@classicmodelcars.com', '2', 1143, 'Sales Rep')
(1286, 'Tseng', 'Foon Yue'

MySQL Connector/Python permite usar todo tipo de consultas SQL como argumento del método *execute()*. En los ejercicios finales vas a practicar su uso con operadores de SQL tales como WHERE, GROUP BY, HAVING, ORDER BY, LIMIT, etc.

## Integración de resultados de MySQL Connector/Python con Pandas

**¿Qué es Pandas?**

Pandas es una librería para Python que es ampliamente utilizada para el manejo de datos a media/gran escala. Cuando estamos trabajando con datos estructurados en forma de tabla como los almacenados en una base de datos SQL, una hoja de cálculo tipo Excel, etc., podemos usar Pandas para cargar esos datos, limpiarlos, procesarlos para extraer información y combinar diferentes fuentes de datos, entre otras cosas.

En Pandas, la estructura básica en las que cargaremos los datos se llama DataFrame. Una vez hemos creado el DataFrame con las fuentes de datos de nuestra elección (csv, excel, sql, json, etc.) podemos utilizar métodos ya incluidos en la librería para calcular la media, la mediana, el máximo o el mínimo de una columna numérica, entre otros.También podemos combinar los valores de varias columnas en una sola, agruparlas por categorías, en incluso realizar gráficos de manera sencilla gracias a la integración de Pandas con Matplotlib.

En esta parte de la lección veremos como cargar datos de una base de datos MySQL a un DataFrame de Pandas y haremos algunos cálculos sencillos sobre esos datos. En posteriores lecciones veremos una introducción más profunda a Pandas y a cómo usarlo. El objetivo de los siguientes ejemplos es simplemente que os quede claro cómo integrar MySQL Connector/Python con Pandas.


## Crear un dataframe de Pandas a partir de una sentencia SQL:

Como hemos indicado anteriormente, Pandas soporta la integración sencilla con muchos formatos de archivo y fuentes de datos: ficheros csv, excel y json, bases de datos sql, etc. Por ejemplo, para leer los datos de una base de datos SQL podemos ejecutar el siguiente trozo de código, el cual incluye una llamada al método constructor de DataFrames: 

In [13]:
# importamos pandas
import pandas as pd

# hacemos la conexión con el servidor
cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1',
                              database='tienda')

# iniciamos el cursor
mycursor = cnx.cursor()

# ejecutamos nuestra query
mycursor.execute("SELECT * FROM employees")

# le decimos que nos devuelva todos los resultados y los almacenamos en una variable llamada myresult
myresult = mycursor.fetchall()

#Creamos un dataframe con los resultados de la consulta SQL almacenados en myresult. Si os fijais le estamos pasando un parámetro llamado "columns" donde estamos especificando cuáles son las columnas de lo que será nuestro dataframe
df = pd.DataFrame(myresult, columns = ['ID', 'Nombre', 'Apellido','Email','Telefono','Direccion','Ciudad','Pais'])

#Cerramos la conexion
cnx.close()

In [14]:
# mostramos las 5 primeras filas del dataframe usando el método .head()
df.head()

Unnamed: 0,ID,Nombre,Apellido,Email,Telefono,Direccion,Ciudad,Pais
0,1002,Murphy,Diane,x5800,dmurphy@classicmodelcars.com,1,,President
1,1056,Patterson,Mary,x4611,mpatterso@classicmodelcars.com,1,1002.0,VP Sales
2,1076,Firrelli,Jeff,x9273,jfirrelli@classicmodelcars.com,1,1002.0,VP Marketing
3,1088,Patterson,William,x4871,wpatterson@classicmodelcars.com,6,1056.0,Sales Manager (APAC)
4,1102,Bondur,Gerard,x5408,gbondur@classicmodelcars.com,4,1056.0,Sale Manager (EMEA)


Otra opción más directa para ver los resultados de nuestra query en un DataFrame consiste en encargarle a Pandas directamente la ejecución de la consulta SQL. Para ello usaremos el método *read_sql_query()* como vemos a continuación: 

In [16]:

# realizamos la conexión con el servidor
cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1',
                              database='tienda')


# escribimos nuestra query
sql = "SELECT * FROM employees"

# utilizamos el método pd.read_sql_qury() para convertir los resultados de nuestra query en un DataFrame que podamos ver de forma amigable en Python
df = pd.read_sql_query(sql, cnx)

#Lo siguiente es un wrap up que funciona tanto con una tabla como con una consulta SQL.
pd.read_sql(sql, cnx)

#Cerramos la conexion
cnx.close()

  df = pd.read_sql_query(sql, cnx)
  pd.read_sql(sql, cnx)


In [17]:
# mostramos las 10 primeras filas de nuestros resultados 
df.head(10)


Unnamed: 0,employee_number,last_name,first_name,extension,email,office_code,reports_to,job_title
0,1002,Murphy,Diane,x5800,dmurphy@classicmodelcars.com,1,,President
1,1056,Patterson,Mary,x4611,mpatterso@classicmodelcars.com,1,1002.0,VP Sales
2,1076,Firrelli,Jeff,x9273,jfirrelli@classicmodelcars.com,1,1002.0,VP Marketing
3,1088,Patterson,William,x4871,wpatterson@classicmodelcars.com,6,1056.0,Sales Manager (APAC)
4,1102,Bondur,Gerard,x5408,gbondur@classicmodelcars.com,4,1056.0,Sale Manager (EMEA)
5,1143,Bow,Anthony,x5428,abow@classicmodelcars.com,1,1056.0,Sales Manager (NA)
6,1165,Jennings,Leslie,x3291,ljennings@classicmodelcars.com,1,1143.0,Sales Rep
7,1166,Thompson,Leslie,x4065,lthompson@classicmodelcars.com,1,1143.0,Sales Rep
8,1188,Firrelli,Julie,x2173,jfirrelli@classicmodelcars.com,2,1143.0,Sales Rep
9,1216,Patterson,Steve,x4334,spatterson@classicmodelcars.com,2,1143.0,Sales Rep


El método *read_sql_query()* necesita como argumentos un string de texto que contenga la consulta SQL que queramos realizar, y una variable que contenga la conexión con la base de datos sobre la que se vaya a ejecutar la consulta (en este caso la hemos obtenido con el método *connect()* de MySQL Connector pero acepta otras opciones). El resultado es el mismo que cuando usamos *myresult* como argumento del constructor de DataFrame, con la ventaja de que en este caso los nombres de las columnas del dataframe se toman automáticamente de los nombres de las columnas del resultado de la consulta SQL.

## Guardado de datos:

Una vez hayamos obtenido los resultados que queremos mediante el procesado de los datos con Pandas, esta librería también proporciona diferentes maneras de almacenar los datos gracias a el uso de los métodos *to_\** (cuyo nombre variará en función del formato en el que se quieren guardar los datos). Veamos unos ejemplos al respecto:

In [20]:
# En este ejemplo calculabamos el valor más frecuente para el pais de las alumnas. 
# Ahora lo almacenaremos de diferentes formas.

#Creamos la conexion con el servidor
cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1',
                              database='tienda')

#Realizamos la consulta a la tabla alumnas mediante pandas
sql = "SELECT * FROM employees"
df = pd.read_sql_query(sql, cnx)


#Guardamos el dato en un fichero csv (separado por comas)
df.to_csv("fichero.csv")

#Formateamos el dato a un tipo string para facilitar la lectura en la consola
output_string = df.to_string()
print(output_string)

#Formateamos el dato a un tipo string para facilitar la inserción de los datos en un documento latex (el formato usado más comunmente en la escritura de artículos científicos)
output_latex = df.to_latex()
print(output_latex)


#Cerramos la conexion
cnx.close()

    employee_number  last_name first_name extension                            email office_code  reports_to             job_title
0              1002     Murphy      Diane     x5800     dmurphy@classicmodelcars.com           1         NaN             President
1              1056  Patterson       Mary     x4611   mpatterso@classicmodelcars.com           1      1002.0              VP Sales
2              1076   Firrelli       Jeff     x9273   jfirrelli@classicmodelcars.com           1      1002.0          VP Marketing
3              1088  Patterson    William     x4871  wpatterson@classicmodelcars.com           6      1056.0  Sales Manager (APAC)
4              1102     Bondur     Gerard     x5408     gbondur@classicmodelcars.com           4      1056.0   Sale Manager (EMEA)
5              1143        Bow    Anthony     x5428        abow@classicmodelcars.com           1      1056.0    Sales Manager (NA)
6              1165   Jennings     Leslie     x3291   ljennings@classicmodelcars.co

  df = pd.read_sql_query(sql, cnx)
  output_latex = df.to_latex()


En el código anterior hemos visto cómo guardar los datos obtenidos con Pandas en diferentes formatos: un fichero .csv para su posible procesado en un futuro, un string para su visualización por pantalla y un formateo estilo latex para su uso en documentos científicos. Cabe resaltar que estos son solo tres ejemplos sencillos, pero que en la documentación de Pandas podéis encontrar muchos más ejemplos acerca de los formatos en los que se pueden guardar los datos: [Aquí](https://pandas.pydata.org/docs/reference/#) podréis encontrar más documentación.  


#### ENUNCIADO EJERCICIOS

En este conjunto de ejercicios vamos a volver a usar la tabla Customers (Clientes/as) que vamos a importar en MySQL Workbench. Si tienes dudas de como importarla, revisita la página asociada de tutorial.

La tabla Customers tiene las siguientes columnas:

**Customers**(`customerNumber`, `customerName`, `contactLastName`, `contactFirstName`, `phone`, `addressLine1`, `addressLine2`, `city`, `state`, `postalCode`, `country`, `salesRepEmployeeNumber`, `creditLimit`) 

Cada columna es bastante autodescriptiva en su nombre, pero vamos a incluir una pequeña descripción: 

- *customerNumber*: el número identificativo de las clientas/es. Es un número entero y sirve de clave primaria.
- *customerName*: el nombre de las empresas en las que trabajan las/los clientas/es. Es una cadena de texto.
- *contactLastName*: El apellido de la persona de contacto en la empresa cliente. Es una cadena de texto.
- *contactFirstName*: El nombre de la persona de contacto en la empresa cliente. Es una cadena de texto.
- *phone*: El teléfono de la persona de contacto en la empresa cliente. Es una cadena de texto (ya que hay espacios).
- *adressLine1*: La dirección (calle, número, etc.) de la empresa cliente. Es una cadena de texto.
- *adressLine2*: La dirección de la empresa cliente (si se necesita mas espacio). Es una cadena de texto. Muchas veces está vacía.
- *city*: La ciudad de la empresa cliente.
- *state*: El estado en el que se encuentra la empresa cliente. Válido para los Estados Unidos. Es una cadena de texto.
- *postalCode*: El código postal. Es una cadena de texto (ya que puede haber espacios).
- *country*: El país de la empresa cliente. Es una cadena de texto.
- *salesRepEmployeeNumber*: El número identificador de la empleada o empleado que lleva a esa empresa cliente. Es un número entero.
- *creditLimit*: El límite de crédito que tiene la empresa cliente. 

La tabla Employees tiene las siguientes columnas: 

- *employeeNumber*: el número identificativo de las empleadas/os. Es un número entero y sirve de clave primaria.
- *lastName*: el apellido de las empleadas. Es una cadena de texto.
- *firstName*: el nombre de las empleadas. Es una cadena de texto.
- *extension*: su extensión telefónica. Es una cadena de texto.
- *email*: el correo electrónico de la empleada. Es una cadena de texto.
- *officeCode*: El código de la oficina de la empleada. Es una cadena de texto.
- *reportsTo*: el número identificativo de la empleada a la que reporta (su supervisora). Es un número entero y clave foránea (relacionada con employeeNumber).
- *jobTitle*: el nombre del puesto de trabajo que desempeña. Es una cadena de texto.



#### EJERCICIO 1

Imprime por pantalla el nombre de las tablas que componen la base de datos "tienda".

In [21]:
# conectamos con el servidor
mydb = mysql.connector.connect(
              user='root', password='AlumnaAdalab',
              host='127.0.0.1',
              database='tienda'
)

# creamos el servidor
mycursor = mydb.cursor()

# ejecutamos la query para ver las tablas de la BBDD que hemos indicado en la conexión
mycursor.execute("SHOW TABLES")

for x in mycursor:
  print(x)

('customers',)
('employees',)
('offices',)
('order_details',)
('orders',)
('payments',)
('product_lines',)
('products',)
('proyectos',)


#### EJERCICIO 2

Imprime por pantalla la información acerca de las columnas que componen la tabla "Employees":

In [24]:
# conectamos con el servidor
mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  password="AlumnaAdalab",
  database="INFORMATION_SCHEMA" # en este caso tendremos que especificar que queremos información del esquema
)

# iniciamos el cursor
mycursor = mydb.cursor()

## ejecutamos nuestra query, especificando de que tabla queremos la información
mycursor.execute("SELECT * FROM COLUMNS WHERE TABLE_NAME = 'Employees'")

for x in mycursor:
  print(x)
 
 

('def', 'creacion_tienda', 'employees', 'employee_number', 1, None, 'NO', 'int', None, None, 10, 0, None, None, None, 'int', 'PRI', '', 'select,insert,update,references', '', '', None)
('def', 'creacion_tienda', 'employees', 'last_name', 2, None, 'NO', 'varchar', 50, 200, None, None, None, 'utf8mb4', 'utf8mb4_0900_ai_ci', 'varchar(50)', '', '', 'select,insert,update,references', '', '', None)
('def', 'creacion_tienda', 'employees', 'first_name', 3, None, 'NO', 'varchar', 50, 200, None, None, None, 'utf8mb4', 'utf8mb4_0900_ai_ci', 'varchar(50)', '', '', 'select,insert,update,references', '', '', None)
('def', 'creacion_tienda', 'employees', 'extension', 4, None, 'NO', 'varchar', 10, 40, None, None, None, 'utf8mb4', 'utf8mb4_0900_ai_ci', 'varchar(10)', '', '', 'select,insert,update,references', '', '', None)
('def', 'creacion_tienda', 'employees', 'email', 5, None, 'NO', 'varchar', 100, 400, None, None, None, 'utf8mb4', 'utf8mb4_0900_ai_ci', 'varchar(100)', '', '', 'select,insert,update,

#### EJERCICIO 3

Realiza una consulta SELECT que obtenga los nombres, teléfonos y direcciones de todas las empresas cliente de la tabla customers. Imprime por pantalla los datos recuperados usando el método *fetchone()*

In [34]:
# conectamos con el servidor
mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  password="AlumnaAdalab",
  database="tienda"
)

# iniciamos el cursor
mycursor = mydb.cursor()

# ejecutamos nuestra query
mycursor.execute("SELECT customer_name, phone, address_line1 FROM customers")

# en este caso solo nos interesa el primer resultado de nuestra query, por lo que usaremos el método fetchone, para que python solo nos devuelva el primero y después printemos el resultado
myresult = mycursor.fetchone()
print(myresult)


('Atelier graphique', '40.32.2555', '54, rue Royale')


#### EJERCICIO 4

Buscar aquellos registros de la tabla Customers que correspondan a clientes de USA pero que no tengan un valor guardado para el campo *state*. Accede a los datos con *fetchall()*

In [27]:
mycursor.execute("""SELECT * FROM customers
                    WHERE country = 'USA' and state IS NULL""")

# en este caso solo nos interesa el primer resultado de nuestra query, por lo que usaremos el método fetchone, para que python solo nos devuelva el primero y después printemos el resultado
myresult = mycursor.fetchall()
print(myresult)

InternalError: Unread result found

#### EJERCICIO 5

Realiza una consulta SELECT que obtenga el número identificativo de cliente más bajo de la base de datos.


In [41]:
mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  password="AlumnaAdalab",
  database="tienda"
)

mycursor = mydb.cursor()
mycursor.execute("""SELECT customer_number FROM customers
                    ORDER BY customer_number ASC           
                """)


myresult = mycursor.fetchone()
print(myresult)

(103,)


#### EJERCICIO 6

Selecciona el máximo de credito que tiene cualquiera de los clientes del empleado con número 167.

In [44]:
mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  password="AlumnaAdalab",
  database="tienda"
)

mycursor = mydb.cursor()

mycursor.execute("""SELECT MAX(credit_limit) FROM customers
                    WHERE customer_number = 167  
                """)


myresult = mycursor.fetchone()
print(myresult)

(Decimal('96800.00'),)


#### EJERCICIO 7

Selecciona el número de clientes en cada pais.

In [46]:
mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  password="AlumnaAdalab",
  database="tienda"
)

mycursor = mydb.cursor()

mycursor.execute("""SELECT COUNT(DISTINCT(customer_number)), country FROM customers
                    GROUP BY country
                """)


myresult = mycursor.fetchall()
print(myresult)

[(5, 'Australia'), (2, 'Austria'), (2, 'Belgium'), (3, 'Canada'), (2, 'Denmark'), (3, 'Finland'), (12, 'France'), (13, 'Germany'), (1, 'Hong Kong'), (2, 'Ireland'), (1, 'Israel'), (4, 'Italy'), (2, 'Japan'), (1, 'Netherlands'), (4, 'New Zealand'), (1, 'Norway'), (2, 'Norway  '), (1, 'Philippines'), (1, 'Poland'), (2, 'Portugal'), (1, 'Russia'), (3, 'Singapore'), (1, 'South Africa'), (7, 'Spain'), (2, 'Sweden'), (3, 'Switzerland'), (5, 'UK'), (36, 'USA')]


#### EJERCICIO 8

Crea un dataframe que contenga todas las entradas de la tabla Customers. Para ello usa un *cursor* y el método *execute()*:

In [51]:
import pandas as pd

# hacemos la conexión con el servidor
cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1',
                              database='tienda')

# iniciamos el cursor
mycursor = cnx.cursor()

# ejecutamos nuestra query
mycursor.execute("SELECT * FROM customers")

# le decimos que nos devuelva todos los resultados y los almacenamos en una variable llamada myresult
myresult = mycursor.fetchall()

#Creamos un dataframe con los resultados de la consulta SQL almacenados en myresult. Si os fijais le estamos pasando un parámetro llamado "columns" donde estamos especificando cuáles son las columnas de lo que será nuestro dataframe
df = pd.DataFrame(myresult, columns = ['num_cliente', 'Nombre Cliente', 'Apellido', 'Nombre', 'Telefono', 'Dirección 1', 'Dirección 2', 'ciudad', 'Estado', 
                                        'Codigo postal', 'pais', 'Num_empleado', 'Crédito'])

df.head()


Unnamed: 0,num_cliente,Nombre Cliente,Apellido,Nombre,Telefono,Dirección 1,Dirección 2,ciudad,Estado,Codigo postal,pais,Num_empleado,Crédito
0,103,Atelier graphique,Schmitt,Carine,40.32.2555,"54, rue Royale",,Nantes,,44000,France,1370.0,21000.0
1,112,Signal Gift Stores,King,Jean,7025551838,8489 Strong St.,,Las Vegas,NV,83030,USA,1166.0,71800.0
2,114,"Australian Collectors, Co.",Ferguson,Peter,03 9520 4555,636 St Kilda Road,Level 3,Melbourne,Victoria,3004,Australia,1611.0,117300.0
3,119,La Rochelle Gifts,Labrune,Janine,40.67.8555,"67, rue des Cinquante Otages",,Nantes,,44000,France,1370.0,118200.0
4,121,Baane Mini Imports,Bergulfsen,Jonas,07-98 9555,Erling Skakkes gate 78,,Stavern,,4110,Norway,1504.0,81700.0


#### EJERCICIO 9

Como Customers tiene un número de registros muy elevado, crea un nuevo dataframe.

#### EJERCICIO 10

El resultado anterior tiene 13 columnas, por lo que no es cómodo para su visualización por el terminal (o en este mismo notebook).
Crea un dataframe con los resultados. 