# MySQL + SQL Alchemy + Pandas

In [1]:
# Importamos las librerías principales
# En caso de no tener instalado mysql.connector ---> Utilizar pip install mysql-connector-python
import mysql.connector
import pandas as pd
import sqlalchemy as db

# Instalación de MySQL server

En la documentación oficial podemos encontrar las instrucciones para instalar MySQL Server. También podemos acceder directamente al link, descargar el navegador y seguir los pasos de instalación

* Documentación oficial: https://dev.mysql.com/doc/refman/5.7/en/installing.html
* Instalador de windows: https://dev.mysql.com/downloads/installer/

Una vez instalado, podemos ingresar al mySQL 5.7 Command Line Client, utilizando el password definido en la etapa de instalación.

![image.png](attachment:image.png)

## Pasos generales para trabajar con MySQL

**1. Crear una conexión a la base de datos:** utilizando el *método connect ()* generamos un objeto de conexión a base de datos MySQL.

**2. Crear un cursor:**  El método *cursor ()* se utiliza para realizar la conexión y ejecutar consultas SQL que nos permiten crear tablas, insertar datos, etc. Para crear un cursor solo necesitamos usar la conexión que ya hemos creado.
Cuando utilicemos el cursor tenemos que tener en cuenta que luego de ejecutar el query hay que consumir la totalidad del resultado utilizando el método fetchall () para seguir utilizando ese cursor mas adelante.
* Por ejemplo: Si ejecutamos el query SELECT * FROM table y nos retorna 5 filas, entonces tendremos que consumir la totalidad de filas con el método fetchall(). En caso de consumirlo con el método fetchone(), vamos a poder ejecutar la consulta una sola vez y luego vamos a tener el error *InternalError: Unread result found.*

Si queremos evitar esa regla de consumir todo el resultado de la consulta, podemos agregar el parámetro **buffered=True** al momento de crear el cursor.

**3. Ejecutar una sentencia SQL:** Una vez creado el cursor, podremos ejecutar las sentencias SQL utilizando el método *execute()*.

**4: Realizar un commit:** El método *commit ()* se utiliza para guardar cualquier transacción de forma permanente en el sistema de base de datos. Todas las modificaciones de datos o del sistema realizadas por el comando COMMIT desde el comienzo de las transacciones son de naturaleza permanente y no se pueden deshacer ni revertir, ya que una operación COMMIT exitosa libera todos los recursos de transacción involucrados.

**5: Desconectarnos de la base de datos:** El método *close ()* cierra la conexión a la base de datos.



## Configuraciones principales

In [2]:
# Creación del objeto de conexión
conn = mysql.connector.connect(
  host="localhost",
  user="root",
  password="santiago"
)

# Creación de un cursor
cursor = conn.cursor(buffered=True)

## Crear una base de datos

In [3]:
query = "CREATE DATABASE IF NOT EXISTS commerce"
cursor.execute(query)

In [4]:
# Verificamos la creación de la base de datos
# cursor = conn.cursor()
query = "SHOW DATABASES"
cursor.execute(query)
results = cursor.fetchall()
for r in results:
    print(r)

# Cerramos la conexión a la base de datos
conn.close()

('information_schema',)
('appsalon',)
('bienes_raices',)
('commerce',)
('mysql',)
('performance_schema',)
('sys',)


## Borrar una base de datos

In [5]:
# Descomentar en caso de ser necesario
# query = "DROP DATABASE commerce"
# cursor.execute(query)

## Abrimos una nueva conexión a la base de datos 'commerce'

In [6]:
# Creación del objeto de conexión
conn = mysql.connector.connect(
    host="localhost",
    user="root",
    password="santiago",
    database='commerce'
)

# Creación de un cursor
cursor = conn.cursor(buffered=True)

## Crear una tabla
* Tipos de datos en MySQL --> https://dev.mysql.com/doc/refman/8.0/en/data-types.html

In [7]:
# Crear una tabla
query = """CREATE TABLE IF NOT EXISTS orders (
            orderId INT,
            totalPrice FLOAT(2),
            address VARCHAR(50)
            )"""

cursor.execute(query)
conn.commit()

In [8]:
# Verificamos la creación de la tabla

query = "SHOW TABLES"
cursor.execute(query)
results = cursor.fetchall()
for r in results:
    print(r)

('orders',)


## Insertar datos

In [9]:
# Método 1: Utilizando el método execute()

query = """INSERT INTO orders (orderId, totalPrice, address) VALUES
            (546, 3489.98, 'Buenos Aires 989'),
            (547, 6897, 'Espronceda 3218'),
            (560, 7542.35, 'Pasteur 1788'),
            (562, 11432, 'Galicia 1252')"""
cursor.execute(query)
conn.commit()

In [10]:
# Método 2: Utilizando el método executemany()
order_data = [
    (546, 3489.98, 'Buenos Aires 989'),
    (547, 6897, 'Espronceda 3218'),
    (560, 7542.35, 'Pasteur 1788'),
    (562, 11432, 'Galicia 1252')
]

query = "INSERT INTO orders (orderId, totalPrice, address) VALUES(%s, %s, %s)"
cursor.executemany(query,order_data)
conn.commit()

## Seleccionar datos

In [11]:
# Seleccionar un dato utilizando fetchone
query = "SELECT * FROM orders"
cursor.execute(query)
one_result = cursor.fetchone()
print(one_result)

(546, 6150.8, 'Buenos Aires 989')


In [12]:
# Seleccionar un dato utilizando fetchmany
query = "SELECT * FROM orders"
cursor.execute(query)
results = cursor.fetchmany(2)
for res in results:
    print(res)

(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')


In [13]:
# Seleccionar un dato utilizando fetchall
query = "SELECT * FROM orders"
cursor.execute(query)
results = cursor.fetchall()
for res in results:
    print(res)

(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(560, 7542.35, 'Pasteur 1788')
(562, 11432.0, 'Galicia 1252')
(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(560, 7542.35, 'Pasteur 1788')
(562, 11432.0, 'Galicia 1252')
(546, 3489.98, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(560, 7542.35, 'Pasteur 1788')
(562, 11432.0, 'Galicia 1252')
(546, 3489.98, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(560, 7542.35, 'Pasteur 1788')
(562, 11432.0, 'Galicia 1252')


## Actualizar datos

In [14]:
# Update data
query = """UPDATE orders
            SET totalPrice = 6150.80
            WHERE address = 'Buenos Aires 989'
            
"""
cursor.execute(query)
conn.commit()

# Seleccionar todos los datos utilizando fetchall
query = "SELECT * FROM orders"
cursor.execute(query)
results = cursor.fetchall()
for r in results:
    print(r)

(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(560, 7542.35, 'Pasteur 1788')
(562, 11432.0, 'Galicia 1252')
(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(560, 7542.35, 'Pasteur 1788')
(562, 11432.0, 'Galicia 1252')
(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(560, 7542.35, 'Pasteur 1788')
(562, 11432.0, 'Galicia 1252')
(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(560, 7542.35, 'Pasteur 1788')
(562, 11432.0, 'Galicia 1252')


## Borrar datos

In [15]:
# Borrar datos
query = "DELETE FROM orders WHERE address = 'Pasteur 1788'"
cursor.execute(query)

# Seleccionar todos los datos utilizando fetchall
query = "SELECT * FROM orders"
cursor.execute(query)
results = cursor.fetchall()
for r in results:
    print(r)

(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(562, 11432.0, 'Galicia 1252')
(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(562, 11432.0, 'Galicia 1252')
(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(562, 11432.0, 'Galicia 1252')
(546, 6150.8, 'Buenos Aires 989')
(547, 6897.0, 'Espronceda 3218')
(562, 11432.0, 'Galicia 1252')


## Otros comandos. Descomentar de acuerdo a tu necesidad y ejecutar

In [1]:
# Close connection
# conn.close()

#Drop table
# query = """DROP TABLE IF EXISTS orders"""
# cursor.execute(query)
# conn.commit()

# SQL Alchemy + Pandas

### Conectarse utilzando un engine de SQLAlchemy
En este caso vamos a crear un **engine** de SQLAlchemy referenciando la base de datos previamente creada, para luego conectarnos a el.
Luego volvemos a utilizar el método read_sql de la librería Pandas para consultar la base de datos y obtener un dataframe.

* Previamente instalar la librería **pymysql** ---> pip install PyMySQL

In [17]:
# Importamos pymysql
import pymysql

# Cerramos la conexión que generamos con mysql.connector
conn.close()

# Creación del engine
engine = db.create_engine("mysql+pymysql://root:santiago@localhost/commerce")
sqla_connection = engine.connect()

# Obtener un dataframe a partir de una consulta SQL
query = "SELECT * FROM orders"
data = pd.read_sql(query, con=sqla_connection)
data.head()

Unnamed: 0,orderId,totalPrice,address
0,546,6150.8,Buenos Aires 989
1,547,6897.0,Espronceda 3218
2,560,7542.35,Pasteur 1788
3,562,11432.0,Galicia 1252
4,546,6150.8,Buenos Aires 989


## Seleccionar datos

In [18]:
# Método: read_sql_table
pd.read_sql_table('orders',con=sqla_connection)

Unnamed: 0,orderId,totalPrice,address
0,546,6150.8,Buenos Aires 989
1,547,6897.0,Espronceda 3218
2,560,7542.35,Pasteur 1788
3,562,11432.0,Galicia 1252
4,546,6150.8,Buenos Aires 989
5,547,6897.0,Espronceda 3218
6,560,7542.35,Pasteur 1788
7,562,11432.0,Galicia 1252
8,546,6150.8,Buenos Aires 989
9,547,6897.0,Espronceda 3218


In [19]:
# Método: read_sql
pd.read_sql_table('orders',con=sqla_connection)

query = "SELECT * FROM orders"
data = pd.read_sql(query, con=sqla_connection)
data

Unnamed: 0,orderId,totalPrice,address
0,546,6150.8,Buenos Aires 989
1,547,6897.0,Espronceda 3218
2,560,7542.35,Pasteur 1788
3,562,11432.0,Galicia 1252
4,546,6150.8,Buenos Aires 989
5,547,6897.0,Espronceda 3218
6,560,7542.35,Pasteur 1788
7,562,11432.0,Galicia 1252
8,546,6150.8,Buenos Aires 989
9,547,6897.0,Espronceda 3218


## Insertar datos

In [20]:
# Para insertar estos datos, previamente descargar el archivo txt que se encuetra en el siguiente link
# https://drive.google.com/file/d/1pJfxW_gUedQlVsO55tVzbQ-FXjk4-jBF/view?usp=sharing'


# Leer el archivo con Pandas. Reemplazar la ruta de la variable path con la de tu archivo.
path = "C:/Users/User/Documents/Alkemy/Prisma/full_orders.txt"
df = pd.read_csv(path, sep ='\t')
df

Unnamed: 0,orderId,totalPrice,address
0,1083,6267,Gelpi 3162
1,1249,2467,Rivadavia 4190
2,1341,6747,Medrano 3843
3,191,12051,Montevideo 4348
4,944,11351,Payro 3518
...,...,...,...
95,272,532,Rivadavia 4781
96,789,13636,24 de Octubre 3644
97,830,5132,Dominguez 4853
98,225,7506,Laguna 4021


In [21]:
# Insertar datos en la BD utilzando el método to_sql
df.to_sql(name='orders', con=sqla_connection, if_exists='append', index = False)

100

In [22]:
# Comprobación
query = "SELECT * FROM orders"
data = pd.read_sql(query, con=sqla_connection)
data

Unnamed: 0,orderId,totalPrice,address
0,546,6150.80,Buenos Aires 989
1,547,6897.00,Espronceda 3218
2,560,7542.35,Pasteur 1788
3,562,11432.00,Galicia 1252
4,546,6150.80,Buenos Aires 989
...,...,...,...
111,272,532.00,Rivadavia 4781
112,789,13636.00,24 de Octubre 3644
113,830,5132.00,Dominguez 4853
114,225,7506.00,Laguna 4021
