# Bases, almacenes y manipulación de datos

---

Se utiliza la base de datos relacional `classicmodels` (MySQL), compuesta por las siguientes tablas:

*   `Customers`: almacena los datos de los clientes.
*   `Products`: almacena una lista de modelos de coches a escala.
*   `ProductLines`: almacena una lista de categorías de líneas de productos.
*   `Orders`: almacena los pedidos de venta realizados por los clientes.
*   `OrderDetails`: almacena elementos de línea de pedidos de ventas para cada pedido de ventas.
*   `Payments`: almacena los pagos realizados por los clientes en función de sus cuentas.
*   `Employees`: almacena toda la información de los empleados, así como la estructura de la organización, como quién informa a quién.
*   `Offices`: almacena los datos de la oficina de ventas.

# **Parte 1**. SQLAlchemy y SQL básico

In [156]:
pip install pymysql



In [157]:
import sqlalchemy as sqla
import pymysql
import pandas as pd

1.	Creo el motor `sqlalchemy`, con el método `create_engine()` y una conexión con `connect()` como se muestra a continuación:

In [158]:
# Crear el motor (dialecto://usuarioBD:clave@ipHostDBMS:puerto/esquema
db = sqla.create_engine('mysql+pymysql://mnaTC4029User:mnaTC4029Pass!@20.106.157.52:3306/classicmodels', pool_recycle=3600)

# Crea una conexión para luego invocar declaraciones SQL
conn = db.connect()

Consultas en SQL para obtener:

In [159]:
query1=sqla.text('SHOW TABLES')
df=pd.read_sql(query1,conn)
df

Unnamed: 0,Tables_in_classicmodels
0,customers
1,employees
2,offices
3,orderdetails
4,orders
5,payments
6,productlines
7,products


2.	La información de las líneas de productos.

In [160]:
query2=sqla.text('SELECT *  FROM productlines')
df=pd.read_sql(query2,conn)
df

Unnamed: 0,productLine,textDescription,htmlDescription,image
0,Classic Cars,Attention car enthusiasts: Make your wildest c...,,
1,Motorcycles,Our motorcycles are state of the art replicas ...,,
2,Planes,"Unique, diecast airplane and helicopter replic...",,
3,Ships,The perfect holiday or anniversary gift for ex...,,
4,Trains,Model trains are a rewarding hobby for enthusi...,,
5,Trucks and Buses,The Truck and Bus models are realistic replica...,,
6,Vintage Cars,Our Vintage Car models realistically portray a...,,


3.	Los empleados ordenados por nombre.

In [161]:
# query3=sqla.text('SELECT * FROM employees ORDER BY firstName') TODOS LOS DATOS ORDENADOS POR NOMBRE

query3=sqla.text('SELECT firstName, lastName, email FROM employees ORDER BY firstName')
df=pd.read_sql(query3,conn)
df

Unnamed: 0,firstName,lastName,email
0,Andy,Fixter,afixter@classicmodelcars.com
1,Anthony,Bow,abow@classicmodelcars.com
2,Barry,Jones,bjones@classicmodelcars.com
3,Diane,Murphy,dmurphy@classicmodelcars.com
4,Foon Yue,Tseng,ftseng@classicmodelcars.com
5,George,Vanauf,gvanauf@classicmodelcars.com
6,Gerard,Bondur,gbondur@classicmodelcars.com
7,Gerard,Hernandez,ghernande@classicmodelcars.com
8,Jeff,Firrelli,jfirrelli@classicmodelcars.com
9,Julie,Firrelli,jfirrelli@classicmodelcars.com


4.	Los países donde hay oficinas.

In [162]:
query4=sqla.text('SELECT DISTINCT country FROM offices')
df=pd.read_sql(query4,conn)
df

Unnamed: 0,country
0,USA
1,France
2,Japan
3,Australia
4,UK


5.	El nombre y teléfono de los clientes de Nueva York (*NYC*).

In [163]:
query5=sqla.text("SELECT customerName, phone FROM customers WHERE city='NYC' ORDER BY customerName")
df=pd.read_sql(query5,conn)
df

Unnamed: 0,customerName,phone
0,Classic Legends Inc.,2125558493
1,Land of Toys Inc.,2125557818
2,Microscale Inc.,2125551957
3,Muscle Machine Inc,2125557413
4,Vitachrome Inc.,2125551500


6.	El código y nombre de los productos del vendedor *Gearbox Collectibles* que tengan menos de 1000 unidades en stock.

In [164]:
query6=sqla.text("SELECT productCode, productName FROM products WHERE productVendor = 'Gearbox Collectibles' AND quantityInStock <1000")
df=pd.read_sql(query6,conn)
df

Unnamed: 0,productCode,productName
0,S18_2581,P-51-D Mustang
1,S18_2795,1928 Mercedes-Benz SSK


7.	Los tres productos más caros, desde el punto de visto de los comercializadores (`buyPrice`).

In [165]:
query7 = sqla.text("SELECT * FROM products ORDER BY buyPrice DESC LIMIT 3")
df=pd.read_sql(query7,conn)
df

Unnamed: 0,productCode,productName,productLine,productScale,productVendor,productDescription,quantityInStock,buyPrice,MSRP
0,S10_4962,1962 LanciaA Delta 16V,Classic Cars,1:10,Second Gear Diecast,Features include: Turnable front wheels; steer...,6791,103.42,147.74
1,S18_2238,1998 Chrysler Plymouth Prowler,Classic Cars,1:18,Gearbox Collectibles,Turnable front wheels; steering function; deta...,4724,101.51,163.73
2,S10_1949,1952 Alpine Renault 1300,Classic Cars,1:10,Classic Metal Creations,Turnable front wheels; steering function; deta...,7305,98.58,214.3


8.	La cantidad de productos por línea de producto (no las existencias en inventario)

In [166]:
query8 = sqla.text("SELECT productLine, COUNT(productLine) FROM products GROUP BY productLine")
df=pd.read_sql(query8,conn)
df

Unnamed: 0,productLine,COUNT(productLine)
0,Classic Cars,38
1,Motorcycles,13
2,Planes,12
3,Ships,9
4,Trains,3
5,Trucks and Buses,11
6,Vintage Cars,24


9.	La cantidad de empleados por país (tomando en cuenta la ubicación de la oficina).

In [167]:
query9 = sqla.text("SELECT country, COUNT(country) AS NUMERO_DE_EMPLEADOS FROM offices JOIN employees USING (officeCode) GROUP BY country ORDER BY COUNT(country) DESC")
df=pd.read_sql(query9,conn)
df

Unnamed: 0,country,NUMERO_DE_EMPLEADOS
0,USA,10
1,France,5
2,Australia,4
3,Japan,2
4,UK,2


10.	El promedio de los pagos de cada uno de los clientes de España.

In [168]:
query10 = sqla.text("SELECT customerName, AVG(amount), country AS PROMEDIO FROM customers LEFT JOIN payments USING (customerNumber) WHERE country='Spain' GROUP BY (customerName) ORDER BY AVG(amount) DESC")
df=pd.read_sql(query10,conn)
df

Unnamed: 0,customerName,AVG(amount),PROMEDIO
0,Euro+ Shopping Channel,55056.844615,Spain
1,"Corrida Auto Replicas, Ltd",37480.03,Spain
2,"Iberia Gift Imports, Corp.",25493.925,Spain
3,CAF Imports,23375.57,Spain
4,Enaco Distributors,22840.156667,Spain
5,"Anton Designs, Ltd.",,Spain
6,ANG Resellers,,Spain


# **Parte 2**. Manipulación de datos con Pandas

11.	Se carga las tablas empleadas en dataframes con el mismo nombre y resuelve las consultas anteriores con las funciones de Pandas.

In [169]:
query1=sqla.text('SHOW TABLES')
df=pd.read_sql(query1,conn)
df

Unnamed: 0,Tables_in_classicmodels
0,customers
1,employees
2,offices
3,orderdetails
4,orders
5,payments
6,productlines
7,products


In [170]:
# PANDAS CON DATA FRAME
customers=pd.read_sql(sqla.text("SELECT * FROM customers"),conn)
employees=pd.read_sql(sqla.text("SELECT * FROM employees"),conn)
offices=pd.read_sql(sqla.text("SELECT * FROM offices"),conn)
orderdetails=pd.read_sql(sqla.text("SELECT * FROM orderdetails"),conn)
orders=pd.read_sql(sqla.text("SELECT * FROM orders"),conn)
payments=pd.read_sql(sqla.text("SELECT * FROM payments"),conn)
productlines=pd.read_sql(sqla.text("SELECT * FROM productlines"),conn)
products=pd.read_sql(sqla.text("SELECT * FROM products"),conn)

In [171]:
# 2. La información de las líneas de productos:
# query2=sqla.text('SELECT *  FROM productlines')
productlines


Unnamed: 0,productLine,textDescription,htmlDescription,image
0,Classic Cars,Attention car enthusiasts: Make your wildest c...,,
1,Motorcycles,Our motorcycles are state of the art replicas ...,,
2,Planes,"Unique, diecast airplane and helicopter replic...",,
3,Ships,The perfect holiday or anniversary gift for ex...,,
4,Trains,Model trains are a rewarding hobby for enthusi...,,
5,Trucks and Buses,The Truck and Bus models are realistic replica...,,
6,Vintage Cars,Our Vintage Car models realistically portray a...,,


In [172]:
# 3. Los empleados ordenados por nombre.
employees.sort_values(by="firstName")[["firstName", "lastName", "email"]]

Unnamed: 0,firstName,lastName,email
17,Andy,Fixter,afixter@classicmodelcars.com
5,Anthony,Bow,abow@classicmodelcars.com
16,Barry,Jones,bjones@classicmodelcars.com
0,Diane,Murphy,dmurphy@classicmodelcars.com
10,Foon Yue,Tseng,ftseng@classicmodelcars.com
11,George,Vanauf,gvanauf@classicmodelcars.com
13,Gerard,Hernandez,ghernande@classicmodelcars.com
4,Gerard,Bondur,gbondur@classicmodelcars.com
2,Jeff,Firrelli,jfirrelli@classicmodelcars.com
8,Julie,Firrelli,jfirrelli@classicmodelcars.com


In [173]:
# 4. Los países donde hay oficinas.
pd.DataFrame(offices['country'].unique(), columns=['Paises donde hay oficinas'])

Unnamed: 0,Paises donde hay oficinas
0,USA
1,France
2,Japan
3,Australia
4,UK


In [174]:
# 5. El nombre y teléfono de los clientes de Nueva York (NYC)
customers[customers['city']=='NYC' ][['customerName','phone']].sort_values(by="customerName")

Unnamed: 0,customerName,phone
98,Classic Legends Inc.,2125558493
9,Land of Toys Inc.,2125557818
105,Microscale Inc.,2125551957
15,Muscle Machine Inc,2125557413
27,Vitachrome Inc.,2125551500


In [175]:
# 6. El código y nombre de los productos del vendedor Gearbox Collectibles que tengan menos de 1000 unidades en stock.
products[(products['productVendor'] == 'Gearbox Collectibles') & (products['quantityInStock'] <1000)][['productCode','productName']]

Unnamed: 0,productCode,productName
30,S18_2581,P-51-D Mustang
32,S18_2795,1928 Mercedes-Benz SSK


In [176]:
# 7. Los tres productos más caros, desde el punto de vista de los comercializadores (buyPrice)
products.sort_values(by='buyPrice', ascending=False).head(3)

Unnamed: 0,productCode,productName,productLine,productScale,productVendor,productDescription,quantityInStock,buyPrice,MSRP
5,S10_4962,1962 LanciaA Delta 16V,Classic Cars,1:10,Second Gear Diecast,Features include: Turnable front wheels; steer...,6791,103.42,147.74
25,S18_2238,1998 Chrysler Plymouth Prowler,Classic Cars,1:18,Gearbox Collectibles,Turnable front wheels; steering function; deta...,4724,101.51,163.73
1,S10_1949,1952 Alpine Renault 1300,Classic Cars,1:10,Classic Metal Creations,Turnable front wheels; steering function; deta...,7305,98.58,214.3


In [177]:
# 8. La cantidad de productos por línea de producto (no las existencias en inventario)
pd.DataFrame(products.groupby('productLine').count()['productCode'])
#product_line_counts = products.groupby('productLine').size()

Unnamed: 0_level_0,productCode
productLine,Unnamed: 1_level_1
Classic Cars,38
Motorcycles,13
Planes,12
Ships,9
Trains,3
Trucks and Buses,11
Vintage Cars,24


In [178]:
# 9. La cantidad de empleados por país (tomando en cuenta la ubicación de la oficina)
mergeDF9=offices.merge(employees, on='officeCode')
mergeDF9.groupby('country')['officeCode'].count().sort_values(ascending=False)

country
USA          10
France        5
Australia     4
Japan         2
UK            2
Name: officeCode, dtype: int64

In [179]:
# 10. El promedio de los pagos de cada uno de los clientes de España.
mergeDF10=customers.merge(payments, how='left', on='customerNumber')
mergeDF10=mergeDF10[mergeDF10['country']=='Spain']
mergeDF10=mergeDF10.groupby('customerName')['amount'].mean().sort_values(ascending=False)
pd.DataFrame(mergeDF10)

Unnamed: 0_level_0,amount
customerName,Unnamed: 1_level_1
Euro+ Shopping Channel,55056.844615
"Corrida Auto Replicas, Ltd",37480.03
"Iberia Gift Imports, Corp.",25493.925
CAF Imports,23375.57
Enaco Distributors,22840.156667
ANG Resellers,
"Anton Designs, Ltd.",


# **Parte 3**. Cliente de Python Firestore

En esta fase me conectaro a una base de datos no relacional de Firestore desde Python. Para ello utilizarás los módulos `credentials` y `firestore` de la biblioteca `firebase_admin`.

In [180]:
import firebase_admin
from firebase_admin import credentials
from firebase_admin import firestore

El archivo `veterinary.json` almacena la clave privada para autenticar una cuenta y autorizar el acceso a los servicios de Firebase. A través de la función `Certificate()`, se regresa una credencial inicializada.

In [181]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [182]:
import os
DIR = "/content/drive/MyDrive/Colab Notebooks/MNA/CyAD/3-Module"
os.chdir(DIR)

In [183]:
cred = credentials.Certificate('veterinary.json')
firebase_admin.initialize_app(cred)
db = firestore.client()

12.	Contenido del DataFrame

In [189]:
# FORMA 1
# Leer datos de la colección 'PET_OWNER'
docs = db.collection('PET_OWNER').stream()

# Crear una lista de diccionarios con los datos
data = [{'id': doc.id, **doc.to_dict()} for doc in docs]

# Crear un DataFrame a partir de los datos
df = pd.DataFrame(data)

# Mostrar el DataFrame
# pd.set_option('display.expand_frame_repr', False)
# print(df)


# Aplicar formato y estilo al DataFrame
styled_df = df.style \
    .set_properties(**{'text-align': 'center'}) \
    .set_table_styles([{'selector': 'th',
                        'props': [('text-align', 'center')]}]) \
    .set_caption('DATA FRAME') \
    .hide_index()

# Mostrar el DataFrame con estilo
display(styled_df)


  .hide_index()


id,email,ownerFirstName,phone,ownerLastName
0D6yFSs2eu4nYwf2dnQ0,,Sam,555-454-3465,Taylor
98357ufgjmWUxjnAuzbz,miles.trent@somewhere.com,Miles,,Trent
AFtZincSZxjC4Mcxf9Pf,liz.frier@somewhere.com,Liz,555-537-6543,Frier
GYDixDwHjMyihjL8TmsM,,Jenny,555-454-1243,Mayberry
IpxTuB6FILhwQFcspLws,'marcha.downs@somewhere.com,Marsha,555-537-8765,Downs
QoXBfS1JdRp6BqgLzaAz,,Ken,555-454-2354,Roberts
eUtZ44lPRbSHXX04EDp7,nigel.melnik@somewhere.com,Nigel,555-232-5678,Melnik
n2GG9rlfGOmE0P4TcU0T,richard.james@somewhere.com,Richard,555-537-7654,James
pDlJlul8EJXO8FBJvFkN,jim.rogers@somewhere.com,Jim,555-232-3456,Rogers
tAlJ74xQ7tT4TUHwZgmH,mary.keenan@somewhere.com,Mary,555-232-4567,Keenan


In [185]:
# FORMA 2
# Leer datos de la colección 'PET_OWNER'
collection_ref = db.collection('PET_OWNER')
docs = collection_ref.stream()

# Inicializar una lista vacía para almacenar los datos
data = []
cont1=0
# Iterar a través de los documentos y convertirlos en diccionarios
for doc in docs:
    doc_id = doc.id
    doc_dict = doc.to_dict() # La función doc.to_dict() es una función de Firebase Firestore que se utiliza para convertir un documento Firestore en un diccionario de Python.
    diccionario={'id':doc_id, **doc.to_dict()}

    data.append(diccionario)
# Mostrar el DataFrame
pd.set_option('display.expand_frame_repr', False)
df = pd.DataFrame(data)
print(df)

                     id ownerFirstName         phone ownerLastName                        email
0  0D6yFSs2eu4nYwf2dnQ0            Sam  555-454-3465        Taylor                         None
1  98357ufgjmWUxjnAuzbz          Miles          None         Trent    miles.trent@somewhere.com
2  AFtZincSZxjC4Mcxf9Pf            Liz  555-537-6543         Frier      liz.frier@somewhere.com
3  GYDixDwHjMyihjL8TmsM          Jenny  555-454-1243      Mayberry                         None
4  IpxTuB6FILhwQFcspLws         Marsha  555-537-8765         Downs  'marcha.downs@somewhere.com
5  QoXBfS1JdRp6BqgLzaAz            Ken  555-454-2354       Roberts                         None
6  eUtZ44lPRbSHXX04EDp7          Nigel  555-232-5678        Melnik   nigel.melnik@somewhere.com
7  n2GG9rlfGOmE0P4TcU0T        Richard  555-537-7654         James  richard.james@somewhere.com
8  pDlJlul8EJXO8FBJvFkN            Jim  555-232-3456        Rogers     jim.rogers@somewhere.com
9  tAlJ74xQ7tT4TUHwZgmH           Mary  

In [186]:
firebase_admin.delete_app(firebase_admin.get_app())