**DIPLOMADO DE ANALÍTICA DE DATOS E INTELIGENCIA ARTIFICIAL APLICADA**

**MÓDULO 2: Ingeniería de datos con Python**

Prof Grettel Barceló Alonso

**Subtema**
Bases de datos con SQL

---

*   NOMBRE: Sebastian Serrano Avila


---

En esta actividad usarás la base de datos relacional `classicmodels` (MySQL), compuesta por las siguientes tablas:

*   `Customers`: almacena los datos de los clientes.
*   `Products`: almacena una lista de modelos de coches a escala.
*   `ProductLines`: almacena una lista de categorías de líneas de productos.
*   `Orders`: almacena los pedidos de venta realizados por los clientes.
*   `OrderDetails`: almacena elementos de línea de pedidos de ventas para cada pedido de ventas.
*   `Payments`: almacena los pagos realizados por los clientes en función de sus cuentas.
*   `Employees`: almacena toda la información de los empleados, así como la estructura de la organización, como quién informa a quién.
*   `Offices`: almacena los datos de la oficina de ventas.

Revisa con detalle su esquema para que comprendas cómo se relacionan las tablas anteriores.


Recuerda que:


*   Una **clave primaria** es un atributo (o conjunto) que identifica unívocamente a cada registro en la tabla.
*   Una **clave foránea** (externa o ajena) es un atributos (o conjunto) en una tabla que es una clave primaria en otra (o posiblemente la misma) tabla.
*   Las **relaciones** son las líneas que conectan una tabla con otra y el extremo determina la cardinalidad. Las relaciones con línea continua (identificadora) representan una transformación donde la clave primaria de una tabla pasa a ser foránea y primaria (al mismo tiempo) de otra. Las relaciones con línea discontinua (no identificadora) representan una transformación donde la clave primaria de una tabla pasa a ser sólo foránea en otra.

In [63]:
pip install pymysql



In [64]:
import sqlalchemy as sqla
import pymysql
import pandas as pd

Crea el motor `sqlalchemy`, con el método `create_engine()` y una conexión con `connect()` como se muestra a continuación:

In [65]:
# Crear el motor (dialecto://usuarioBD:clave@ipHostDBMS:puerto/esquema
db = sqla.create_engine('mysql+pymysql://mnaTC4029User:mnaTC4029Pass!@20.106.217.214:3306/classicmodels', pool_recycle=3600)

# Crea una conexión para luego invocar declaraciones SQL
conn = db.connect()

Escribe las consultas en SQL para obtener:

2.	La información de las líneas de productos.

In [66]:
query = sqla.text('SELECT * FROM productlines')
query_result = pd.read_sql_query(query, conn)
query_result

Unnamed: 0,productLine,textDescription,htmlDescription,image
0,Classic Cars,Attention car enthusiasts: Make your wildest c...,,
1,Motorcycles,Our motorcycles are state of the art replicas ...,,
2,Planes,"Unique, diecast airplane and helicopter replic...",,
3,Ships,The perfect holiday or anniversary gift for ex...,,
4,Trains,Model trains are a rewarding hobby for enthusi...,,
5,Trucks and Buses,The Truck and Bus models are realistic replica...,,
6,Vintage Cars,Our Vintage Car models realistically portray a...,,


3.	La información de los empleados ordenados por nombre (`firstName`).

In [67]:
querry3 = sqla.text('SELECT * FROM employees ORDER BY firstName')
query_result3 = pd.read_sql_query(querry3, conn)
query_result3

Unnamed: 0,employeeNumber,lastName,firstName,extension,email,officeCode,reportsTo,jobTitle
0,1611,Fixter,Andy,x101,afixter@classicmodelcars.com,6,1088.0,Sales Rep
1,1143,Bow,Anthony,x5428,abow@classicmodelcars.com,1,1056.0,Sales Manager (NA)
2,1504,Jones,Barry,x102,bjones@classicmodelcars.com,7,1102.0,Sales Rep
3,1002,Murphy,Diane,x5800,dmurphy@classicmodelcars.com,1,,President
4,1286,Tseng,Foon Yue,x2248,ftseng@classicmodelcars.com,3,1143.0,Sales Rep
5,1323,Vanauf,George,x4102,gvanauf@classicmodelcars.com,3,1143.0,Sales Rep
6,1102,Bondur,Gerard,x5408,gbondur@classicmodelcars.com,4,1056.0,Sale Manager (EMEA)
7,1370,Hernandez,Gerard,x2028,ghernande@classicmodelcars.com,4,1102.0,Sales Rep
8,1076,Firrelli,Jeff,x9273,jfirrelli@classicmodelcars.com,1,1002.0,VP Marketing
9,1188,Firrelli,Julie,x2173,jfirrelli@classicmodelcars.com,2,1143.0,Sales Rep


4.	Los países donde hay oficinas (sin duplicar).

In [68]:
query4 = sqla.text('SELECT DISTINCT country as PAIS FROM offices')
query_result4 = pd.read_sql_query(query4, conn)
query_result4

Unnamed: 0,PAIS
0,USA
1,France
2,Japan
3,Australia
4,UK


5.	El nombre y teléfono de los clientes de la ciudad de Nueva York (*NYC*).

In [69]:
query5 = sqla.text('SELECT customerName as NOMBRE, phone as TELEFONO FROM customers WHERE city = "NYC"')
query_result5 = pd.read_sql_query(query5, conn)
query_result5

Unnamed: 0,NOMBRE,TELEFONO
0,Land of Toys Inc.,2125557818
1,Muscle Machine Inc,2125557413
2,Vitachrome Inc.,2125551500
3,Classic Legends Inc.,2125558493
4,Microscale Inc.,2125551957


6.	El código y nombre de los productos del vendedor *Gearbox Collectibles* que tengan menos de 1000 unidades en stock.

In [70]:
query6 = sqla.text('SELECT productCode as CODIGO, productName as NOMBRE FROM products WHERE productVendor = "Gearbox Collectibles" AND quantityInStock < 1000')
query_result6 = pd.read_sql_query(query6, conn)
query_result6

Unnamed: 0,CODIGO,NOMBRE
0,S18_2581,P-51-D Mustang
1,S18_2795,1928 Mercedes-Benz SSK


7.	Los tres productos más caros, desde el punto de visto de los comercializadores (`buyPrice`).

In [71]:
query7 = sqla.text('SELECT productName as NOMBRE, buyPrice as PRECIO FROM products ORDER BY buyPrice DESC LIMIT 3')
query_result7 = pd.read_sql_query(query7, conn)
query_result7

Unnamed: 0,NOMBRE,PRECIO
0,1962 LanciaA Delta 16V,103.42
1,1998 Chrysler Plymouth Prowler,101.51
2,1952 Alpine Renault 1300,98.58


8.	La cantidad de productos por línea de producto (no las existencias en inventario)

In [72]:
query8 = sqla.text('SELECT productLine as LINEA, COUNT(*) as CANTIDAD FROM products GROUP BY productLine')
query_result8 = pd.read_sql_query(query8, conn)
query_result8

Unnamed: 0,LINEA,CANTIDAD
0,Classic Cars,38
1,Motorcycles,13
2,Planes,12
3,Ships,9
4,Trains,3
5,Trucks and Buses,11
6,Vintage Cars,24


9.	La cantidad de empleados por país (tomando en cuenta la ubicación de la oficina).

In [73]:
query9 = text('SELECT o.country as PAIS, COUNT(*) AS CANTIDAD_EMPLEADOS FROM employees e JOIN offices o ON e.officeCode = o.officeCode GROUP BY o.country ')

query_result9 = pd.read_sql_query(query9, conn)
query_result9

Unnamed: 0,PAIS,CANTIDAD_EMPLEADOS
0,Australia,4
1,France,5
2,Japan,2
3,UK,2
4,USA,10


10.	El promedio de los pagos de cada uno de los clientes de España (sin incluir aquellos que no poseen ningún pago).

In [74]:
query10 = sqla.text("SELECT c.customerName as NOMBRE, AVG(p.amount) as PROMEDIO FROM customers c JOIN payments p ON c.customerNumber = p.customerNumber WHERE c.country = 'Spain' GROUP BY c.customerName")
query_result10 = pd.read_sql_query(query10, conn)
query_result10

Unnamed: 0,NOMBRE,PROMEDIO
0,CAF Imports,23375.57
1,"Corrida Auto Replicas, Ltd",37480.03
2,Enaco Distributors,22840.156667
3,Euro+ Shopping Channel,55056.844615
4,"Iberia Gift Imports, Corp.",25493.925
