# Ejercicios SQL

En la teoría de SQL sobre Python, hemos visto un modelo de datos con bases de datos sobre empleados, canciones, sus tipos, compradores... Ahora hemos realizado algún ejercicio extra sobre esta base de datos.

Vamos a comenzar definiendo todo el setup para poder usar SQL directamente sobre Pyhton, como ya hicimos en su día. Pero tú olvídate de las funciones y céntrate en las sentencias de SQL que debes meter en las queries para sacar lo que nos piden. ¡A por todas!

## Configuración del entorno

In [2]:
import pandas as pd
import sqlite3

¡Asegurate que tienes el archivo chinook.db en la ruta donde se encuentra este Notebook!

In [3]:
# Conectamos con la base de datos chinook.db
connection = sqlite3.connect("chinook.db")

# Obtenemos un cursor que utilizaremos para hacer las queries
crsr = connection.cursor()

In [4]:
# Con esta función leemos los datos y lo pasamos a un DataFrame de Pandas
def sql_query(query):

    # Ejecuta la query
    crsr.execute(query)

    # Almacena los datos de la query 
    ans = crsr.fetchall()

    # Obtenemos los nombres de las columnas de la tabla
    names = [description[0] for description in crsr.description]

    return pd.DataFrame(ans,columns=names)

## Modelo de datos
Recordamos el modelo de datos para facilitar el entendimiento del modelo de datos:

![imagen](./img/chinook_data_model.png)

Puedes ver todas las tablas que hay en la base de datos, usábamos la siguiente sentencia:

In [5]:
res = crsr.execute("SELECT name FROM sqlite_master WHERE type='table'")
for name in res:
    print(name[0])

albums
sqlite_sequence
artists
customers
employees
genres
invoices
invoice_items
media_types
playlists
playlist_track
tracks
sqlite_stat1
films


## PARTE 1: Ejercicios

1. Muestra los clientes de Brasil
2. ¿Cuántos de los empleados son agentes de ventas?
3. Muestra las canciones de ‘AC/DC’
4. Muestra los clientes que no sean de USA: Nombre completo, ID, Pais
5. Muestra, de los empleados que son agentes de ventas: Nombre completo, Dirección, Ciudad, Estado, Pais y email
6. Muestra una lista con los países que aparecen a los que se ha facturado, la lista no debe contener paises repetidos
7. Muestra los estados de USA de donde son los clientes, la lista no debe contener estados repetidos
8. ¿Cuántos artículos tiene la factura 37?
9. ¿Cuántas canciones tiene ‘AC/DC’?
10. ¿Cuántos artículos tiene cada factura? (Suma de los Quantity)
11. Muestra cuántas facturas hay de cada país (en función del país del customer)
12. Muestra los items tiene cada factura
13. ¿Cuántas facturas ha habido en 2009 o 2011? (Las de 2009 + las de 2011)
14. ¿Cuántas facturas ha habido entre 2009 y 2011?
15. ¿Cuántos clientes hay de España o de Brasil?
16. Muestra las canciones cuyo título empiece por ‘You’

###### Fíjate que la base de datos está en inglés, por lo que tendrás que traducir alguna cosa, como los países, o investigar los valores de la base de datos ;)


### PARTE 1: Respuestas:

In [53]:
# 1.
# query = '''
# SELECT * 
# FROM CUSTOMERS
# LIMIT 5
# '''

query = '''SELECT * FROM customers WHERE COUNTRY != "Brazil" '''

sql_query(query)

Unnamed: 0,CustomerId,FirstName,LastName,Company,Address,City,State,Country,PostalCode,Phone,Fax,Email,SupportRepId
0,2,Leonie,Köhler,,Theodor-Heuss-Straße 34,Stuttgart,,Germany,70174,+49 0711 2842222,,leonekohler@surfeu.de,5
1,3,François,Tremblay,,1498 rue Bélanger,Montréal,QC,Canada,H2G 1A7,+1 (514) 721-4711,,ftremblay@gmail.com,3
2,4,Bjørn,Hansen,,Ullevålsveien 14,Oslo,,Norway,0171,+47 22 44 22 22,,bjorn.hansen@yahoo.no,4
3,5,František,Wichterlová,JetBrains s.r.o.,Klanova 9/506,Prague,,Czech Republic,14700,+420 2 4172 5555,+420 2 4172 5555,frantisekw@jetbrains.com,4
4,6,Helena,Holý,,Rilská 3174/6,Prague,,Czech Republic,14300,+420 2 4177 0449,,hholy@gmail.com,5
5,7,Astrid,Gruber,,"Rotenturmstraße 4, 1010 Innere Stadt",Vienne,,Austria,1010,+43 01 5134505,,astrid.gruber@apple.at,5
6,8,Daan,Peeters,,Grétrystraat 63,Brussels,,Belgium,1000,+32 02 219 03 03,,daan_peeters@apple.be,4
7,9,Kara,Nielsen,,Sønder Boulevard 51,Copenhagen,,Denmark,1720,+453 3331 9991,,kara.nielsen@jubii.dk,4
8,14,Mark,Philips,Telus,8210 111 ST NW,Edmonton,AB,Canada,T6G 2C7,+1 (780) 434-4554,+1 (780) 434-5565,mphilips12@shaw.ca,5
9,15,Jennifer,Peterson,Rogers Canada,700 W Pender Street,Vancouver,BC,Canada,V6C 1G8,+1 (604) 688-2255,+1 (604) 688-8756,jenniferp@rogers.ca,3


In [56]:
#3 Muestra las canciones de ‘AC/DC’
query = '''
SELECT a.Name , b.Title, c.Name
FROM tracks as a
LEFT JOIN albums as b ON a.AlbumId = b.AlbumId
LEFT JOIN artists as c ON b.ArtistId = c.ArtistId

WHERE c.Name = 'AC/DC'

'''

sql_query(query)

Unnamed: 0,Name,Title,Name.1
0,For Those About To Rock (We Salute You),For Those About To Rock We Salute You,AC/DC
1,Put The Finger On You,For Those About To Rock We Salute You,AC/DC
2,Let's Get It Up,For Those About To Rock We Salute You,AC/DC
3,Inject The Venom,For Those About To Rock We Salute You,AC/DC
4,Snowballed,For Those About To Rock We Salute You,AC/DC
5,Evil Walks,For Those About To Rock We Salute You,AC/DC
6,C.O.D.,For Those About To Rock We Salute You,AC/DC
7,Breaking The Rules,For Those About To Rock We Salute You,AC/DC
8,Night Of The Long Knives,For Those About To Rock We Salute You,AC/DC
9,Spellbound,For Those About To Rock We Salute You,AC/DC


In [58]:
# 4. 
query = '''
SELECT FirstName as Nombre, LastName as Apellido, CustomerId, Country as País
FROM customers
WHERE Country != 'USA'
'''

sql_query(query)

Unnamed: 0,Nombre,Apellido,CustomerId,País
0,Luís,Gonçalves,1,Brazil
1,Leonie,Köhler,2,Germany
2,François,Tremblay,3,Canada
3,Bjørn,Hansen,4,Norway
4,František,Wichterlová,5,Czech Republic
5,Helena,Holý,6,Czech Republic
6,Astrid,Gruber,7,Austria
7,Daan,Peeters,8,Belgium
8,Kara,Nielsen,9,Denmark
9,Eduardo,Martins,10,Brazil


In [62]:
query = '''
SELECT a.Name
FROM tracks a
LEFT JOIN albums b
ON a.AlbumId = b.AlbumId
LEFT JOIN artists c
ON b.ArtistId = c.ArtistId
WHERE c.Name = 'AC/DC'
'''

sql_query(query).to_csv("pruebaE.csv", index=False)

## PARTE 2: Ejercicios

1. Facturas de Clientes de Brasil: Nombre del cliente, Id de factura, fecha de la factura y el pais de la factura
2. ¿Cuántas son el total estas facturas?
3. Muestra cada factura asociada a cada agente de ventas con su nombre completo
4. Muestra por cada cliente, su nombre, su país y el total de gastos en facturas
5. Muestra cada artículo de la factura con el nombre de la cancion
6. Muestra todas las canciones con su nombre, formato, álbum y género
7. Muestra cuántas canciones hay en cada playlist y el nombre de cada playlist
8. Muestra cuánto ha vendido cada empleado
9. ¿Quién ha sido el agente de ventas que más ha vendido en 2009?
10. ¿Cuáles son los 3 grupos que más han vendido?


### PARTE 2: Respuestas:

In [46]:
# 1.


## PARTE 3: Pandas

Ahora que ya has practicado SQL, puedes practicar estas sencillas operaciones con Pandas y comprobar los resultados con lo que has sacado para SQL.

#### PARTE 1: Ejercicios Pandas

1. Muestra los clientes de Brasil
2. ¿Cuántos de los empleados son agentes de ventas?
3. Muestra las canciones de ‘AC/DC’
4. Muestra los clientes que no sean de USA: Nombre completo, ID, Pais
5. Muestra, de los empleados que son agentes de ventas: Nombre completo, Dirección, Ciudad, Estado, Pais y email
6. Muestra una lista con los países que aparecen a los que se ha facturado, la lista no debe contener paises repetidos
7. Muestra los estados de USA de donde son los clientes, la lista no debe contener estados repetidos
8. ¿Cuántos artículos tiene la factura 37?
9. ¿Cuántas canciones tiene ‘AC/DC’?
10. ¿Cuántos artículos tiene cada factura? (Suma de los Quantity)
11. Muestra cuántas facturas hay de cada país (en función del país del customer)
12. Muestra los items tiene cada factura
13. ¿Cuántas facturas ha habido en 2009 o 2011? (Las de 2009 + las de 2011)
14. ¿Cuántas facturas ha habido entre 2009 y 2011?
15. ¿Cuántos clientes hay de España o de Brasil?
16. Muestra las canciones cuyo título empiece por ‘You’

In [9]:
table = 'a'
f"""df_{table} = \"SELECT * FROM {table}\""""

'df_a = "SELECT * FROM a"'

In [14]:
# Conversión de tablas a DataFrames (con el nombre "df_<nombre_table>"):

tables = [
    'albums', 'sqlite_sequence', 'artists', 'customers', 'employees', 'genres', 'invoices', 'invoice_items',
    'media_types', 'playlists', 'playlist_track', 'tracks', 'sqlite_stat1', 'films'
]

for table in tables:
    exec(f"""df_{table} = sql_query(\"SELECT * FROM {table}\")""")

In [15]:
df_media_types

Unnamed: 0,MediaTypeId,Name
0,1,MPEG audio file
1,2,Protected AAC audio file
2,3,Protected MPEG-4 video file
3,4,Purchased AAC audio file
4,5,AAC audio file


#### PARTE 2: Ejercicios Pandas

1. Facturas de Clientes de Brasil: Nombre del cliente, Id de factura, fecha de la factura y el pais de la factura
2. ¿Cuántas son el total estas facturas?
3. Muestra cada factura asociada a cada agente de ventas con su nombre completo
4. Muestra por cada cliente, su nombre, su país y el total de gastos en facturas
5. Muestra cada artículo de la factura con el nombre de la cancion
6. Muestra todas las canciones con su nombre, formato, álbum y género
7. Muestra cuántas canciones hay en cada playlist y el nombre de cada playlist
8. Muestra cuánto ha vendido cada empleado
9. ¿Quién ha sido el agente de ventas que más ha vendido en 2009?
10. ¿Cuáles son los 3 grupos que más han vendido?