# **1. INTRODUCCIÓN**

Los sistemas gestores de bases de datos interpretan consultas escritas en lenguaje SQL, y así es como interactuamos y obtenemos datos de las bases de datos y aplicaciones.

* SQL significa Structured Query Language (Lenguaje de consulta estructurado).
* SQL permite acceder y manipular bases de datos.
* SQL es una herramienta simple para el análisis avanzado de datos.

<br>

SQL no se usa sólo para manipular datos, sino también para administrar la misma base de datos, crear y modificar el diseño de objetos de la base de datos, como tablas. El elemento de SQL que se usa para crear y modificar objetos de base de datos se denomina lenguaje de definición de datos (DDL).

<br>

En esta notebook veremos cómo trabajar/manipular tablas. Aprenderemos a usar SQL para interactuar con una base de datos de fútbol europeo y generar información interesante con sus datos.

La base de datos utilizada, pueder ser encontrada [aquí](https://www.kaggle.com/hugomathien/soccer).

## **1.1 Definiciones Importantes**

Aunque SQL es un estándar ANSI/ISO, existen diferentes versiones del lenguaje SQL.
Sin embargo, para cumplir con el estándar del American National Standards Institute (ANSI), todas las versiones deben soportar al menos los comandos principales (como `SELECT`, `UPDATE`, `DELETE`, `INSERT`, `WHERE`) de forma similar.

<br>

En este caso, vamos a trabajar con SQLite que es una implementación específica. La mayoría de los lenguajes SQL comparten todas las capacidades de este notebook. Las diferencias suelen estar en el rendimiento y en las funcionalidades analíticas avanzadas (y a veces en los errores, por supuesto).

## **1.2 ¿Qué Es SQLite?**

SQLite es una biblioteca de software que proporciona un sistema de gestión de bases de datos relacionales que se puede utilizar en casi todos los lenguajes de programación, incluido Python.

El lite en SQLite significa facilidad en términos de configuración, administración de la base de datos y recursos necesarios. Las siguientes son sus características más importantes: es autónomo, sin servidor y transaccional.

<br>

Más información acerca de SQLite:
[https://www.sqlitetutorial.net/](https://www.sqlitetutorial.net/what-is-sqlite/).


### **1.2.1 Configuraciones Previas**

SQLite se puede utilizar en casi todos los lenguajes de programación, incluido Python. Esta notebook corre en Python, por lo que vamos a importar la librería de SQLite y otras que nos pueden ser de utilidad más adelante.

Asimismo, crearemos la conexión con la BD y listaremos las tablas con las que contamos.

In [None]:
#Importar librerías
import pandas as pd
import sqlite3

In [None]:
# Cargar base de datos Sqlite desde Drive
from google.colab import drive
drive.mount('/content/drive')

database = '/content/drive/MyDrive/Colab Notebooks/Talento Tech/Módulo 2/Taller SQL/database.sqlite'

Mounted at /content/drive


In [None]:
# Crear la conexión con la base de datos
conn = sqlite3.connect(database)
print ("Conexión exitosa")

Conexión exitosa


In [None]:
# Listar las columnas y otros atributos de la base de datos
pd.read_sql("""SELECT *
               FROM sqlite_master
               WHERE type = 'table';""", conn)

Unnamed: 0,type,name,tbl_name,rootpage,sql
0,table,sqlite_sequence,sqlite_sequence,4,"CREATE TABLE sqlite_sequence(name,seq)"
1,table,Player_Attributes,Player_Attributes,11,"CREATE TABLE ""Player_Attributes"" (\n\t`id`\tIN..."
2,table,Player,Player,14,CREATE TABLE `Player` (\n\t`id`\tINTEGER PRIMA...
3,table,Match,Match,18,CREATE TABLE `Match` (\n\t`id`\tINTEGER PRIMAR...
4,table,League,League,24,CREATE TABLE `League` (\n\t`id`\tINTEGER PRIMA...
5,table,Country,Country,26,CREATE TABLE `Country` (\n\t`id`\tINTEGER PRIM...
6,table,Team,Team,29,"CREATE TABLE ""Team"" (\n\t`id`\tINTEGER PRIMARY..."
7,table,Team_Attributes,Team_Attributes,2,CREATE TABLE `Team_Attributes` (\n\t`id`\tINTE...


In [None]:
# Crear función para eficiencia al hacer una consulta a la base de datos
def consultar(query):
    return pd.read_sql(query, conn)

# **2. SENTENCIA &nbsp; ► SELECT ◄**

Esta es la consulta más básica y su estructura es muy simple:
* Se define lo que se quiere ver después del `SELECT`.
* Se eligen las tablas a consultar después del `FROM`.

Las únicas partes imprescindibles de una consulta son el `SELECT` y el `FROM`.

<br>

La sintaxis de esta consulta es así:

        SELECT column1, column2, ...
        FROM table_name;

<br>

Para consultar por todos los campos en una tabla sin tener que escribir uno por uno el nombre de cada campo, se utiliza `SELECT *`.


`SELECT *` significa que quieres obtener todas las columnas posibles de la tabla consultada. Los datos devueltos se almacenan en una tabla de resultados, denominada conjunto de resultados.

<br>

La sintaxis de esta consulta es así:

        SELECT *
        FROM table_name;

<br>

Es una buena práctica terminar la consulta con un punto y coma para indicar que la consulta está completa. Las palabras clave se escriben en mayúsculas y los nombres de tablas y campos se escriben en minúsculas.

## **2.1 Ejemplo ~ Listar los países**

Queremos consultar qué países se encuentran en la tabla `Country` de la base de datos del fútbol europeo.

In [None]:
consultar("""
    SELECT *
    FROM Country;
""")

Unnamed: 0,id,name
0,1,Belgium
1,1729,England
2,4769,France
3,7809,Germany
4,10257,Italy
5,13274,Netherlands
6,15722,Poland
7,17642,Portugal
8,19694,Scotland
9,21518,Spain


## **2.2 Práctica ~ Listar las ligas del fútbol europeo**

Queremos listar todas las ligas que estén en la tabla `League` de la base de datos de fútbol europeo.

In [None]:
consultar("""
    SELECT *
    FROM League;
""")

Unnamed: 0,id,country_id,name
0,1,1,Belgium Jupiler League
1,1729,1729,England Premier League
2,4769,4769,France Ligue 1
3,7809,7809,Germany 1. Bundesliga
4,10257,10257,Italy Serie A
5,13274,13274,Netherlands Eredivisie
6,15722,15722,Poland Ekstraklasa
7,17642,17642,Portugal Liga ZON Sagres
8,19694,19694,Scotland Premier League
9,21518,21518,Spain LIGA BBVA


## **2.3 Práctica ~ Listar los jugadores del fútbol europeo**

Deben listar los campos `id`,`player_name`, `birthday`, `height` y `weight` que estan en la tabla `Player` de la base de datos de Fútbol Europeo.

In [None]:
consultar("""
    SELECT id, player_name, birthday, height, weight
    FROM Player;
""")

Unnamed: 0,id,player_name,birthday,height,weight
0,1,Aaron Appindangoye,1992-02-29 00:00:00,182.88,187
1,2,Aaron Cresswell,1989-12-15 00:00:00,170.18,146
2,3,Aaron Doran,1991-05-13 00:00:00,170.18,163
3,4,Aaron Galindo,1982-05-08 00:00:00,182.88,198
4,5,Aaron Hughes,1979-11-08 00:00:00,182.88,154
...,...,...,...,...,...
11055,11071,Zoumana Camara,1979-04-03 00:00:00,182.88,168
11056,11072,Zsolt Laczko,1986-12-18 00:00:00,182.88,176
11057,11073,Zsolt Low,1979-04-29 00:00:00,180.34,154
11058,11074,Zurab Khizanishvili,1981-10-06 00:00:00,185.42,172


# **3. SENTENCIA &nbsp; ► SELECT DISTINCT ◄**

La sentencia `SELECT DISTINCT` se utiliza para devolver sólo valores distintos (diferentes).

Dentro de una tabla, una columna a menudo contiene muchos valores duplicados y a veces sólo se desea listar los diferentes valores (distintos).

<br>

La sintaxis de `SELECT DISTINCT` es así:

        SELECT DISTINCT column1
        FROM table_name;

## **3.1 Ejemplo ~ Listar las temporadas jugadas de esta Base de Datos**

Si consultamos por todas las temporadas que se almacenaron en la tabla `Match`de la base de datos de Fútbol Europeo, vamos a tener el siguiente resultado.

In [None]:
consultar("""
    SELECT season
    FROM Match;
""")

Unnamed: 0,season
0,2008/2009
1,2008/2009
2,2008/2009
3,2008/2009
4,2008/2009
...,...
25974,2015/2016
25975,2015/2016
25976,2015/2016
25977,2015/2016


Con el resultado anterior, es muy difícil responder a la pregunta ¿Cuáles son las temporadas almacenadas en esta base de datos?
Para responderla sin mucho esfuerzo, usamos `SELECT DISTINCT` para consultar la tabla `Match` de la base de datos.

In [None]:
consultar("""
    SELECT DISTINCT season
    FROM Match;
""")

Unnamed: 0,season
0,2008/2009
1,2009/2010
2,2010/2011
3,2011/2012
4,2012/2013
5,2013/2014
6,2014/2015
7,2015/2016


## **3.2 Práctica ~ Listar sólo tasas diferentes de valoración general de los jugadores**

En la tabla `Player_Attributes` de la base de datos de Fútbol Europeo hay el campo `overall_rating` que parece contener la valoración de los jugadores. El objetivo es ver sólo tasas diferentes de valoración general de los jugadores.

In [None]:
consultar("""
    SELECT DISTINCT overall_rating
    FROM Player_Attributes;
""")

Unnamed: 0,overall_rating
0,67.0
1,62.0
2,61.0
3,74.0
4,73.0
...,...
57,33.0
58,36.0
59,37.0
60,35.0


# **4. SENTENCIA &nbsp; ► LIMIT ◄**

Cuando deseamos poner un límite al resultado o no nos interesa conocer la totalidad de los resultados, podemos **limitar** la cantidad de registros resultantes mediante la sentencia `LIMIT`.

<br>

La sintaxis de `LIMIT` es así:

        SELECT column1, column2...
        FROM table_name
        LIMIT number;

## **4.1 Ejemplo ~ Listar 5 jugadores de la base de datos del fútbol europeo**

Queremos listar 5 jugadores de la tabla `Player` de la base de datos de Fútbol Europeo. En la tabla de resultados quiero ver los campos `ìd`,`player_name`, `birthday`, `height` y `weight`. Todos se encuentran en la tabla `Player`.

In [None]:
consultar("""
    SELECT id, player_name, birthday, height, weight
    FROM Player
    LIMIT 5;
""")

Unnamed: 0,id,player_name,birthday,height,weight
0,1,Aaron Appindangoye,1992-02-29 00:00:00,182.88,187
1,2,Aaron Cresswell,1989-12-15 00:00:00,170.18,146
2,3,Aaron Doran,1991-05-13 00:00:00,170.18,163
3,4,Aaron Galindo,1982-05-08 00:00:00,182.88,198
4,5,Aaron Hughes,1979-11-08 00:00:00,182.88,154


## **4.2 Práctica ~ Listar 3 equipos del fútbol europeo**

Deben listar 3 equipos del fútbol europeo. La tabla de resultados deberá contener los campos `id` y `team_long_name` de la tabla `Team` de la base de datos de Fútbol Europeo.

In [None]:
consultar("""
    SELECT id, team_long_name
    FROM Team
    LIMIT 3;
""")

Unnamed: 0,id,team_long_name
0,1,KRC Genk
1,2,Beerschot AC
2,3,SV Zulte-Waregem


# **5. FUNCIONES AGREGATIVAS | MÉTRICAS**

Todas las métricas tienen que ser agregadas usando funciones. Las funciones agregativas más comunes son:

<br>

* `SUM()` &ensp; ~ &ensp; Sumatoria total de una columna tipo numérica.
* `COUNT()` &ensp; ~ &ensp; Devuelve la cantidad de filas.
* `COUNT(DISTINCT)` &ensp; ~ &ensp; Devuelve la cantidad de filas distintas o diferentes.
* `AVG()` &ensp; ~ &ensp; Promedia los valores de una columna tipo numérica.
* `MIN()` &ensp; ~ &ensp;; Menor valor dentro de la columna especificada.
* `MAX()` &ensp; ~ &ensp; Mayor valor dentro de la columna especificada.

<br>

La sintaxis de las métricas en la sentencia `SELECT` es así:

<br>

* `SUM()`:

        SELECT SUM(column1), column2...
        FROM table_name

<br>

* `COUNT()`:

        SELECT COUNT(column1), column2...
        FROM table_name

<br>

* `COUNT(DISTINCT)`:

        SELECT COUNT(DISTINCT column1), column2...
        FROM table_name

<br>

* `AVG()`:

        SELECT AVG(column1), column2...
        FROM table_name

<br>

* `MIN()`:

        SELECT MIN(column1), column2...
        FROM table_name

<br>

* `MAX()`:

        SELECT MAX(column1), column2...
        FROM table_name

## **5.1 Ejemplo ~ ¿Cuántos países diferentes están almacenados en la tabla Country?**

Para consultar por el número de países diferentes almacenados en la tabla `Country` y que la tabla de resultados nos muestre únicamente el número con la cantidad de países, necesitamos usar una función agregativa que cuente el número de registros pero además, que cuente sólo los registros distintos. Esa función es `COUNT(DISTINCT)`.

In [None]:
consultar("""
    SELECT COUNT(DISTINCT name)
    FROM Country;
""")

Unnamed: 0,COUNT(DISTINCT name)
0,11


## **5.2 Práctica ~ Traer el número de etapas jugadas de la tabla Match**

Deben traer el número de etapas `stage` almacenados en la tabla `Match` de la base de datos de Fútbol Europeo. La tabla de resultados deberá mostrar únicamente el número con la cantidad de etapas **diferentes**.

In [None]:
consultar("""
    SELECT COUNT(DISTINCT stage)
    FROM Match;
""")

Unnamed: 0,COUNT(DISTINCT stage)
0,38


## **5.3 Práctica ~ Traer la suma de goles hechos por los equipos visitantes de la tabla Match**

Deben traer la suma de goles hechos por los equipos visitantes `away_team_goal` almacenados en la tabla `Match` de la base de datos de Fútbol Europeo. La tabla de resultados deberá mostrar únicamente el número con la suma de goles.

In [None]:
consultar("""
    SELECT SUM(away_team_goal)
    FROM Match;
""")

Unnamed: 0,SUM(away_team_goal)
0,30160


## **5.4 Práctica ~ Traer el promedio de goles hechos por los equipos locales y el promedio de goles hechos por los visitantes de la tabla Match**

Deben traer el promedio de goles hechos por los equipos locales `home_team_goal` y el promedio de goles hechos por los equipos visitantes `away_team_goal` almacenados en la tabla `Match` de la base de datos de Fútbol Europeo. La tabla de resultados deberá mostrar únicamente el número con el promedio de goles.

In [None]:
consultar("""
    SELECT AVG(home_team_goal), AVG(away_team_goal)
    FROM Match;
""")

Unnamed: 0,AVG(home_team_goal),AVG(away_team_goal)
0,1.544594,1.160938


## **5.5 Práctica ~ Traer la máxima cantidad de goles que un equipo visitante anotó en los juegos de la tabla Match**

Deben traer la máxima cantidad de goles un equipo visitante `away_team_goal` almacenados en la tabla `Match` de la base de datos de Fútbol Europeo. La tabla de resultados deberá mostrar únicamente el número con cantidad de goles.

In [None]:
consultar("""
    SELECT MAX(away_team_goal)
    FROM Match;
""")

Unnamed: 0,MAX(away_team_goal)
0,9


# **6. OPERACIONES MATEMÁTICAS**

Se pueden realizar operaciones matemáticas como: `+`, `-`, `*`, `/`, etc. Asimismo, estás operaciones pueden ser usadas en conjunto con las funciones agregativas/ métricas.

<br>

La sintaxis en la sentencia `SELECT` es así:

* `+`:

        SELECT column1+column2
        FROM table_name

<br>

La sintaxis combinando con una métrica en la sentencia `SELECT` es así:

* `AVG(+)`:

        SELECT AVG(column1+column2)
        FROM table_name


## **6.1 Práctica ~ Traer el promedio de goles por partido de la tabla Match**

Deben traer el promedio de la suma de goles hechos por los equipos locales `home_team_goal` y visitantes `away_team_goal` en todos los juegos almacenados en la tabla `Match` de la base de datos de Fútbol Europeo. La tabla de resultados deberá mostrar únicamente el número con el promedio de goles por partido.

In [None]:
consultar("""
    SELECT AVG(home_team_goal + away_team_goal)
    FROM Match;
""")

Unnamed: 0,AVG(home_team_goal + away_team_goal)
0,2.705531


# **7. SENTENCIA &nbsp; ► WHERE ◄**

La sentencia `WHERE` se utiliza para filtrar registros. Mediante esta sentencia, se extraen sólo aquellos registros que cumplen una condición específica.

<br>

La sintaxis de `WHERE` es así:

        SELECT column1, column2...
        FROM table_name
        WHERE condition;

## **7.1 Campos De Texto (y Fecha) vs Campos Numéricos**

SQL requiere comillas simples alrededor de los valores del texto y fecha (la mayoría de los sistemas de bases de datos también permiten comillas dobles). Sin embargo, los campos numéricos no deben incluirse entre comillas.

<br>

Ejemplos de sintaxis con campo númerico:

        SELECT *
        FROM Customers
        WHERE CustomerId = 1;

<br>

Ejemplos de sintaxis con campo de texto:

        SELECT *
        FROM Customers
        WHERE Country = 'Mexico';


### **7.1.1 Ejemplo ~ Listar los jugadores que pesan 165 libras**

Queremos listar a los jugadores que cumplan con la condición de pesar 165 libras. En la tabla de resultados quiero ver los campos `id`,`player_name`, `birthday`, `height` y `weight` de los que cumplen la condición. Todos se encuentran en la tabla `Player`.

In [None]:
consultar("""
    SELECT id, player_name, birthday, height, weight
    FROM Player
    WHERE weight = 165;
""")

Unnamed: 0,id,player_name,birthday,height,weight
0,27,Abdelmalek Cherrad,1981-01-14 00:00:00,185.42,165
1,44,Abdoulaye Doucoure,1993-01-01 00:00:00,182.88,165
2,46,Abdoulaye Keita,1994-01-05 00:00:00,175.26,165
3,49,Abdoulwahid Sissoko,1990-03-20 00:00:00,182.88,165
4,58,Abdullah Al Hafith,1992-12-25 00:00:00,187.96,165
...,...,...,...,...,...
806,11007,Zainadine Junior,1988-06-24 00:00:00,177.80,165
807,11015,Zakaria M'Sila,1992-04-06 00:00:00,177.80,165
808,11047,Zhi Zheng,1980-08-20 00:00:00,180.34,165
809,11063,Zoltan Gera,1979-04-22 00:00:00,182.88,165


### **7.1.2 Práctica ~ Listar las temporadas en que un equipo visitante anotó 7 o más goles**

Deben listar las temporadas en que algún equipo visitante haya anotado 7 o más goles. La tabla de resultados deberá contener los campos `season`, `home_team_goal`, `away_team_goal` de la tabla `Match` de la base de datos de Fútbol Europeo.

In [None]:
consultar("""
    SELECT season, home_team_goal, away_team_goal
    FROM Match
    WHERE away_team_goal >= 7;
""")

Unnamed: 0,season,home_team_goal,away_team_goal
0,2012/2013,1,7
1,2014/2015,1,7
2,2014/2015,2,7
3,2015/2016,0,9
4,2010/2011,1,8
5,2013/2014,0,7
6,2010/2011,0,7
7,2013/2014,0,7
8,2010/2011,0,8
9,2011/2012,0,7


## **7.2 Operadores Lógicos En WHERE**

La sentencia WHERE puede combinarse con los operadores lógicos: `AND`, `OR` y `NOT`. Los operadores `AND` y `OR` se utilizan para filtrar registros basados en más de una condición.

<br>

* El operador `AND` muestra un registro si todas las condiciones separadas por `AND` son VERDADERA(s). Sintaxis de `AND`:

        SELECT column1, column2, ...
        FROM table_name
        WHERE condition1 AND condition2 AND condition3 ...;

<br>

* El operador `OR` muestra un registro si alguna de las condiciones separadas por `OR` es VERDADERA(s). Sintaxis de `OR`:

        SELECT column1, column2, ...
        FROM table_name
        WHERE condition1 OR condition2 ...;

<br>

* El operador `NOT` muestra un registro si la(s) condición(es) NO es VERDADERA(s). Sintaxis de `NOT`:

        SELECT column1, column2, ...
        FROM table_name
        WHERE NOT condition;

### **7.2.1 Práctica ~ Traer el Id de los equipos que desarrollan un dribbling normal y su velocidad de juego es balanceada**

Tomando la tabla `Team_Attributes` de la base de datos de Fútbol Europeo, deben obtener el `id`,`buildUpPlayDribblingClass` y `buildUpPlaySpeedClass`  de los equipos que tengan los siguientes atributos:
* `buildUpPlayDribblingClass = 'Normal'`.
* `buildUpPlaySpeedClass = 'Balanced'`.

In [None]:
consultar("""
    SELECT id, buildUPPlayDribblingClass, buildUpPlaySpeedClass
    FROM Team_Attributes
    WHERE buildUpPlayDribblingClass = 'Normal' AND buildUpPlaySpeedClass = 'Balanced';
""")

Unnamed: 0,id,buildUpPlayDribblingClass,buildUpPlaySpeedClass
0,2,Normal,Balanced
1,3,Normal,Balanced
2,8,Normal,Balanced
3,9,Normal,Balanced
4,14,Normal,Balanced
...,...,...,...
382,1450,Normal,Balanced
383,1451,Normal,Balanced
384,1452,Normal,Balanced
385,1457,Normal,Balanced


### **7.2.2 Práctica ~ Traer el Id de los equipos que desarrollan un juego de pase largo o su velocidad de juego es rápida**

Tomando la tabla `Team_Attributes` de la base de datos de Fútbol Europeo, deben obtener el `id`,`buildUpPlayPassingClass` y `buildUpPlaySpeedClass`  de los equipos que tengan alguno los siguientes atributos:
* `buildUpPlayPassingClass = 'Long'`.
* `buildUpPlaySpeedClass = 'Fast'`.

In [None]:
consultar("""
    SELECT id, buildUPPlayPassingClass, buildUpPlaySpeedClass
    FROM Team_Attributes
    WHERE buildUpPlayPassingClass = 'Long' OR buildUpPlaySpeedClass = 'Fast';
""")

Unnamed: 0,id,buildUpPlayPassingClass,buildUpPlaySpeedClass
0,4,Long,Fast
1,42,Long,Balanced
2,69,Mixed,Fast
3,72,Mixed,Fast
4,77,Mixed,Fast
...,...,...,...
226,1420,Mixed,Fast
227,1421,Long,Fast
228,1423,Long,Fast
229,1436,Long,Balanced


### **7.2.3 Práctica ~ Traer la tabla de países sin Bélgica**

Deben filtrar la tabla de países y traerla sin `Belgium`. La tabla de resultados deberá contener los campos `id` y `name` de la tabla `Country` de la base de datos de Fútbol Europeo.

In [None]:
consultar("""
    SELECT id, name
    FROM Country
    WHERE NOT name = 'Belgium';
""")

Unnamed: 0,id,name
0,1729,England
1,4769,France
2,7809,Germany
3,10257,Italy
4,13274,Netherlands
5,15722,Poland
6,17642,Portugal
7,19694,Scotland
8,21518,Spain
9,24558,Switzerland


## **7.3 Otros operadores que trabajan con la sentencia WHERE**

Los siguientes operadores también pueden ser utilizados en la sentencia WHERE:

<br>


* `=` &ensp; ~ &ensp; Igual.

<br>

* `>` &ensp; ~ &ensp; Mayor que.

<br>

* `<` &ensp; ~ &ensp; Menor que.

<br>

* `>=` &ensp; ~ &ensp; Mayor o igual que.

<br>

* `<=` &ensp; ~ &ensp; Menor o igual que.

<br>

* `<>` &ensp; ~ &ensp; No igual. *Nota: En algunas versiones de SQL este operador puede ser escrito como `!=`.*

<br>

* `BETWEEN` &ensp; ~ &ensp; Entre cierto rango.

<br>

* `LIKE` &ensp; ~ &ensp; Para consultar los datos basados en información parcial, se utiliza el operador `LIKE` en la sentencia `WHERE`. Busca un patrón. El patrón va antes, después o entre un par de % (wildcard).<br>
_**Ejemplo:**_ `LIKE 's%'` busca cualquier texto que comience con 's'. `LIKE '%er'` busca cualquier texto que termine con 'er'. Y `LIKE '%per%'` busca cualquier texto que contenga 'per'.

<br>

* `IN` &ensp; ~ &ensp; Para especificar varios valores posibles para una columna o subquery. Ejemplo de sintaxis cuando se especifica varios valores:

        SELECT column1
        FROM Table_name
        WHERE column1 IN (value1, value2);

<br>

_Ejemplo de sintaxis cuando se usa `IN` en una [subquery](#celda-subquery):_

        SELECT TrackId, Name, AlbumId
        FROM Tracks
        WHERE AlbumId IN
            (SELECT AlbumId
            FROM Albums
            WHERE ArtistId = 12);

### **7.3.1 Práctica ~ Traer la tabla de países únicamente con Italia**

Deben filtrar la tabla de países y traer únicamente a `Italy`. La tabla de resultados deberá contener los campos `id` y `name` de la tabla `Country` de la base de datos de Fútbol Europeo.

In [None]:
consultar("""
    SELECT id, name
    FROM Country
    WHERE name = 'Italy';
""")

Unnamed: 0,id,name
0,10257,Italy


### **7.3.2 Práctica ~ Traer la tabla de países sin Polonia**

Deben traer la tabla de países sin `Poland`. La tabla de resultados deberá contener los campos `id` y `name` de la tabla `Country` de la base de datos de Fútbol Europeo. **No se debe utilizar `NOT`**.



In [None]:
consultar("""
    SELECT id, name
    FROM Country
    WHERE name <> 'Poland';
""")

Unnamed: 0,id,name
0,1,Belgium
1,1729,England
2,4769,France
3,7809,Germany
4,10257,Italy
5,13274,Netherlands
6,17642,Portugal
7,19694,Scotland
8,21518,Spain
9,24558,Switzerland


### **7.3.3 Práctica ~ Listar los jugadores que pesen entre 174 y 176 libras**

Queremos listar a los jugadores que cumplan con la condición de pesar entre 174 y 176 libras. En la tabla de resultados quiero ver los campos `id`,`player_name`, `birthday`, `height` y `weight` de los que cumplen la condición. Todos se encuentran en la tabla `Player`. Asimismo, debemos limitar la consulta a 10 registros.


In [None]:
consultar("""
    SELECT id, player_name, birthday, height, weight
    FROM Player
    WHERE weight BETWEEN 174 AND 176
    LIMIT 10;
""")

Unnamed: 0,id,player_name,birthday,height,weight
0,17,Aaron Taylor-Sinclair,1991-04-08 00:00:00,182.88,176
1,34,Abdou Traore,1988-01-17 00:00:00,180.34,174
2,39,Abdoulaye Ba,1991-01-01 00:00:00,198.12,174
3,43,Abdoulaye Diallo,1992-03-30 00:00:00,187.96,174
4,61,Abel Aguilar,1985-01-06 00:00:00,185.42,176
5,68,Abella Perez Damia,1982-04-15 00:00:00,187.96,174
6,74,Abraham Gonzalez,1985-07-16 00:00:00,177.8,176
7,79,Achille Coser,1982-07-14 00:00:00,185.42,174
8,89,Adam Banas,1982-12-25 00:00:00,185.42,174
9,90,Adam Bodzek,1985-09-07 00:00:00,182.88,174


### **7.3.4 Práctica ~ Listar a los "Messi" de la base de datos de jugadores**

Queremos listar a los jugadores que cumplan con la condición de tener la palabra 'Messi' en su nombre. En la tabla de resultados quiero ver los campos `id`,`player_name`, `birthday`, `height` y `weight` de los que cumplen la condición. Todos se encuentran en la tabla `Player`.

In [None]:
consultar("""
    SELECT id, player_name, birthday, height, weight
    FROM Player
    WHERE player_name LIKE '%Messi%';
""")

Unnamed: 0,id,player_name,birthday,height,weight
0,6176,Lionel Messi,1987-06-24 00:00:00,170.18,159


# **8. SENTENCIA &nbsp; ► AS ◄**

Los alias en SQL se utilizan para dar a una tabla o a una columna, un nombre temporal. Se utilizan a menudo para hacer más legibles los nombres de las columnas. Un alias sólo existe durante la duración de la consulta.

<br>

Sintaxis de `AS`:

        SELECT column_name AS alias_name
        FROM table_name AS other_alias;


# **9. SENTENCIA &nbsp; ► ORDER BY ◄**

La sentencia `ORDER BY` se utiliza para ordenar el conjunto de resultados en orden ascendente o descendente. Por defecto, los registros se ordenan en orden ascendente `ASC`. Para ordenar los registros en orden descendente, utilice la palabra `DESC`.

<br>

Sintaxis de `ORDER BY`:

        SELECT column1, column2, ...
        FROM table_name
        WHERE condition
        ORDER BY column2 ASC|DESC;


## **9.1 Ejemplo ~ Listar a los 9 primeros equipos y ordenarlos por nombre**


Queremos listar a los equipos de la tabla `Team` y ordenarlos ascedentemente por nombre `team_long_name`. Adicionalmente, vamos a limitar la lista a 9 registros.


In [None]:
consultar("""
    SELECT id, team_long_name AS team_name
    FROM Team
    ORDER BY team_long_name ASC
    LIMIT 9;
""")

Unnamed: 0,id,team_name
0,16848,1. FC Kaiserslautern
1,15624,1. FC Köln
2,16239,1. FC Nürnberg
3,16243,1. FSV Mainz 05
4,11817,AC Ajaccio
5,11074,AC Arles-Avignon
6,49116,AC Bellinzona
7,26560,ADO Den Haag
8,9537,AJ Auxerre


## **9.2 Práctica ~ Listar la tabla de países en orden descendente**

Deben listar la tabla `Country` de forma descendente `DESC` por el campos `name`. La tabla de resultados deberá contener los campos `id` y `name`.

In [None]:
consultar("""
    SELECT id, name
    FROM Country
    ORDER BY name DESC;
""")

Unnamed: 0,id,name
0,24558,Switzerland
1,21518,Spain
2,19694,Scotland
3,17642,Portugal
4,15722,Poland
5,13274,Netherlands
6,10257,Italy
7,7809,Germany
8,4769,France
9,1729,England


## **9.3 Práctica ~ Listar a los 5 jugadores con menos peso**

Deben listar la tabla `Player` de forma ascendente `ASC` por el campo `weight`. La tabla de resultados deberá contener los campos `id`, `player_name` y `weight`.

In [None]:
consultar("""
    SELECT id, player_name, weight
    FROM Player
    ORDER BY weight ASC
    LIMIT 5;
""")

Unnamed: 0,id,player_name,weight
0,5453,Juan Quero,117
1,6853,Mariusz Rybicki,121
2,10954,Yohandry Orozco,121
3,1480,Caetano,123
4,2612,Diego Buonanotte,123


## **9.4 Práctica ~ Listar a los 5 jugadores con mayor estatura**

Deben listar la tabla `Player` de forma descendente `DESC` por el campos `height`. La tabla de resultados deberá contener los campos `id`, `player_name` y `height`.

In [None]:
consultar("""
    SELECT id, player_name, height
    FROM Player
    ORDER BY height DESC
    LIMIT 5;
""")

Unnamed: 0,id,player_name,height
0,5908,Kristof van Hout,208.28
1,1301,Bogdan Milic,203.2
2,1926,Costel Pantilimon,203.2
3,3274,Fejsal Mulic,203.2
4,5568,Jurgen Wevers,203.2


## **9.5 Práctica ~ Listar a los 5 jugadores con mayor estatura y ordenarlos alfabéticamente pero de forma descendente**

Deben listar la tabla `Player` de forma descendente `DESC` por el campos `height` y `player_name`. La tabla de resultados deberá contener los campos `id`, `player_name` y `height`.

In [None]:
consultar("""
    SELECT id, player_name, height
    FROM Player
    ORDER BY height DESC, player_name DESC
    LIMIT 5;
""")

Unnamed: 0,id,player_name,height
0,5908,Kristof van Hout,208.28
1,11043,Zeljko Kalac,203.2
2,10574,Vanja Milinkovic-Savic,203.2
3,9916,Stefan Maierhofer,203.2
4,8638,Pietro Marino,203.2


# **10. SENTENCIA &nbsp; ► GROUP BY ◄**

La sentencia `GROUP BY` agrupa las filas que tienen los mismos valores en filas de resumen, como "encontrar el número de clientes en cada país". Se utiliza sobre dimensiones y métricas para agrupar el conjunto de resultados en una o más columnas.

Las dimensiones son todos aquellos valores que estamos describiendo en el `SELECT`. Y las métricas son que se utilizan a menudo con funciones agregativas (`COUNT`, `MAX`, `MIN`, `SUM`, `AVG`).

<br>

Sintaxis de `GROUP BY`;

        SELECT column1, column2, ...
        FROM table_name
        WHERE condition
        GROUP BY column1
        ORDER BY column2 ASC|DESC;

<br>

<i>**Nota 1:** El uso de `WHERE` antes de `GROUP BY` hace que este se ejecute más rápido, ya que el motor de base de datos no se tomará el tiempo de agrupar cosas que no necesita.

<br>

**Nota 2:** Es muy importante utilizar las mismas dimensiones tanto en el `SELECT`, como en el `GROUP BY`. De lo contrario, la salida podría ser errónea.</i>

## **10.1 Ejemplo ~ Queremos conocer cuántos equipos tienen cada tipo de velocidad de juego**

Queremos conocer cuántos equipos de la tabla `Team_Attributes` tienen cada tipo de velocidad juego, es decir, cuántos tienen `buildUpPlaySpeedClass = 'Fast'`, `buildUpPlaySpeedClass = 'Balanced'` y cuántos `buildUpPlaySpeedClass = 'Slow'`.

In [None]:
consultar("""
    SELECT buildUpPlaySpeedClass, COUNT(id)
    FROM Team_Attributes
    GROUP BY buildUpPlaySpeedClass;
""")

Unnamed: 0,buildUpPlaySpeedClass,COUNT(id)
0,Balanced,1184
1,Fast,172
2,Slow,102


## **10.2 Práctica ~ Queremos conocer cuántos equipos tienen cada clase de juego defensivo**

Queremos conocer cuantos equipos de la tabla `Team_Attributes` que tienen cada clase de juego defensivo, es decir, cuántos `defencePressureClass = 'Medium'`, `defencePressureClass = 'Deep'` y `defencePressureClass = 'High'`.

In [None]:
consultar("""
    SELECT defencePressureClass, COUNT(id)
    FROM Team_Attributes
    GROUP BY defencePressureClass;
""")

Unnamed: 0,defencePressureClass,COUNT(id)
0,Deep,154
1,High,61
2,Medium,1243


## **10.3 Práctica ~ Analítica básica de las temporadas**

Queremos realizar un sencillo análisis sobre la tabla `Match`. Se necesita obtener la siguiente información agrupada por  cada `season`:

* Cuantas `stage` distintas tuvo y visualizarlo como `number_of_stages`.

* El promedio de los goles de equipos locales `home_team_goal` y visualizarlo como `avg_home_team_goals`.

* El promedio de los goles de equipos visitantes `away_team_goal` y visualizarlo como `avg_away_team_goals`.

* La suma total de goles realizados por los equipos locales y visitantes en la temporada, visualizandolo como `total_goals`.

Asimismo, se requere ver la información de las temporadas más recientes primero.

In [None]:
consultar("""
    SELECT
        season,
        COUNT(DISTINCT stage) AS number_of_stages,
        AVG(home_team_goal) AS avg_home_team_goals,
        AVG(away_team_goal) AS avg_away_team_goals,
        SUM(home_team_goal + away_team_goal) AS total_goals
    FROM
        Match
    GROUP BY
        season
    ORDER BY
        season DESC
""")

Unnamed: 0,season,number_of_stages,avg_home_team_goals,avg_away_team_goals,total_goals
0,2015/2016,38,1.543897,1.210764,9162
1,2014/2015,38,1.520301,1.155489,8897
2,2013/2014,38,1.578826,1.187995,8389
3,2012/2013,38,1.55,1.222699,9039
4,2011/2012,38,1.572671,1.143789,8747
5,2010/2011,38,1.548466,1.135276,8749
6,2009/2010,38,1.541176,1.131269,8632
7,2008/2009,38,1.505412,1.101924,8672


# **11. SENTENCIAS &nbsp; ► JOIN ◄**

`JOIN` se usa cuando se quiere conectar dos tablas entre sí. Funciona cuando tienes una clave común en cada una de ellas. Entender el concepto de _Claves_ es crucial para conectar (unir) conjuntos de datos (tablas).

<br>

Sintaxis de `JOIN`;

        SELECT first_table.column1, firts_table.column2, second_table.columnA, second_table.columnB ...
        FROM first_table (LEFT|RIGHT|FULL) JOIN second_table
        ON first_table.columnID = second_table.columnID;

<br>

<i>**Nota:** Una clave es un valor que podemos usar para referirnos a una fila o registro específico de una tabla.
Puede consistir en un valor (celda) que generalmente es un `ID`, o de una combinación de valores que son únicos en la tabla (clave compuesta).</i>

## **11.1 Tipos de JOIN**

* `JOIN`: mantiene sólo los registros que coinciden con la condición (después del `ON`) en ambas tablas, y los registros de ambas tablas que no coincidan, no aparecerían en la tabla de resultado.

<br>

* `LEFT JOIN`: devuelve todos los registros de la primera tabla (izquierda), y los registros coincidentes de la segunda tabla (derecha). El resultado es `NULL` del lado derecho, si no hay coincidencia.

<br>

* `RIGHT JOIN`: devuelve todos los registros de la segunda tabla (derecha), y los registros coincidentes de la primera tabla (izquierda). El resultado es `NULL` del lado izquierdo, si no hay coincidencia.

<br>

* `FULL JOIN`: devuelve todos los registros cuando hay una coincidencia en los registros de la primera tabla (izquierda) o segunda tabla (derecha). <i>**Nota:** `FULL JOIN` puede potencialmente devolver conjuntos de resultados MUY grandes.</i>
    
<br>
<br>

Cuando se quiere unir diferentes tablas, es necesario que pienses en lo siguiente:

1. Decidir qué tipo de unión usar. Las más comunes son: `JOIN` y `LEFT JOIN`.

2. Especificar el valor común que se utiliza para conectar las tablas (la clave).

3. Asegurarse de que al menos uno de los valores tiene que ser una clave en su tabla.

4. ¡Paciencia! Usar los `JOIN` de forma incorrecta, es el error más común (y a veces peligroso) cuando se escriben consultas complicadas.

### **11.1.1 Ejemplo ~ Lista de ligas y su país**

Queremos conocer a qué país corresponde cada liga. Para hacerlo, vamos a necesitar la información de las tablas `Country` y `League`, uniendolas por su clave en común: `Country.id = League.country_id`.

In [None]:
consultar("""
    SELECT L.id AS Id_League, L.name AS Nombre_League, C.name AS Pais
    FROM League AS L
    JOIN Country AS C ON C.id = L.country_id;
""")

Unnamed: 0,Id_League,Nombre_League,Pais
0,1,Belgium Jupiler League,Belgium
1,1729,England Premier League,England
2,4769,France Ligue 1,France
3,7809,Germany 1. Bundesliga,Germany
4,10257,Italy Serie A,Italy
5,13274,Netherlands Eredivisie,Netherlands
6,15722,Poland Ekstraklasa,Poland
7,17642,Portugal Liga ZON Sagres,Portugal
8,19694,Scotland Premier League,Scotland
9,21518,Spain LIGA BBVA,Spain


### **11.1.2 Práctica ~ Comparación de cantidad de partidos jugados en cierta temporada de España y Bélgica**

Queremos realizar una comparación de la cantidad de partidos jugados en `season = '2008/2009'` entre los países `'Spain'` y `'Belgium'`. Los datos necesarios se encuentran en las tablas `Match` y `Country`.
Asimismo, la tabla de resultados debe visualizarse de la siguiente manera:
* La columna con el nombre del país debe llamarse `country_name`.

* La columna con el conteo de partidos debe llamarse `count_matches`.

* Debemos visualizar al país con más partidos jugados en primer lugar.

In [None]:
consultar("""
    SELECT
        M.season,
        C.name AS country_name,
        COUNT(M.id) AS count_matches
    FROM
        Match AS M
        JOIN
            Country AS C
            ON C.id = M.country_id
    WHERE
        M.season = '2008/2009'
        AND C.name IN ('Spain', 'Belgium')
    GROUP BY
        country_name
    ORDER BY
        country_name DESC;
""")

Unnamed: 0,season,country_name,count_matches
0,2008/2009,Spain,380
1,2008/2009,Belgium,306


### **11.1.3 Práctica ~ Lista detallada de juegos**

Queremos un detalle de 10 juegos realizados en el país `Spain`, ordenado de forma ascendente por `date`.

<br>

Lo que nos interesa ver es:
* El `id` del encuentro.

* El `Country.name` bajo alias `country_name`.

* El `League.name` bajo alias `league_name`.

* `season`.

* `stage`.

* `date`.

* El `team_long_name` del equipo local bajo alias `home_team`.

* El `team_long_name` del equipo visitante bajo alias `away_team`.

* `home_team_goal`.

* `away_team_goal`.

<br>

Esta información se encuentra repartida entre las tablas: `Match`, `Country`, `League` y `Team`. Teniendo en cuenta que las claves compartidas entre tablas son estas:

* `Country.id = Match.country_id`.

* `League.id = Match.league_id`.

* `Team.team_api_id = Match.home_team_api_id`.

In [None]:
consultar("""
    SELECT
        M.id,
        C.name AS country_name,
        L.name AS league_name,
        M.season,
        M.stage,
        M.date,
        TH.team_long_name AS home_team,
        TA.team_long_name AS away_team,
        M.home_team_goal,
        M.away_team_goal
    FROM
        Match AS M
        LEFT JOIN
            Country AS C
            ON C.id = M.country_id
        LEFT JOIN
            League AS L
            ON L.id = M.league_id
        LEFT JOIN
            Team AS TH
            ON TH.team_api_id = M.home_team_api_id
        LEFT JOIN
            Team AS TA
            ON TA.team_api_id = M.away_team_api_id
    WHERE
        country_name = 'Spain'
    ORDER BY
        M.date DESC
    LIMIT
        10;
""")

Unnamed: 0,id,country_name,league_name,season,stage,date,home_team,away_team,home_team_goal,away_team_goal
0,24490,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-15 00:00:00,Real Sporting de Gijón,Villarreal CF,2,0
1,24491,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-15 00:00:00,Real Betis Balompié,Getafe CF,2,1
2,24492,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-15 00:00:00,RCD Espanyol,SD Eibar,4,2
3,24495,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-15 00:00:00,Málaga CF,UD Las Palmas,4,1
4,24497,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-15 00:00:00,Rayo Vallecano,Levante UD,3,1
5,24489,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-14 00:00:00,RC Deportivo de La Coruña,Real Madrid CF,0,2
6,24493,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-14 00:00:00,Granada CF,FC Barcelona,0,3
7,24494,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-14 00:00:00,Athletic Club de Bilbao,Sevilla FC,3,1
8,24496,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-14 00:00:00,Atlético Madrid,RC Celta de Vigo,2,0
9,24488,Spain,Spain LIGA BBVA,2015/2016,38,2016-05-13 00:00:00,Valencia CF,Real Sociedad,0,1


# **12. Función `ROUND()` para redondear**

En SQLite La función `ROUND()` se utiliza para redondear un número decimal dado a las posiciones decimales especificadas basándose en un núumero de decimales dado.

<br>

La sintaxis, es la siguiente:

        ROUND(number, decimal_value)

<br>

* `number`: Es el número decimal que necesitamos redondear.

* `decimal_value`: Define el número de decimales a redondear:

    * Si `decimal_value` es un número positivo, significa que el número se redondea hasta cerca de su valor.

    * En caso de que `decimal_value` se omita o sea negativo, se toma el valor por defecto que es cero (0) y el número se redondeará a cero (0) decimales, pero el número seguirá siendo un valor de punto flotante.

# **13. Sentencia &nbsp; ► HAVING ◄**

La sentencia `HAVING` fue añadida a SQL porque la palabra clave `WHERE` no podía ser usada con funciones agregativas. Entonces, `HAVING` es como el `WHERE` para las funciones agregativas.

<br>

La sintaxis de `HAVING` es así:

        SELECT column_name(s)
        FROM table_name
        WHERE condition
        GROUP BY column_name(s)
        HAVING condition
        ORDER BY column_name(s);

<br>

`HAVING` añade otra capa de filtrado a los datos, esta vez sobre el resultado de la tabla **después** de la agrupación. Muchas veces se utiliza para limpiar la salida.

## **13.1 Ejemplo ~ Análisis de goles por temporada en las ligas de España, Francia e Inglaterra**

Queremos saber en qué temporada el promedio de goles de equipos locales estuvo entre 1.4 y 1.6, para las ligas de `Spain`, `France` y `England`.

<br>

La tabla de resultados deberá mostrar:

* La temporada `season`.

* El `Country.name` bajo alias `country`.

* El `League.name` bajo alias `league`.

* El promedio de goles hechos por equipos locales, bajo el alias `avg_local_goals`, redondeando con 2 decimales.

* El promedio de goles hechos por equipos visitantes, bajo el alias `avg_visitor_goals`, redondeando con 2 decimales.

* El total de goles por temporada y liga, bajo el alias `total_goals`.

<br>

Esta información se encuentra repartida entre las tablas: `Match`, `Country` y `League`. Teniendo en cuenta que las claves compartidas entre tablas son estas:

* `Country.id = Match.country_id`.

* `League.id = Match.league_id`.

In [None]:
consultar("""
    SELECT
        M.season,
        C.name AS country,
        L.name AS league,
        ROUND(AVG(M.home_team_goal), 2) AS avg_local_goals,
        ROUND(AVG(M.away_team_goal), 2) AS avg_visitor_goals,
        SUM(home_team_goal + away_team_goal) AS total_goals
    FROM
        Match AS M
        LEFT JOIN
            Country AS C
            ON C.id = M.country_id
        LEFT JOIN
            League AS L
            ON L.id = M.league_id
    WHERE
        country IN ('Spain', 'France', 'England')
    GROUP BY
        M.season, league
    HAVING
        avg_local_goals BETWEEN 1.4 AND 1.6;
""")

Unnamed: 0,season,country,league,avg_local_goals,avg_visitor_goals,total_goals
0,2008/2009,England,England Premier League,1.4,1.08,942
1,2009/2010,Spain,Spain LIGA BBVA,1.6,1.11,1031
2,2011/2012,England,England Premier League,1.59,1.22,1066
3,2011/2012,France,France Ligue 1,1.47,1.04,956
4,2012/2013,England,England Premier League,1.56,1.24,1063
5,2012/2013,France,France Ligue 1,1.47,1.08,967
6,2013/2014,England,England Premier League,1.57,1.19,1052
7,2013/2014,France,France Ligue 1,1.42,1.04,933
8,2014/2015,England,England Premier League,1.47,1.09,975
9,2014/2015,France,France Ligue 1,1.41,1.08,947


## **13.2 Práctica ~ Nos basaremos en ejemplo "Lista detallada de juegos", pero eliminaremos la información del partido y fechas, para comparar las ligas por temporadas**


Para las ligas de los paises `Spain`, `Germany`, `France`, `Italy` y `England` que tengan un promedio de goles por partido mayor a 2.5, queremos conocer:

* El nombre del país del equipo como `Country`.

* El nombre de la liga en la que juega como `League`.

* La cantidad de partidos (stages) como `Stages`.

* La temporada como `Season`.

* La cantidad de equipos como `number_of_teams`.

* El promedio de goles realizados por los equipos locales como `avg_local_goals`, redondeando con 2 decimales.

* El promedio de goles realizados por los equipos visitantes como `avg_visitor_goals`, redondeando con 2 decimales.

* El promedio de goles por partido como `avg_goals`, redondeando con 2 decimales.

* El promedio de gol diferencia por partido como `avg_goal_dif`, redondeando con 2 decimales.

* El total de goles realizados en la temporada  como `total_goals`.

<br>

Esta información se encuentra repartida entre las tablas: `Match`, `Country`, `League` y `Team`. Teniendo en cuenta que las claves compartidas entre tablas son estas:

* `Country.id = Match.country_id`.

* `League.id = Match.league_id`.

* `Team.team_api_id = Match.home_team_api_id`.

In [None]:
consultar("""
    SELECT
        C.name AS Country,
        L.name AS League,
        COUNT(DISTINCT M.stage) AS Stages,
        M.season,
        COUNT(DISTINCT T.team_long_name) AS number_of_teams,
        ROUND(AVG(M.home_team_goal), 2) AS avg_local_goals,
        ROUND(AVG(M.away_team_goal), 2) AS avg_visitor_goals,
        ROUND(AVG(M.home_team_goal + away_team_goal), 2) AS avg_goals,
        ROUND(AVG(M.home_team_goal - away_team_goal), 2) AS avg_goal_dif,
        SUM(home_team_goal + away_team_goal) AS total_goals
    FROM
        Match AS M
        LEFT JOIN
            Country AS C
            ON C.id = M.country_id
        LEFT JOIN
            League AS L
            ON L.id = M.league_id
        LEFT JOIN
            Team AS T
            ON T.team_api_id = M.home_team_api_id
    WHERE
        country IN ('Spain', 'Germany', 'France', 'Italy', 'England')
    GROUP BY
        M.season, L.name
    HAVING
        avg_goals > 2.5
    LIMIT
        10;
""")

Unnamed: 0,Country,League,Stages,season,number_of_teams,avg_local_goals,avg_visitor_goals,avg_goals,avg_goal_dif,total_goals
0,Germany,Germany 1. Bundesliga,34,2008/2009,18,1.7,1.22,2.92,0.48,894
1,Italy,Italy Serie A,38,2008/2009,20,1.52,1.08,2.6,0.44,988
2,Spain,Spain LIGA BBVA,38,2008/2009,20,1.66,1.24,2.9,0.42,1101
3,England,England Premier League,38,2009/2010,20,1.7,1.07,2.77,0.62,1053
4,Germany,Germany 1. Bundesliga,34,2009/2010,18,1.51,1.32,2.83,0.2,866
5,Italy,Italy Serie A,38,2009/2010,20,1.54,1.07,2.61,0.47,992
6,Spain,Spain LIGA BBVA,38,2009/2010,20,1.6,1.11,2.71,0.49,1031
7,England,England Premier League,38,2010/2011,20,1.62,1.17,2.8,0.45,1063
8,Germany,Germany 1. Bundesliga,34,2010/2011,18,1.65,1.27,2.92,0.37,894
9,Italy,Italy Serie A,38,2010/2011,20,1.43,1.08,2.51,0.35,955


## **13.3 Práctica ~ Análisis sobre los equipos que más goles realizaron jugando como locales**


Queremos un detalle de los equipos que jugando como locales en las ligas de `Spain`, `Germany` y `England`, hayan anotado más de 50 goles. Ordenar de forma descendente por temporada y por equipo con más goles realizados. Nos interesa conocer:

* El nombre del país del equipo como `Country`.

* El nombre de la liga en la que juega como `League`.

* El nombre del equipo como `Team`.

* La cantidad de partidos (stages) como `Stages`.

* La temporada como `Season`.

* La suma de goles realizados en esa temporada, jugando como local bajo el alias `sum_goals`.

* El promedio de goles bajo alias `avg_goals`, redondeando con 2 decimales.

<br>

Esta información se encuentra repartida entre las tablas: `Match`, `Country`, `League` y `Team`. Teniendo en cuenta que las claves compartidas entre tablas son estas:

* `Country.id = Match.country_id`.

* `League.id = Match.league_id`.

* `Team.team_api_id = Match.home_team_api_id`.


In [None]:
consultar("""
    SELECT
        C.name AS Country,
        L.name AS League,
        T.team_long_name AS Team,
        COUNT(DISTINCT M.stage) AS Stages,
        M.season,
        SUM(M.home_team_goal) AS sum_goals,
        ROUND(AVG(M.home_team_goal), 2) AS avg_goals
    FROM
        Match AS M
        JOIN
            Country AS C
            ON C.id = M.country_id
        JOIN
            League AS L
            ON L.id = M.league_id
        JOIN
            Team AS T
            ON T.team_api_id = M.home_team_api_id
    WHERE
        country IN ('Spain', 'Germany', 'England')
    GROUP BY
        M.season, L.name, T.team_long_name
    HAVING
        sum_goals > 50
    LIMIT
        10;
""")

Unnamed: 0,Country,League,Team,Stages,season,sum_goals,avg_goals
0,Germany,Germany 1. Bundesliga,VfL Wolfsburg,17,2008/2009,51,3.0
1,Spain,Spain LIGA BBVA,FC Barcelona,19,2008/2009,61,3.21
2,England,England Premier League,Chelsea,19,2009/2010,68,3.58
3,England,England Premier League,Manchester United,19,2009/2010,52,2.74
4,Spain,Spain LIGA BBVA,FC Barcelona,19,2009/2010,57,3.0
5,Spain,Spain LIGA BBVA,Real Madrid CF,19,2009/2010,60,3.16
6,Spain,Spain LIGA BBVA,Real Madrid CF,19,2010/2011,61,3.21
7,England,England Premier League,Manchester City,19,2011/2012,55,2.89
8,England,England Premier League,Manchester United,19,2011/2012,52,2.74
9,Spain,Spain LIGA BBVA,FC Barcelona,19,2011/2012,73,3.84


# **14. Función `DATE()`**
`DATE()`: Esta función extrae la parte de fecha de una expresión tipo `date` o tipo `datetime` y devuelve una cadena de fecha en este formato: **AAAA-MM-DD**.

<br>

Su sintaxis es la siguiente:

        SELECT DATE(datetime_field)
        FROM table;




## **14.1 Práctica ~ Análisis del cambio en overall rating y potential de Cristiano Ronaldo por edad**

Se requiere visualizar el cambio de en `overall_rating` y `potential` de `Cristiano Ronaldo` por edad.

Entonces, la tabla de resultado deberá contener los siguientes campos: `player_name`, la edad nombrada como `Age`, `overall_rating`, `potential` y `date` como `RatingDate`.

Las tablas involucradas son `Player_Attributes` y `Player`. Que tienen una relación a través del campo `player_api_id` con mismo nombre en ambas tablas.

In [None]:
consultar("""
    SELECT
        Player.player_name,
        STRFTIME('%Y', DATE(Player_Attributes.date)) - 1985 AS Age,
        Player_Attributes.overall_rating,
        Player_Attributes.potential,
        DATE(Player_Attributes.date) AS RatingDate
    FROM
        Player
        LEFT JOIN
            Player_Attributes
            ON Player.player_api_id = Player_Attributes.player_api_id
    WHERE
        Player.player_name = 'Cristiano Ronaldo'
    GROUP BY
        Age;
""")

Unnamed: 0,player_name,Age,overall_rating,potential,RatingDate
0,Cristiano Ronaldo,22,87,92,2007-02-22
1,Cristiano Ronaldo,23,91,94,2008-08-30
2,Cristiano Ronaldo,24,90,94,2009-02-22
3,Cristiano Ronaldo,25,89,93,2010-02-22
4,Cristiano Ronaldo,26,89,93,2011-02-22
5,Cristiano Ronaldo,27,92,94,2012-02-22
6,Cristiano Ronaldo,28,92,94,2013-02-15
7,Cristiano Ronaldo,29,92,95,2014-01-17
8,Cristiano Ronaldo,30,92,92,2015-04-17


# **15. Orden de ejecución de las consultas**

Ahora que estamos familiarizados con la mayoría de las funcionalidades que se utilizan en una consulta, es muy importante entender el orden en que se ejecuta el código.

Primero, el orden de cómo lo escribimos (recordatorio):

* `SELECT`.

* `FROM`.

* `JOIN`.

* `WHERE`.

* `GROUP BY`.

* `HAVING`.

* `ORDER BY`.

* `LIMIT`.

<br>

Ahora, el orden real en que las cosas suceden. Primero, puedes pensar en esta parte como la creación de una nueva tabla temporal en la memoria:

1. Definir qué tablas usar, y conectarlas (`FROM` + `JOIN`).

2. Mantén sólo las filas que se aplican a las condiciones (`WHERE`).

3. Agrupar los datos por el nivel requerido (si es necesario) (`GROUP BY`).

4. Elige qué información quieres tener en la nueva tabla (`SELECT`). Puede tener sólo datos en bruto (si no hay agrupación), o una combinación de dimensiones (de la agrupación), y métricas.

<br>

Ahora, tomamos eso para mostrarlo de la siguiente manera:

5. Ordenar la salida de la nueva tabla (`ORDER BY`).

6. Agregar más condiciones que filtrarían la nueva tabla creada (`HAVING`).

7. Límite en número de filas (`LIMIT`).



# **16. Sentencia &nbsp; ► CASE WHEN ◄ &nbsp; en &nbsp; ► SELECT ◄**

La sentencia `CASE WHEN` de SQLite evalúa una lista de condiciones y devuelve una expresión basada en el resultado de dicha evaluación.

`CASE WHEN` es similar a la sentencia `IF-THEN-ELSE` de otros lenguajes de programación.

<br>

Se puede utilizar la sentencia `CASE WHEN` junto a cualquier sentencia que acepte una validaciones. Por ejemplo, puede utilizar la expresión `CASE WHEN` en sentencias como `WHERE`, `ORDER BY`, `HAVING`, `SELECT` y también en `UPDATE` y `DELETE`.

<br>

La sentencia `CASE` contiene una expresión opcional seguida de una o más cláusulas `WHEN [condition] THEN [expression]`, terminando con una cláusula opcional `ELSE` y la cláusula obligatoria `END`.

<br>

Las sintaxis de `CASE` pueden ser de la siguiente manera:

<br>

* Sintaxis de Simple `CASE`:

        CASE case_expression
        WHEN when_expression_1 THEN result_1
        WHEN when_expression_2 THEN result_2
        [...]
        ELSE result_else
        END

<br>

* Sintaxis de Condition `CASE`:

        CASE
        WHEN bool_expression_1 THEN result_1
        WHEN bool_expression_2 THEN result_2
        [...]
        ELSE result_else
        END

## **16.1 Ejemplo ~ Queremos una tabla que me indique los partidos jugados por el FC Barcelona, su rival, la fecha de juego y si perdió, ganó o empato**



In [None]:
consultar("""
    SELECT
        DATE(M.date) as MatchDate,
        TH.team_long_name AS HomeTeam,
        home_team_goal AS Home_goals,
        TA.team_long_name AS VisitorTeam,
        away_team_goal Visitor_goals,
            CASE
                WHEN TH.team_api_id = 8634 AND home_team_goal < away_team_goal THEN 'Barca lost'
                WHEN TH.team_api_id = 8634 AND home_team_goal > away_team_goal THEN 'Barca won'
                WHEN TA.team_api_id = 8634 AND home_team_goal < away_team_goal THEN 'Barca won'
                WHEN TA.team_api_id = 8634 AND home_team_goal > away_team_goal THEN 'Barca lost'
                ELSE 'Tie'
            END AS Outcome
    FROM
        Match AS M
        LEFT JOIN
            Team AS TH
            on TH.team_api_id = M.home_team_api_id
        LEFT JOIN
            Team AS TA
            on Visitor.team_api_id = M.away_team_api_id
    WHERE
        (TA.team_api_id = 8634 OR TH.team_api_id = 8634)
        AND season = "2012/2013"
    Order by
        MatchDate DESC
    LIMIT 15;
""")

Unnamed: 0,MatchDate,HomeTeam,Home_goals,VisitorTeam,Visitor_goals,Outcome
0,2013-06-01,FC Barcelona,4,Málaga CF,1,Barca won
1,2013-05-26,RCD Espanyol,0,FC Barcelona,2,Barca won
2,2013-05-19,FC Barcelona,2,Real Valladolid,1,Barca won
3,2013-05-12,Atlético Madrid,1,FC Barcelona,2,Barca won
4,2013-05-05,FC Barcelona,4,Real Betis Balompié,2,Barca won
5,2013-04-27,Athletic Club de Bilbao,2,FC Barcelona,2,Tie
6,2013-04-20,FC Barcelona,1,Levante UD,0,Barca won
7,2013-04-14,Real Zaragoza,0,FC Barcelona,3,Barca won
8,2013-04-06,FC Barcelona,5,RCD Mallorca,0,Barca won
9,2013-03-30,RC Celta de Vigo,2,FC Barcelona,2,Tie


## **16.2 Práctica ~ Queremos una tabla que me indique los partidos jugados por el FC Barcelona contra el Real Madrid CF, la fecha de juego y si perdió, ganó o empató**

La información que necesitamos está repartida entre las tablas Match y Team, cuya relación es:
* `Team.team_api_id = Match.home_team_api_id`.

<br>

Queremos ver a la fecha del partido como `MatchDate`, el nombre del equipo local como `HomeTeam` y del visitante como `VisitorTeam`. También queremos ver los goles y el resultado bajo alias `Outcome`.

<br>

Datos necesarios:
* FC Barcelona: `team_api_id = 8634`.

* Real Madrid CF: `team_api_id = 8633`.

In [None]:
consultar("""
    SELECT
        DATE(M.date) as MatchDate,
        TH.team_long_name AS HomeTeam,
        home_team_goal AS Home_goals,
        TA.team_long_name AS VisitorTeam,
        away_team_goal Visitor_goals,
            CASE
                WHEN TH.team_api_id = 8634 AND home_team_goal < away_team_goal THEN 'Real Madrid Won'
                WHEN TH.team_api_id = 8634 AND home_team_goal > away_team_goal THEN 'Barca Won'
                WHEN TA.team_api_id = 8634 AND home_team_goal < away_team_goal THEN 'Barca Won'
                WHEN TA.team_api_id = 8634 AND home_team_goal > away_team_goal THEN 'Real Madrid Won'
                ELSE 'Tie'
            END AS Outcome
    FROM
        Match AS M
        LEFT JOIN
            Team AS TH
            on TH.team_api_id = M.home_team_api_id
        LEFT JOIN
            Team AS TA
            on TA.team_api_id = M.away_team_api_id
    WHERE
        (TA.team_api_id = 8634 AND TH.team_api_id = 8633) OR (TA.team_api_id = 8633 AND TH.team_api_id = 8634)
    Order by
        MatchDate DESC;
""")

Unnamed: 0,MatchDate,HomeTeam,Home_goals,VisitorTeam,Visitor_goals,Outcome
0,2016-04-02,FC Barcelona,1,Real Madrid CF,2,Real Madrid Won
1,2015-11-21,Real Madrid CF,0,FC Barcelona,4,Barca Won
2,2015-03-22,FC Barcelona,2,Real Madrid CF,1,Barca Won
3,2014-10-25,Real Madrid CF,3,FC Barcelona,1,Real Madrid Won
4,2014-03-23,Real Madrid CF,3,FC Barcelona,4,Barca Won
5,2013-10-26,FC Barcelona,2,Real Madrid CF,1,Barca Won
6,2013-03-02,Real Madrid CF,2,FC Barcelona,1,Real Madrid Won
7,2012-10-07,FC Barcelona,2,Real Madrid CF,2,Tie
8,2012-04-21,FC Barcelona,1,Real Madrid CF,2,Real Madrid Won
9,2011-12-10,Real Madrid CF,1,FC Barcelona,3,Barca Won


# **17. SUB QUERIES** <a name="celda-subquery"></a>

El uso de subconsultas es una herramienta esencial en SQL, ya que permite manipular los datos de formas muy avanzadas sin necesidad de ningún script externo, y es especialmente importante cuando tus tablas están estructuradas de tal forma que no se pueden unir directamente.

## **17.1 Ejemplo ~ Rating de Cristiano Ronaldo y Lionel Messi versus los demás jugadores**

Se requiere comparar el promedio de `overall_rating` y `potential` de `Cristiano Ronaldo` y `Lionel Messi` contra el promedio de los demás jugadores de la base de datos.

Entonces, la tabla de resultado deberá contener los siguientes campos: `player_name`, el promedio redondeado con 2 decimales de `overall_rating` y el promedio redondeado con 2 decimales de `potential`. Mostrando a los demás jugadores como "Others".

Las tablas involucradas son `Player_Attributes` y `Player`. Que tienen una relación en el campo `player_api_id` que tiene ese nombre en ambas tablas.

In [None]:
consultar("""
    SELECT
        CASE
            WHEN player_name = 'Cristiano Ronaldo' THEN 'Cristiano Ronaldo'
            WHEN player_name = 'Lionel Messi' THEN 'Lionel Messi'
            ELSE 'Others'
        END AS Player,
        PA_Grouped.avg_overall_rating AS avg_overall_rating,
        PA_Grouped.avg_potential AS avg_potential
    FROM
        Player
        LEFT JOIN
            (SELECT
                Player_Attributes.player_api_id,
                ROUND(avg(Player_Attributes.overall_rating),2) AS avg_overall_rating,
                ROUND(avg(Player_Attributes.potential),2) AS avg_potential
            FROM
                Player_Attributes
            GROUP BY
                Player_Attributes.player_api_id)
           AS PA_Grouped
           ON Player.player_api_id = PA_Grouped.player_api_id
    GROUP BY
        Player
    ORDER BY
        Player;
""")

Unnamed: 0,Player,avg_overall_rating,avg_potential
0,Cristiano Ronaldo,91.28,93.48
1,Lionel Messi,92.19,95.23
2,Others,63.6,67.6


## **17.2 Práctica ~ Comparación de tipo de juego entre el FC Barcelona y Real Madrid FC - SUB QUERY**

Como práctica del uso de `CASE WHEN`, se requiere simular la asignación de clase de juego de acuerdo a los siguientes ratings.
Para el rating buildUpPlaySpeed que debe ser mostrado como `PlaySpeed`, se considera lo siguiente:

* `buildUpPlaySpeed >= 70` como `Fast`.

* `buildUpPlaySpeed <= 30` como `Slow`.

* Si no como `Balanced`.

<br>

Para el rating buildUpPlayPassing que debe ser mostrado como `PlayPassing`, se considera lo siguiente:

* `buildUpPlayPassing >= 70` como `Long`.

* `buildUpPlayPassing <= 30` como `Short`.

* Si no como `Mixed`.

<br>

Para el rating chanceCreationShooting que debe ser mostrado como `CreationShooting`, se considera lo siguiente:

* `chanceCreationShooting >= 68` como `Lots`.

* `chanceCreationShooting <= 30` como `Little`.

* Si no como `Normal`.

<br>

Las tablas necesarias son: `Team_Attributes` y `Team`, cuya relación se da en:
* `Team_Attributes.team_api_id = Team.team_api_id`.

<br>

La tabla de resultados debe mostrar la fecha de rating como `RatingDate`, `team_api_id` como `TeamID` y `team_long_name` como `Team`. Además, debe estar agrupada por fecha de rating y equipo.


In [None]:
consultar("""
    SELECT
        DATE(TA.date) AS RatingDate,
        T.team_api_id AS TeamID,
        T.team_long_name AS Team,
        CASE
            WHEN TA.buildUpPlaySpeed >= 70 THEN 'Fast'
            WHEN TA.buildUpPlaySpeed <= 30 THEN 'Slow'
            ELSE 'Balanced'
        END AS PlaySpeed,
        CASE
            WHEN TA.buildUpPlayPassing >= 70 THEN 'Long'
            WHEN TA.buildUpPlayPassing <= 30 THEN 'Short'
            ELSE 'Mixed'
        END AS PlayPassing,
        CASE
            WHEN TA.chanceCreationShooting >= 68 THEN 'Lots'
            WHEN TA.chanceCreationShooting <= 30 THEN 'Little'
            ELSE 'Normal'
        END AS CreationShooting
    FROM
        Team_Attributes AS TA
        LEFT JOIN
            Team AS T
            ON T.team_api_id = TA.team_api_id
    WHERE
        T.team_long_name IN ('FC Barcelona', 'Real Madrid CF')
    GROUP BY
        RatingDate, TeamID
    ORDER BY
        RatingDate DESC;
""")

Unnamed: 0,RatingDate,TeamID,Team,PlaySpeed,PlayPassing,CreationShooting
0,2015-09-10,8633,Real Madrid CF,Balanced,Mixed,Normal
1,2015-09-10,8634,FC Barcelona,Balanced,Mixed,Normal
2,2014-09-19,8633,Real Madrid CF,Balanced,Mixed,Lots
3,2014-09-19,8634,FC Barcelona,Balanced,Mixed,Normal
4,2013-09-20,8633,Real Madrid CF,Balanced,Mixed,Lots
5,2013-09-20,8634,FC Barcelona,Balanced,Mixed,Normal
6,2012-02-22,8633,Real Madrid CF,Balanced,Mixed,Lots
7,2012-02-22,8634,FC Barcelona,Slow,Short,Normal
8,2011-02-22,8633,Real Madrid CF,Balanced,Mixed,Normal
9,2011-02-22,8634,FC Barcelona,Balanced,Mixed,Lots
