# SQL y slices de Datos

Recuerda que tomar un slice te permite filtrar datos irrelevantes, dejándote solo con lo que necesitas para tu análisis. Sabes cómo obtener slices de datos utilizando el método query() en Python. Llegó la hora de aprender cómo hacerlo en SQL.

El inicio de la condición utilizada para seleccionar datos se marca con el comando WHERE. La condición se evalúa en cada fila de la tabla:

````
SELECT
    column_1,
    column_2 --seleccionar nombres de columna
FROM
    table_name --especificar la tabla
WHERE
    condition;

--definir la condición de selección de fila
````

El orden de los operadores está definido estrictamente:

1) SELECT 

2) FROM

3) WHERE

Ten en cuenta que el bloque WHERE es más general que SELECT: en realidad se procesa primero. WHERE filtra los datos de la tabla en su conjunto mientras que SELECT reduce la selección.

| Nombre | Significado | 
|----------|----------|
| =   | igual a  | 
| <>,!=    | diferente a    |
| >    | mayor que   |
| <    | menor que   |
| >=    | Mayor igual a   |
| <=    | menor igual a  |
 
Seleccionemos todos los libros escritos por Stephen King:

```
SELECT
    name,
    author
FROM
    books
WHERE
    author = 'Stephen King';

--las strings se ponen entre comillas, como en Python
```

... y ahora todos los libros que no fueron escritos por Stephen King:


```
SELECT
    name,
    author
FROM
    books
WHERE
    author != 'Stephen King';
```


Aumentemos la complejidad e intentemos escribir una condición compleja usando operadores lógicos. Al igual que Python, SQL utiliza los operadores lógicos AND (Y), OR (O) y NOT (NO). Recuerda, así es como se diferencian:

Vamos a reducir nuestra selección introduciendo varias condiciones a la vez:


```
SELECT
    *
FROM
    table_name
WHERE
    condition_1
    AND condition_2;

--Selecciona las filas donde ambas condiciones sean verdaderas
SELECT
    *
FROM
    table_name
WHERE
    condition_1
    OR condition_2;

--Selecciona las filas donde una o ambas condiciones sean verdaderas
SELECT
    *
FROM
    table_name
WHERE
    condition_1
    AND NOT condition_2;

--Selecciona las filas donde condition_1 es verdadera y condition_2 es falsa
```

Recuperemos los datos sobre los libros escritos entre 1996 y 2000, incluidos sus autores y el número de páginas:

```
SELECT
    name,
    author,
    date_pub,
    pages
FROM
    books
WHERE
    date_pub > '1995-12-31'
    AND date_pub < '2001-01-01';


/* no se incluyen las fechas de inicio y fin;
para seleccionar todos los días de 1996 a 2000,
hemos tomado el último día de 1995
y el primero del 2001 */
```

Podemos acortar esta instrucción introduciendo una instrucción BETWEEN. A diferencia del código anterior, BETWEEN incluye los límites (aquí, las fechas de inicio y fin) en la selección resultante:

```
SELECT
    name,
    author,
    date_pub,
    pages
FROM
    books
WHERE
    date_pub BETWEEN '1996-01-01'
    AND '2000-12-31';


/* se incluyen las fechas de inicio y fin, por lo que
seleccionamos el primer día del año 1996 
y el último día del 2000 */
```

Los resultados de las dos instrucciones serán los mismos. Elige el enfoque que te guste más. Algunos analistas consideran que el método con dos desigualdades es una mejor solución, ya que establece claramente si los límites del rango están incluidos en la selección. Otros argumentan que las instrucciones con BETWEEN son un mejor código porque son más concisas.

Ahora vamos a escribir una instrucción que seleccione los nombres de todos los libros en los géneros humor, fantasía o novela juvenil.

```
SELECT
    name,
    genre
FROM
    books
WHERE
    genre = 'Humor'
    OR genre = 'Fantasy'
    OR genre = 'Young Adult';
```

Pero, ¿qué pasaría si quisiéramos todos los títulos de una lista de 20 o más géneros? Necesitaríamos una solución más concisa. Como ésta:

```
SELECT
    name,
    genre
FROM
    books
WHERE
    genre IN ('Humor', 'Fantasy', 'Young Adult');
```

Escribimos un código con el operador IN. El operador IN es seguido de una lista de valores que se incluirán en el resultado:

SELECT
    *
FROM
    table_name
WHERE
    column_name IN ('value_1', 'value_2', 'value_3');


Si los valores son números, se separan entre sí por comas: IN (3,7,9). Si son strings, se ponen entre comillas simples y, de nuevo, se separan por comas: IN ('value_1','value_2','value_3'). La fecha y la hora se indican de la siguiente manera: IN ('yyyy-mm-dd','yyyy-mm-dd')

Poner NOT delante del operador IN te permite seleccionar todos los libros cuyos géneros no son humor, fantasía y novela juvenil:


```
SELECT
    name,
    genre
FROM
    books
WHERE
    genre NOT IN ('Humor', 'Fantasy', 'Young Adult');
```


### Ejercicios!

**Ejercicio 1**

Estudia qué artículos tienen en oferta las tiendas y cuáles son sus cifras de ventas para el 1 de junio. Puedes obtener información sobre las actualizaciones diarias del catálogo de productos en la tabla products_data_all.

Escribe una consulta para seleccionar los siguientes campos de la tabla:

- Nombre del producto (name)
- Precio (price)
- Nombre de la tienda (name_store)
- Fecha (date_upd)

Crea un slice de datos basado en la categoría (category) y la fecha (date_upd). Te interesa la categoría milk y la fecha del Día Mundial de la Leche — '2019-06-01'. Ten en cuenta que vamos a especificar las condiciones en el bloque WHERE, no en el bloque SELECT.


In [None]:
SELECT
    name,
    price,
    name_store,
    date_upd
from 
    products_data_all
WHERE 
    category = 'milk' AND date_upd = '2019-06-01' ;
                      


**Ejercicio 2**

Descarga los campos name, price, name_store, date_upd (en ese orden) de la categoría milk para los sábados restantes de junio (8, 15, 22 y 29 de junio).



In [None]:
SELECT
    name,
    price,
    name_store,
    date_upd
FROM
    products_data_all
WHERE
    category = 'milk'
    AND
    date_upd IN ('2019-06-08', '2019-06-15', '2019-06-22', '2019-06-29')
   