# Primeras gráficas con `Seaborn`

Métodos usados:

```python
sns.lineplot()
sns.scatterplot()

```

### Paso 1. 
Importa las librerías necesarias.

In [None]:
import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt

### Paso 2. 
Carga los datos de consumo de alcohol por país y asígnalos a una variable de nombre 'drinks'. La columna que se empleará de índice será 'country'

### Paso 3.1
Guarda en una tabla de nombre 'Europa_beer_wine' los datos de consumo de cerveza y vino de los paises europeos.  

### Paso 3.2
Guarda en una tabla de nombre 'Europa_alcohol' los datos de consumo de alcohol en litros por persona de los paises europeos que consumen más de 9.9 litros por persona.  

### Paso 3.3
Guarda en una tabla de nombre 'Mundo_alcohol' los datos de
* continente
* cervezas consumidas al año por persona (*beer_servings*)
* copas al año por persona (*spirit_servings*) 
* total numero de litros al año por persona (*total_litres_of_pure_alcohol*).
  
de los paises del mundo que consumen toman mas de 20 copas (*spirit_servings*) por persona al año.  

### Paso 3.4
Cambia los nombres de las columnas.
* 'Europa_beer_wine' tendrá por columnas 'Cerveza' y 'Vino' 
* 'Europa_alcohol' tendrá por columnas 'Total' 
* 'Mundo_alcohol' tendrá por columnas 'Continente', 'Cervezas', 'Copas' y 'Total' 

### Paso 4.1. Lineplots

Usa la función 
``` python
sns.lineplot()
```
para hacer una gráfica del consumo de alcohol por persona de los países de la tabla 'Europa_alcohol'

Antes de mostrar la gráfica incluye la sentencia:
``` python
plt.xticks(rotation=45, ha='right')
```
para girar los nombres de los países en la gráfica y facilitar su lectura.

##  Paso 4.2.

Modifica la grafica para cambiarle:

* el tamaño:
```python
plt.figure(figsize=(12,6))
```
* el título:
```python
plt.title("Consumo de alcohol por habitante en litros en los países europeos de mayor consumo.")
```
* el color del fondo
```python
sns.set_theme(rc={"axes.facecolor": 'grey',
```
* añadir malla en el fondo
```python
sns.set_theme(rc={"axes.facecolor": 'grey', "axes.grid":True,
```
* cambiar el tamaño de los ticks en los ejes
```python
sns.set_theme(rc={"axes.facecolor":"#283747", "axes.grid":True,'xtick.labelsize':14,'ytick.labelsize':14})
```
* cambia por último el color de la linea de la gráfica y su grosor



### Paso 5.1

Repite el Paso 4 para dibujar en la misma gráfica dos líneas: 
* En verde el consumo de cerveza por país de la tabla Europa_beer_wine.
* En rojo el consumo de vino por país de la tabla Europa_beer_wine.

Deberás añadir el parámetro 'label' a la función 
``` python
sns.lineplot()
```

### Paso 5.2.

Añadele un marcador a los puntos que conforman la gráfica: 
* Un cuadrado para el consumo de cerveza en cada país de la tabla Europa_beer_wine.
* Un círculo para el consumo de vino en cada país de la tabla Europa_beer_wine.

Deberás añadir el parámetro *marker* a la función 
``` python
sns.lineplot()
```

### Paso 5.3.

Si queremos añadir marcadores con diferente color, tamaño, ... es necesario usar el método *scatter* de *matplotlib*:
``` python
plt.scatter(Europa_beer_wine.index, Europa_beer_wine.Cerveza, color='b', s=100, marker='s')
```
Añadele un marcador a los puntos que conforman la gráfica: 
* Un cuadrado azul de tamaño 80 para el consumo de cerveza en cada país de la tabla Europa_beer_wine.
* Un círculo negro de tamaño 100 para el consumo de vino en cada país de la tabla Europa_beer_wine.

### Pregunta 6.1:
Del *DataFrame* 'Mundo_alcohol' vamos a extraer los 20 paises con mayor consumo de alcohol.
Para ello ordenalos por la columna 'Total' y muestra los 20 primeros.

### Pregunta 6.2:

Vamos a representar el consumo de cerveza en litros y el consumo de alcohol por habitante en litros en los países con mayor consumo de alcohol que acabamos de extraer.
Como el consumo de cerveza es un orden de magnitud mayor vamos a tener que normalizar o transformar las escalas para que ambas líneas sean visibles y comparables en la misma gráfica. 
Puedes hacerlo utilizando dos ejes y escalas diferentes, lo que permite que cada línea tenga su propia escala en la parte izquierda o derecha de la gráfica.

Lo haremos usando el mtodo `twinx()` de *Matplotlib*
```python
ax1.set_xticks(range(len(Top_alcohol)))
``` 
Establece manualmente las posiciones de los ticks del eje X basadas en el número de países (índice).
```python
ax1.set_xticklabels(Top_alcohol.index, rotation=80)
``` 
Se asegura de que las etiquetas del eje X (en este caso, los nombres de los países) estén correctamente rotadas 80 grados.

### Pregunta 6.3:
Del *DataFrame* 'Mundo_alcohol' vamos a extraer los 5 paises de cada contiente con mayor consumo de alcohol.
Luego los juntaremos en una *DataFrame* de nombre 'Top_continentes' 

Puedes usar la función:
```python

pd.concat([df1,df2,...,dfn], axis = 0)
```

### Pregunta 6.4:

Vamos a representar el consumo de cerveza en litros y el consumo de alcohol por habitante en litros en los 5 países con mayor consumo de alcohol de cada continente segun el *DataFrame*.
De nuevo hará falta usar dos escalas en el eje 'y', una para la cerveza y otra para el alcohol total. Pero además ahora usaremos una paleta de color diferente para cada continente de forma que se puedan representar en la misma gráfica.
Usaremos
```python
 palette_cerveza = sns.color_palette("Reds", n_colors=Top_continentes['Continente'].nunique())
 palette_alcohol = sns.color_palette("Blues", n_colors=Top_continentes['Continente'].nunique())
```
y añadiremos el parámetro `hue='Continente'` a la función `sns.lineplot` para emplear un color diferente para los países de cada continente.

### Paso 7.1 Scatterplots

Usa la función 
``` python
sns.scatterplot()
```
para dibujar una gráfica de puntos a partir de la información de la tabla 'Mundo_alcohol'.
En primer lugar restringe los datos a los países de Asia y haz una gráfica donde para cada país se indique la cantidad total de alcohol consumida.

### Paso 7.2.

A continuación crea una malla de 4 gráficas; 2 filas y 2 columnas con la misma información de los continentes 'Europe', 'Africa', 'North America' y 'South America'.

Necesitarás emplear:
* Definir la matriz de gráficos
```python
fig, axes = plt.subplots()
```
* Rotar las etiquetas en el eje x 
```python
for ax in axes.flatten():
    for label in ax.get_xticklabels():
        label.set_rotation(80)
```
* Poner título a cada gráfica.
```python
axes[i,j].set_title('Nombre')
```
* Ajustar el espacio entre gráficas.
```python
plt.tight_layout()
```




### Paso 7.3.

Haz una gráfica de puntos *scatterplot* donde muestres en el eje *x* el número de copas al año por persona ('Copas') y en el eje *y* el consumo total de alcohol en litros ('Total') de la tabla 'Mundo_alcohol'.

Usando el atributo:
``` python
sns.scatterplot( ...   ,hue= ***, ...)
```
emplea un color diferente para el marcador de cada continente.



### Paso 7.4.

Repite la gráfica anterior pero utiliza el atributo:
``` python
sns.scatterplot( ...   ,style= ***, ...)
```
para usar un marcador diferente en cada continente.


### Paso 7.5.

Por último añade a la gráfica del Paso 6.3. la información del número de cervezas consumidas.
Usando el atributo `size` junto con el modificador `sizes`
``` python
sns.scatterplot( ...   ,  size= ***, sizes = (10,100), ...)
```
modifica el tamaño de los marcadores en función del número de cervezas consumidas.