# Gráficos con Python: plots y matplotlib
------------------------------------------------------


### Data Fundamentals con Python

#### Enero 2023

**Aurora Cobo Aguilera**

**The Valley**

------------------------------------------------------

## Plots de dataframes

En el siguiente notebook vamos a ver algunos ejemplos de gráficas de las miles de opciones que nos brinda Python.

Primero importamos librerías.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# set the graphs to show in the jupyter notebook
%matplotlib inline

# set seaborn graphs to a better style
sns.set(style="ticks")

A continuación, cargamos el dataset en un dataframe.

In [None]:
titanic = pd.read_csv('train.csv')

titanic

Como encontramos un campo que es un identificador de paciente, podemos asignar esa columna como el nuevo índice de la tabla.

In [None]:
titanic = titanic.set_index('PassengerId')
titanic.head()

### Gráfica tipo *pie*

En primer lugar vamos a ver un ejemplo de una gráfica de tipo *pie* que nos represente el número de observaciones del sexo femenino y del masculino. Para ello, antes de nada, tenemos que separar ambos subconjuntos.

In [None]:
# sum the instances of males and females
males = (titanic['Sex'] == 'male').sum()
females = (titanic['Sex'] == 'female').sum()

El gráfico se crea con el comando *plt.pie* de la librería *matplotlib*. Fíjate que hay muchos parámetros posibles para elegir las etiquetas de las muestras dibujadas, los colores, el tamaño, etc.

> **Ejercicio**: Ejecuta varias veces la siguiente celda cambiando los parámetros. Puedes buscar acerca de la librería para entender qué significa cada uno de ellos.

In [None]:
# put them into a list called proportions
proportions = [males, females]

# Create a pie chart
plt.pie(
    # using proportions
    proportions,
    
    # with the labels being officer names
    labels = ['etiqueta1', 'etiqueta2'],
    
    # with no shadows
    shadow = True,
    
    # with colors
    colors = ['red','white'],
    
    # with one slide exploded out
    explode = (0.15 , 0.5),
    
    # with the start angle at 90%
    startangle = 200,
    
    # with the percent listed as a fraction
    autopct = '%1.1f%%'
    )

# View the plot drop above
plt.axis('equal')

# Set labels
plt.title("Mi super titulo")

# View the plot
plt.tight_layout()
plt.show()

### Gráfico de nube de puntos

*seaborn* es otra librería que nos permite realizar gráficas. En este caso, *lmplot* es un gráfico disperso o de nube de puntos.

> **Ejercicio**: Comprueba a ejecutar y luego a descomentar las últimas 3 líneas y volver a ejecutar. ¿Cuáles son las diferencias? ¿Qué función tienen esos comandos?

In [None]:
# creates the plot using
lm = sns.lmplot(x = 'Age', y = 'Fare', data = titanic, hue = 'Sex', fit_reg=False)

# set title
lm.set(title = 'Mortalidad por Sobreinformación hoy')

# get the axes object and tweak it
#axes = lm.axes
#axes[0,0].set_ylim(510,520)
#axes[0,0].set_xlim(25,40)

### Gráfico de un histograma

Por último, vamos a representar un histograma con datos de nuestro ejemplo. Vamos a usar los datos de la tarifa (*fare*). 

Vamos a verlos ordenados, aunque no haría falta ordenarlos para pintar el histograma.

In [None]:
df = titanic.Fare.sort_values(ascending = False)
df

Creamos los intervalos del histograma.

In [None]:
# create bins interval using numpy
binsVal = np.arange(0,600,10)
binsVal

Para dibujar el plot hace falta usar el comando *plt.hist*. Fíjate en las opciones y comandos extra.

In [None]:
# create the plot
plt.hist(df, bins = binsVal)

# Set the title and labels
plt.xlabel('Tarifa')
plt.ylabel('#Veces')
plt.title('Titanic')

# show the plot
plt.show()

Te dejo que investiges más opciones en la web con la librería de *matplotlib*.

Pero antes de acabar este apartado,

> **Ejercicio**: ¿Podrías decirme cuántas personas sobrevivieron según este dataset?

In [None]:
#<SOL>

#</SOL>

> **Ejercicio**: ¿Quiénes tenían la tarifa más cara? Pista: Ya sabes cuál es la más cara al haber ordenado antes las observaciones.

In [None]:
#<SOL>

#</SOL>

### Gráficos de una curva

Por último, en el siguiente ejemplo, dibujamos dos sinusoides con diferentes símbolos. 

In [None]:
t = np.arange(0.0, 1.0, 0.05) #del 0 al 1 cada 0.05
a1 = np.sin(2*np.pi*t)
a2 = np.sin(4*np.pi*t)


plt.figure()
ax1 = plt.subplot(211)
ax1.plot(t,a1)
plt.xlabel('t')
plt.ylabel('a_1(t)')
ax2 = plt.subplot(212)
ax2.plot(t,a2, 'r.')
plt.xlabel('t')
plt.ylabel('a_2(t)')
plt.show()

> **Ejercicio**: Define dos lista de puntos, una para el eje x y otra para el eje y. Después, realiza el gráfico de la curva asociada a dichos puntos con la función *plot()* de *matplotlib*.

In [None]:
# <SOL>

# </SOL>