# Gráfico de Pastel

Un gráfico de pastel es un elemento circular que representa sólo una serie de datos. El área del gráfico representa el porcentaje de cada uno de los datos. Normalmente los gráficos de pastel se utilizan en negocios para representar operaciones como ventas, resultados de cuestionarios etc. Principalmente porque dan un resumen rápido.

Obviamente con Matplolib se pueden hacer gráficos de pastel utilizando la función
`pie()`



In [None]:
# Importar librerias
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Inventar algunos datos

labels = 'Michis', 'Lomitos', 'Tlacuaches', 'Ajolotes', 'Cacomixtles'
sizes = [30, 25, 10, 3,8 ]


# Hacer el plot
fig, ax = plt.subplots()
plt.pie(sizes);

In [None]:
# Noten algo, cada una de las partes del plot tiene una cuña que indica el valor
# de cada uno de los elementos.

# Por default, la primer marca empieza desde el eje x y se mueve en contra de las
# manecillas del reloj


In [None]:
# Vamos mejorando el código, agregando labels
fig, ax = plt.subplots()
plt.pie(sizes, labels = labels);

# Cambiemos el ángulo en el que empieza el primer elemento
# POr default empieza en 0°
fig, ax = plt.subplots()
plt.pie(sizes, labels = labels, startangle = 45);

In [None]:
# Qué pasa si queremos resaltar un valor?

exp = [0.2, 0.0, 0.0, 0.0, 0.0] # El valor que pongan indica qué tan lejos del centro va a estar

fig, ax = plt.subplots()
plt.pie(sizes, labels = labels, startangle = 45, explode = exp);

In [None]:
# Tambien se puede agregar un efecto de sombra

fig, ax = plt.subplots()
plt.pie(sizes, labels = labels, startangle = 45, explode = exp, shadow = True);

In [None]:
# Obviamente también se puede cambiar los colores

# Vector de colores
colours = ['#390099', '#9e0059','#ff0054','#ff5400','#ffbd00']

fig, ax = plt.subplots()
plt.pie(sizes, labels = labels, startangle = 45, explode = exp, colors = colours);

In [None]:
# Pueden también integrar los valores porcentuales

fig, ax = plt.subplots()
plt.pie(sizes, labels = labels, startangle = 45, explode = exp, colors = colours, autopct = '%1.1f%%');


In [None]:
fig, ax = plt.subplots()
plt.pie(sizes, labels = labels, startangle = 45, explode = exp, colors = colours, autopct = '%1.1f%%', pctdistance = 1.25, labeldistance = 0.30);


Recuerden que los gráficos de pastel siempre van a representar una proporción de algo. Así que deben asegurarse que tenga sentido lo que están presentando.

Vamos a hacer un ejercicio para ver esto

In [None]:
# Ya se lo saben, importar las librerías
# *_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Importar los datos, son de emisiondes de CO2

url = 'https://github.com/HeardLibrary/digital-scholarship/raw/master/data/codegraf/co2_state_2016_sector.xlsx'

data = pd.read_excel(url)
data.set_index('State', inplace = True)
# *_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_*_

print(data.head())

In [None]:
# Supongamos que solamente queremos analizar un estado en particular, i.e. California

Cal_data = data.loc['California']

# Pero para hacer nuestro gráfico no queremos el Total, porque estaríamos siendo redundantes
Cal_data = Cal_data['Commercial':'Transportation']


In [None]:
# Ahora vamos entonces a hacer el gráfico para ver los datos
colours = ['#ffbc42', '#d81159','#8f2d56','#218380','#73d2de']

fig, ax = plt.subplots()
plt.pie(Cal_data, labels = Cal_data.index, startangle = 45, colors = colours, autopct = '%1.1f%%');


Tengan MUCHO cuidado con los datos que trabajan, si por ejemplo no hubieran quitado la columna de "Total" el gráfico hubiera quedado así

In [None]:
Cal_data = data.loc['California']
colours = ['#ffbc42', '#d81159','#8f2d56','#218380','#73d2de', "#253237"]

fig, ax = plt.subplots()
plt.pie(Cal_data, labels = Cal_data.index, startangle = 45, colors = colours, autopct = '%1.1f%%');


Bueno si bien un gráfico puede ser de ayuda, qué pasa entonces si queremos ver alguna comparación. En ese caso entonces tendríamos que hacer diferentes gráficos para diferentes estados.

In [None]:
# Veamos de nuevo los datos
#print(data)

# Tomemos dos estados por ejemplo California y Georgia
new_df = data.loc[['California', 'Georgia']]
new_df.drop(['Total'], axis = 'columns', inplace = True) # Qué hace el inplace???



# Básicamente es hacer una copia de el df
# df = df.operacion(inplace=False) esto genera un nuevo dataframe.


# Ahora vamos a plotear las diferencias entre ellos
colours = ['#ffbc42', '#d81159','#8f2d56','#218380','#73d2de']

fig, axs = plt.subplots(nrows = 1, ncols = 2, figsize=(12,5)) # Aquí vamos a definir el tamaño de la figura y cuántos gráficos van a haber
for ii, ax in enumerate(axs.flatten()): # Digamos que aqui se iteran los ejes de cada subplot
  plt.sca(ax) # Esto le indica al ciclo que en ese eje se haga cierta figura
  plt.pie(new_df.iloc[ii], labels = new_df.columns, startangle = 45, colors = colours, autopct = '%1.1f%%');
  plt.title(new_df.index[ii])

plt.suptitle('Comparación entre emisiones de California y Georgia \n  ')
print(new_df)
