# matplotlib.pyplot

Colección de python con funciones que hacen que matplotlib funcione como MATLAB

https://matplotlib.org/3.5.0/tutorials/introductory/pyplot.html

In [None]:
# Para iniciar con pyplot, debemos importar la clase

import matplotlib.pyplot as plt

## Grafico usando listas

In [None]:
import matplotlib.pyplot as plt

x1 = [2,5,6,14]
y1 = [11,22,33,44]

x2 = [2,5,6,15]
y2 = [4,12,18,45]

In [None]:
# plot(): Plotea 'y' versus 'x' como líneas y/o marcadores

# matplotlib.pyplot.plot(*args, scalex=True, scaley=True, data=None, **kwargs)
# https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html

# Graficar 2 lineas en la misma grid

plt.plot(x1,y1, color="blue", linewidth = 3, label = 'Linea 1')
plt.plot(x2,y2, color="green", linewidth = 3, label = 'Linea 2')

plt.title('Dos Graficas juntas')
plt.xlabel('Eje X')
plt.ylabel('Eje Y')
plt.legend()
plt.grid()
plt.show() # opcional solo para notebook de python

In [None]:
# bar(): Plotea grafica de barras 

# matplotlib.pyplot.bar(x, height, width=0.8, bottom=None, *, align='center', data=None, **kwargs)
# https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.bar.html?highlight=bar#matplotlib.pyplot.bar

# Grafico de barras. Cuando coinciden la misma X, las apila

plt.bar(x1,y1, color="blue", width=0.8, label = 'Barra 1')
plt.bar(x2,y2, color="green", width=0.8, label = 'Barra 2')

plt.title('Dos Barras juntas')
plt.xlabel('Eje X')
plt.ylabel('Eje Y')
plt.legend()
plt.grid()
plt.show() # opcional solo para notebook de python

In [None]:
# hist(): Calcula y dibuja el histograma de x

# matplotlib.pyplot.hist(x, bins=None, range=None, density=False, weights=None, cumulative=False, bottom=None, histtype='bar', align='mid', orientation='vertical', rwidth=None, log=False, color=None, label=None, stacked=False, *, data=None, **kwargs)
# https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html?highlight=hist#matplotlib.pyplot.hist

# Grafica el histograma de 'Datos'

Datos = [20,22,21,20,23,25,28,40,22,23,22,15,16,18,18,19,21,22,24,4,12,17,17,22,30,]
Intervalos=[0,10,20,20,30,40]

plt.hist(Datos, Intervalos, histtype='bar', rwidth=0.8, color='lightgreen')

plt.title('Histograma')
plt.xlabel('Eje X')
plt.ylabel('Eje Y')
plt.grid()
plt.show() # opcional solo para notebook de python

In [None]:
import matplotlib.pyplot as plt

edades = [12, 15, 13, 12, 18, 20, 19, 20, 13, 12, 13, 17, 15, 16, 13, 14, 13, 17, 19]
intervalos = range(min(edades), max(edades) + 2)
#print(intervalos) # calculamos los extremos de los intervalos

plt.hist(edades, intervalos, color='lightgreen', rwidth=0.5)
plt.title('Histograma de edades')
plt.xlabel('Edades')
plt.ylabel('Frecuencia')
plt.xticks(intervalos)

plt.show() #dibujamos el histograma

In [None]:
# scatter(): Genera un gráfico de dispersión de 'y' frente a 'x' con diferentes tamaños y/o colores de marcador.

# matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, *, edgecolors=None, plotnonfinite=False, data=None, **kwargs)
# https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html?highlight=scatter#matplotlib.pyplot.scatter

# colores matplotlib:
# https://matplotlib.org/2.0.1/api/colors_api.html

# Gráfica de dispersión

import matplotlib.pyplot as plt

x1 = [2,5,6,14]
y1 = [11,22,33,44]

plt.scatter(x1,y1, color="orange", label = 'Puntos 1')

plt.title('Dos Graficas juntas')
plt.xlabel('Eje X')
plt.ylabel('Eje Y')
plt.legend()
plt.grid()
plt.show() # opcional

In [None]:
# pie(): Ploeta una gráfica de pie.

# matplotlib.pyplot.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=0, radius=1, counterclock=True, wedgeprops=None, textprops=None, center=(0, 0), frame=False, rotatelabels=False, *, normalize=True, data=None)
# https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.pie.html?highlight=pie#matplotlib.pyplot.pie

# Grafica tipo Pie
valores_pie = [20,40,60,80] # valores de la torta
matrizFraccionRadio_pie = (0.1,0,0,0) # 
etiquetas_pie = ['Prekinder', 'kinder', 'primaria', 'secundaria'] # etiquetas de la torta
colores_pie = ['red','purple','blue','orange'] # colores de la torta
parametro_autopct_pie = '%1.1f%%' # formato de etiquetas
parametro_shadow_pie = True # sombra on/off
parametro_startangle_pie = 45 # angulo de inicio de la torta

plt.pie(valores_pie, matrizFraccionRadio_pie, etiquetas_pie, colores_pie, autopct = parametro_autopct_pie, shadow = parametro_shadow_pie, startangle = parametro_startangle_pie)
plt.title('Grafico circular')
plt.show()

# Grafico usando Dataframes a Series

In [None]:
# Carga dataset del Titanic
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
df = pd.read_csv('titanic3.csv')

In [None]:
df.head(2)

In [None]:
print(type(df.survived.value_counts()))

cantidades = df.survived.value_counts()
cantidades

In [None]:
# matplotlib.pyplot.figure(): Crea una figura nueva o activa una ya existente

# matplotlib.pyplot.figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True, FigureClass=<class 'matplotlib.figure.Figure'>, clear=False, **kwargs)
# https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.figure.html?highlight=figure#matplotlib.pyplot.figure

# Crea una figura nueva para ploteo

plt.figure(figsize=(30,20))  #tamaño en pulgadas

# matplotlib.pyplot.subplot2grid(): Crea una subárea en una ubicación específica dentro de una grilla normal

# matplotlib.pyplot.subplot2grid(shape, loc, rowspan=1, colspan=1, fig=None, **kwargs)
# https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplot2grid.html

# Se crean 4 subareas de ploteo

plt.subplot2grid((2,2),(0,0))
plt.subplot2grid((2,2),(1,0))
plt.subplot2grid((2,2),(0,1))
plt.subplot2grid((2,2),(1,1))

In [None]:
#figure: Crea una figura nueva o active una figura existente.

plt.figure(figsize=(30,20))  #tamaño en pulgadas


plt.subplot2grid((2,2),(0,0))  #Grid de 2x2. primer grafico en la posicion (0,0)
df.survived.value_counts().plot(kind='bar', alpha = 1)  #seriexxxx.plot() #alpha: transparencia 0-1
plt.title('Sobrevivientes - Cantidad')


plt.subplot2grid((2,2),(0,1))
df.survived.value_counts(normalize = True).plot(kind='bar', alpha = 1) #Si es True, el objeto devuelto contendrá las frecuencias relativas de los valores únicos.
plt.title('Sobrevivientes- Porcentaje')


plt.subplot2grid((2,2),(1,0))
df.survived.value_counts().plot(kind='bar', alpha = 0.5)
plt.title('Sobrevivientes - Cantidad')


plt.subplot2grid((2,2),(1,1))
plt.bar(cantidades[0],cantidades[1], color="red", alpha = 0.5, linewidth = 1, label = 'Barra 1')

plt.title('Dos Barras juntas')
plt.xlabel('Eje X')
plt.ylabel('Eje Y')
plt.legend()
plt.grid()


In [None]:
df.head(3)

In [None]:
# grafica de dispersión
df.plot(kind='scatter',x='age',y='pclass',color='red')
plt.show()

In [None]:
df.head(3)

In [None]:
# histograma
df.age.hist(color='red')
plt.show()

# otro dataframe

https://queirozf.com/entries/pandas-dataframe-plot-examples-with-matplotlib-pyplot

In [None]:
import pandas as pd

datos = {
    'name':['john','mary','peter','jeff','bill','lisa','jose'],
    'age':[23,78,22,19,45,33,20],
    'gender':['M','F','M','M','M','F','M'],
    'state':['california','dc','california','dc','california','texas','texas'],
    'num_children':[2,0,0,3,2,1,4],
    'num_pets':[5,1,0,5,2,2,3]
}

df = pd.DataFrame(datos)

In [None]:
df.head(3)

In [None]:
df.plot(kind='scatter',x='num_children',y='num_pets',color='lightblue')
plt.show()

In [None]:
df.head(3)

In [None]:
df.plot(kind='bar',x='name',y='age', color='blue')

In [None]:
df.head(3)

In [None]:
# gca stands for 'get current axis'
ax = plt.gca() # gca significa 'obtener eje actual'

df.plot(kind='line',x='name',y='num_children',ax = ax)
df.plot(kind='line',x='name',y='num_pets', color='red', ax = ax)

plt.show()

# pandas.Series.groupby

Una operación groupby implica alguna combinación de dividir el objeto, aplicar una función y combinar los resultados. Esto se puede usar para agrupar grandes cantidades de datos y calcular operaciones en estos grupos.

https://pandas.pydata.org/docs/reference/api/pandas.Series.groupby.html?highlight=groupby#pandas.Series.groupby

In [None]:
import pandas as pd

datos = {
    'name':['john','mary','peter','jeff','bill','lisa','jose'],
    'age':[23,78,22,19,45,33,20],
    'gender':['M','F','M','M','M','F','M'],
    'state':['california','dc','california','dc','california','texas','texas'],
    'num_children':[2,0,0,3,2,1,4],
    'num_pets':[5,1,0,5,2,2,3]
}

df = pd.DataFrame(datos)


In [None]:
df.head(3)

In [None]:
#Serie cuyo indice es el estado, y valor es la cantidad de unicos
#nunique, devuelve la serie con el número de observaciones distintas sobre el eje solicitado.

import matplotlib.pyplot as plt

print(type(df.groupby('state')['name'].nunique())) 
df.groupby('state')['name'].nunique().plot(kind='bar')
plt.show()


In [None]:
print(type(df['state']))
print(type(df[['state','age']]))
print(type(df.groupby('state')))
print(type(df.groupby('state')['name']))
print(type(df.groupby('state')['name'].nunique()))


In [None]:
print(type(df.groupby(['state','gender']).size()))
df.groupby(['state','gender']).size()

In [None]:
df.head(3)

In [None]:
df.groupby(['state','gender']).size().plot(kind='bar')
plt.show()

In [None]:
#Desapila, también conocido como pivote, Series con MultiIndex para producir DataFrame.
df.groupby(['state','gender']).size().unstack().plot(kind='bar',stacked=True)
plt.show()

In [None]:
df.groupby(['gender','state']).size().unstack().plot(kind='bar',stacked=True)
plt.show()

In [None]:
#.ticket: ajuste de escala automático de los límites de vista en función de los límites de datos.
import matplotlib.ticker as mtick

df.groupby(['gender','state']).size().groupby(level=0).apply(lambda x: 100 * x / x.sum()).unstack().plot(kind='bar',stacked=True)

plt.gca().yaxis.set_major_formatter(mtick.PercentFormatter())
plt.show()

In [None]:
df[['age']].plot(kind='hist',bins=[0,20,40,60,80,100],rwidth=0.8)
plt.show()

# Dataframe con campo tipo fecha

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

#pyplot está diseñado principalmente para gráficos interactivos y casos simples de generación de gráficos programáticos

# diccionario usando un formato de fecha arbitrario (m / d / a)
diccionario = {
    'name':['john','lisa','peter','carl','linda','betty'],
    'date_of_birth':['01/21/1988','03/10/1977','07/25/1999','01/22/1977','09/30/1968','09/15/1970']
}

df = pd.DataFrame(diccionario)

In [None]:
# pandas.to_datetime(): convierte un objeto escalar, tipo matriz Serieso tipo DataFrame/dict en un objeto de fecha y hora de pandas.
# Parametro: infer_datetime_format=True: inferir el formato de las cadenas de fecha y hora en las columnas
# Matplotlib.pyplot.clf(): Borra la figura actual si existe.

df['date_of_birth'] = pd.to_datetime(df['date_of_birth'], infer_datetime_format=True)

plt.clf()
df['date_of_birth'].map(lambda d: d.month).plot(kind='hist')
plt.show()

In [None]:
import matplotlib.pyplot as plt
from matplotlib.dates import date2num #Convertir objetos de fecha y hora en fechas de Matplotlib
import datetime #Formato de fecha en analitica de datos

x = [
    #Atributos: year, month, day, hour, minute, second, microsecond, tzinfo.
    datetime.datetime(2011, 1, 4, 0, 0),
    datetime.datetime(2011, 1, 5, 0, 0),
    datetime.datetime(2011, 1, 6, 0, 0)
]
x = date2num(x)

y = [4, 9, 2]
z = [1, 2, 3]
k = [11, 12, 13]

# crea una figura y una cuadrícula de subtramas con una sola llamada
ax = plt.subplot(111)

ax.bar(x-0.2, y, width=0.2, color='b', align='center')
ax.bar(x, z, width=0.2, color='g', align='center')
ax.bar(x+0.2, k, width=0.2, color='r', align='center')
ax.xaxis_date()

plt.show()

In [None]:
diccionario = {
    'idcolision':[1,2,3],
    'f1':['A','X','M'],
    'f2':['B','A','N'],
    'f3':['A','Z','A'],
}
df = pd.DataFrame(diccionario)

In [None]:
print(type(df))
df

In [None]:
columnas = ['idcolision', 'Factor']
df2 = pd.DataFrame(columns=columnas)
df2

In [None]:
dfTemp = df[['idcolision','f1']]
dfTemp= dfTemp.rename(columns = {'f1':'Factor'})
df2 = dfTemp

dfTemp = df[['idcolision','f2']]
dfTemp= dfTemp.rename(columns = {'f2':'Factor'})
df2= pd.concat([df2, dfTemp])

dfTemp = df[['idcolision','f3']]
dfTemp= dfTemp.rename(columns = {'f3':'Factor'})
df2=pd.concat([df2, dfTemp]).reset_index() # reinicia el indice

df2= df2.drop(columns=['index'])
df2= df2.drop_duplicates() # Return DataFrame with duplicate rows removed.
df2

In [None]:
df3 = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})
df3.rename(columns={"A": "a", "B": "c"})

In [None]:
df2.append(df[['idcolision','f2']])