# Visualización con Pandas

In [0]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

%matplotlib inline

!pip install dsutil
from dsutil import plotting

In [0]:
df = pd.DataFrame({
    'nombre':['john','mary','peter','jeff','bill','lisa','jose'],
    'edad':[23,78,22,19,45,33,20],
    'sexo':['M','F','M','M','M','F','M'],
    'estado':['california','dc','california','dc','california','texas','texas'],
    'num_hijos':[2,0,0,3,2,1,4],
    'num_mascotas':[5,1,0,5,2,2,3]
})
df[['nombre','edad','sexo','estado','num_hijos','num_mascotas']]

In [0]:
# plot num_hijos vs num_mascotas
df.plot(kind='scatter',x='num_hijos',y='num_mascotas',color='red')

In [0]:
df.plot(kind='bar',x='nombre',y='edad')

In [0]:
plt.clf()
# gca stands for 'get current axis'
ax = plt.gca()

df.plot(kind='line',x='nombre',y='num_hijos',ax=ax)
df.plot(kind='line',x='nombre',y='num_mascotas', color='red', ax=ax)

plt.show()

In [0]:
df.groupby('estado')['nombre'].count().plot(kind='bar')

In [0]:
df.groupby('estado').size().plot(kind='bar')

In [0]:
df.groupby(['estado','sexo']).size().unstack().plot(kind='bar',stacked=True)
plt.show()

In [0]:
plt.clf()
df.groupby(['sexo','estado'])['edad'].size().unstack().plot(kind='bar',stacked=True)
plt.legend(loc='lower right')
plt.gcf().set_size_inches(7,4)
plt.show()

In [0]:
df[['edad']].plot(kind='hist',bins=[0,20,40,60,80,100],rwidth=0.9,)

In [0]:
import matplotlib.ticker as mtick

df.groupby(['sexo','estado'])['edad'].size().groupby(level=0).apply(
    lambda x: 100 * x / x.sum()
).unstack().plot(kind='bar',stacked=True)

plt.gca().yaxis.set_major_formatter(mtick.PercentFormatter())
plt.legend(loc='lower right')
plt.gcf().set_size_inches(7,4)
plt.show()

In [0]:
df = pd.DataFrame({
    'nombre':['john','lisa','peter','carl','linda','betty'],
    'fecha_nacimiento':[
        '01/21/1988','03/10/1977','07/25/1999','01/22/1977','09/30/1968','09/15/1970'
    ]
})


In [0]:
df['fecha_nacimiento'] = pd.to_datetime(df['fecha_nacimiento'],infer_datetime_format=True)
df

In [0]:
df.dtypes

In [0]:
plt.clf()
df['fecha_nacimiento'].map(lambda d: d.month).plot(kind='hist')
plt.xlabel('Número de Mes')
plotting.add_grid()
plt.show()