# Pandas

Importación y visualización de datos.

In [1]:
import pandas as pd
import numpy as np

# Series

Comenzamos analizando al "grupo de los 7" o G7. Una alianza política formada por Canada, Francia, Alemania, Italia, Japón, Reino Unido y EE.UU. Empezaremos analizando población, y para ello usaremos el objeto <code>pandas.Series</code>

In [2]:
g7_pop = pd.Series([35.467,63.951,80.490,60.665,127.061,64.511,318.523])

In [3]:
g7_pop

0     35.467
1     63.951
2     80.490
3     60.665
4    127.061
5     64.511
6    318.523
dtype: float64

Le ponemos nombre a la serie para que se sepa de qué dato se trata.



In [29]:
g7_pop.name = 'Población del G7 en millones'
g7_pop

Canada             35.467
Francia            63.951
Alemania           80.490
Italia             60.665
Japón             127.061
Reino Unido        64.511
Estados Unidos    318.523
Name: Población del G7 en millones, dtype: float64

In [5]:
g7_pop[0]

35.467

In [6]:
g7_pop[1]

63.951

In [14]:
g7_pop[3]

60.665

In [15]:
g7_pop.dtype

dtype('float64')

In [16]:
g7_pop.values

array([ 35.467,  63.951,  80.49 ,  60.665, 127.061,  64.511, 318.523])

In [17]:
type(g7_pop.values)

numpy.ndarray

In [18]:
g7_pop.index

RangeIndex(start=0, stop=7, step=1)

In [19]:
g7_pop.index = [
    'Canada',
    'Francia',
    'Alemania',
    'Italia',
    'Japón',
    'Reino Unido',
    'Estados Unidos',
]

In [30]:
g7_pop

Canada             35.467
Francia            63.951
Alemania           80.490
Italia             60.665
Japón             127.061
Reino Unido        64.511
Estados Unidos    318.523
Name: Población del G7 en millones, dtype: float64

In [21]:
g7_pop.iloc[0]

35.467

In [31]:
g7_pop[['Italia','Francia']]

Italia     60.665
Francia    63.951
Name: Población del G7 en millones, dtype: float64

In [32]:
g7_pop['Canada':'Italia']

Canada      35.467
Francia     63.951
Alemania    80.490
Italia      60.665
Name: Población del G7 en millones, dtype: float64

# Selección condicional con arreglos booleanos

Se pueden aplicar de la misma manera que con <code>Numpy</code>

In [33]:
g7_pop

Canada             35.467
Francia            63.951
Alemania           80.490
Italia             60.665
Japón             127.061
Reino Unido        64.511
Estados Unidos    318.523
Name: Población del G7 en millones, dtype: float64

In [34]:
g7_pop > 70

Canada            False
Francia           False
Alemania           True
Italia            False
Japón              True
Reino Unido       False
Estados Unidos     True
Name: Población del G7 en millones, dtype: bool

In [35]:
g7_pop[g7_pop > 70]

Alemania           80.490
Japón             127.061
Estados Unidos    318.523
Name: Población del G7 en millones, dtype: float64

In [36]:
g7_pop.mean()

107.23828571428571

In [37]:
g7_pop[g7_pop > g7_pop.mean()]

Japón             127.061
Estados Unidos    318.523
Name: Población del G7 en millones, dtype: float64

In [38]:
g7_pop.std()

97.27044748657269

In [39]:
g7_pop[(g7_pop > g7_pop.mean() - g7_pop.std() / 2) | (g7_pop > g7_pop.mean() + g7_pop.std() / 2)]

Francia            63.951
Alemania           80.490
Italia             60.665
Japón             127.061
Reino Unido        64.511
Estados Unidos    318.523
Name: Población del G7 en millones, dtype: float64

# Operaciones y métodos

Las series soportan operaciones vectorizadas y funciones de agregación como <code>Numpy</code>

In [40]:
g7_pop

Canada             35.467
Francia            63.951
Alemania           80.490
Italia             60.665
Japón             127.061
Reino Unido        64.511
Estados Unidos    318.523
Name: Población del G7 en millones, dtype: float64

In [41]:
g7_pop*1_000_000

Canada             35467000.0
Francia            63951000.0
Alemania           80490000.0
Italia             60665000.0
Japón             127061000.0
Reino Unido        64511000.0
Estados Unidos    318523000.0
Name: Población del G7 en millones, dtype: float64

In [42]:
g7_pop.mean()

107.23828571428571

In [43]:
np.log(g7_pop)

Canada            3.568603
Francia           4.158117
Alemania          4.388133
Italia            4.105367
Japón             4.844667
Reino Unido       4.166836
Estados Unidos    5.763695
Name: Población del G7 en millones, dtype: float64