## Ejemplo 2: Series

### 1. Objetivos:
    - Entender qué son las `Series`
    - Aprender a crear `Series` de pandas
    - Aprender los métodos básicos de indexación de las `Series`
 
---
    
### 2. Desarrollo:

In [2]:
import pandas as pd

Las `Series` son secuencias ordenadas de unidimensionales que pueden contener diferentes tipos de valores. En esto se parecen a las `listas`. De hecho podemos crear `Series` usando `listas`.

In [3]:
# Voy a crear una estructura de datos tipo Series
# a partir de una lista [3,7,9,8]

serie_1 = pd.Series([3, 7, 9, 8])

In [4]:
# ¿Cómo se ve este objeto?
serie_1

0    3
1    7
2    9
3    8
dtype: int64

Una gran diferencia que tienen con las `listas` es que cada elemento en una `Serie` tiene un índice asociado que no necesariamente es una secuencia de enteros como en las `listas`. En este aspecto, nuestras `Series` se parecen a los `diccionarios`:

In [4]:
serie_1

0    3
1    7
2    9
3    8
dtype: int64

In [5]:
# CReamos otra serie
otra_serie = pd.Series(["casita", "pollo", "perro"])
otra_serie

0    casita
1     pollo
2     perro
dtype: object

La columna de la izquierda es nuestro índice, la columna de la derecha son los datos almacenados en la `Serie`. El texto en la parte inferior es el tipo de dato que tenemos en nuestra `Serie`.

Los tipos de datos más comunes que podemos encontrar son: 

1. `int64`: Equivalente a `int`
2. `float64`: Equivalente a `float`
3. `bool`: Equivalente a `bool` (duh), i.e. TRUEs o FALSEs
4. `object`: Equivalente a `str`, o indica que hay una mezcla de tipos de datos numéricos y no-numéricos en la `Serie`

> **Importante**: Tener `Series` que contengan diversos tipos de datos es una **muy mala** práctica. Lo recomendable es siempre tener homogeneidad de tipos de dato en cada `Serie` que tengamos. De todas maneras, se encontrarán por ahí algunos conjuntos de datos que contienen `Series` con tipos de datos diversos. Es por eso que cuando nos topemos con un tipo de dato `obj` tenemos que ser cuidadosos y no asumir automáticamente que el tipo de dato incluido son `strings`.

Como les mencioné, los índices de una Serie no necesariamiente tienen que ser números 0,1,2,3,....

Podamos asignar como índices cualesquiera otros números

Podemos crear `Series` con un índice customizado (personalizado), a partir del argumento `index`:

In [7]:
# El primer argumento son los valores de nuestra serie
# el argumento index, es para definir los índices
# si no tiene el argumento index, por default
# asigna como índice 0,1,2,3...
serie_2 = pd.Series([4, 7, 9, 8], index=[10, 11, 150, 13])

serie_2

10     4
11     7
150    9
13     8
dtype: int64

Los índices pueden ser super flexibles

Incluso podemos usar `strings` en el índice:

In [9]:
serie_3 = pd.Series([5, 8, 7, 2], index=['a', 'juanito', 'c', 'd'])

serie_3

a          5
juanito    8
c          7
d          2
dtype: int64

Debido a su similitud, podemos incluso crear `Series` usando `diccionarios`:

In [10]:
# definimos un diccionario
datos = {
    "Juan": 45,
    "Pepe": 56,
    "Alfonsina": 12,
    "Jenny": 49,
    "Marco P.": 12
}

# aplicamos la función pd.Series para convertir
# este diccionario en una Serie
serie_4 = pd.Series(datos)

serie_4

Juan         45
Pepe         56
Alfonsina    12
Jenny        49
Marco P.     12
dtype: int64

In [17]:
# definimos un diccionario
datos = {
    "otro": 45,
    "Pepe": 56,
    "Alfonsina": 12,
    "Jenny": 49,
    "Marco P.": 12
}

# aplicamos la función pd.Series para convertir
# este diccionario en una Serie
serie_5 = pd.Series(datos)

serie_5

otro         45
Pepe         56
Alfonsina    12
Jenny        49
Marco P.     12
dtype: int64

Al igual que en las listas, podemos acceder a nuestros datos usando el `operador de indexación`. La diferencia es que en una `Serie` tenemos que incluir el operador `loc` para indicarle a la `Serie` que estamos accesándola usando los nombres de los índices:

In [19]:
serie_1

0    3
1    7
2    9
3    8
dtype: int64

In [24]:
serie_1.loc[2] # la índice es acá la estrella

9

In [25]:
serie_1.loc[0]

3

In [20]:
serie_2

10     4
11     7
150    9
13     8
dtype: int64

In [22]:
serie_2.loc[150] # accedemos a partir de su índice

9

In [23]:
serie_2.loc[10] # accedemos a partir de su índice

4

También podemos usar también `strings` como argumento:

In [26]:
serie_3

a          5
juanito    8
c          7
d          2
dtype: int64

In [27]:
serie_3.loc['c'] # accedo al dato con el índice 'c'

7

In [28]:
serie_3.loc['juanito'] # accedo al dato con el índice 'juanito'

8

In [29]:
serie_4

Juan         45
Pepe         56
Alfonsina    12
Jenny        49
Marco P.     12
dtype: int64

In [30]:
serie_4.loc['Marco P.'] # accedo al dato
# con el índice 'Marco P.'

12

In [31]:
serie_4.loc['Jenny'] # accedo al dato
# con el índice 'Marco P.'

49

In [32]:
# POr supuesto si no encuentra un indice, me marca error
serie_4.loc['indice_raro']

KeyError: 'indice_raro'

¡Vayamos a nuestro primer Reto!