## Ejemplo 2: Series

### 1. Objetivos:
    - Entender qué son las `Series`
    - Aprender a crear `Series` de pandas
    - Aprender los métodos básicos de indexación de las `Series`
 
---
    
### 2. Desarrollo:

In [2]:
import pandas as pd

Las `Series` son secuencias ordenadas de unidimensionales que pueden contener diferentes tipos de valores. En esto se parecen a las `listas`. De hecho podemos crear `Series` usando `listas` de la forma:

    pd.Series(-lista-)
    
lo anterior regresa un valor de tipo Series, donde cada valor de la serie son creados a partir de cada valor de la lista.

Vamos a crear una serie a partir de la lista `[3, 7, 9, 8]` y la vamos a guardar en la variable `serie_1`:

In [3]:
serie_1 = pd.Series([3, 7, 9, 8])

serie_1

0    3
1    7
2    9
3    8
dtype: int64

Una gran diferencia que tienen con las `listas` es que cada elemento en una `Serie` tiene un índice asociado que no necesariamente es una secuencia de enteros como en las `listas`. En este aspecto, nuestras `Series` se parecen a los `diccionarios`.

La columna de la izquierda es nuestro índice, la columna de la derecha son los datos almacenados y el texto en la parte inferior es el tipo de dato que en este caso es `int64` (el 64 se refiere a la cantidad de bits usados para representar a un entero, aunque Python en capáz de usar números gigantes, el límite es la capacidad del hardware)

Los tipos de datos más comunes que podemos encontrar son: 

1. `int64`: Equivalente a `int`
2. `float64`: Equivalente a `float`
3. `bool`: Equivalente a `bool`
4. `object`: Equivalente a `str`, o indica que hay una mezcla de tipos de datos numéricos y no-numéricos en la `Serie` (ojo con éste)

> **Importante**: Tener `Series` que contengan diversos tipos de datos es una **muy mala** práctica. Lo recomendable es siempre tener homogeneidad de tipos de dato en cada `Serie` que tengamos. De todas maneras, se encontrarán por ahí algunos conjuntos de datos que contienen `Series` con tipos de datos diversos. Es por eso que cuando nos topemos con un tipo de dato `obj` tenemos que ser cuidadosos y no asumir automáticamente que el tipo de dato incluido son `strings`.

Podemos crear `Series` con un índice personalizado, por ejemplo, en lugar de iniciar con 0, podemos iniciar con 1 como el mundo manda, para ello se usa la forma:

    pd.Series(-lista-, index=-lista de índices-)

Vamos a crear una Serie usando la lista `[4, 7, 9, 8]` y como índices la lista `[1, 2, 3, 4]` y el resultado lo guardamos en la variable `serie_2`:

In [5]:
...

serie_2

1    4
2    7
3    9
4    8
dtype: int64

O podemos usar la función `range(a, b)` que nos permite crear series de números enteros iniciando en `a` y terminando en `b-1`, así que la misma `serie_2` se puede usar de la siguiente forma:

In [6]:
...

serie_2

1    4
2    7
3    9
4    8
dtype: int64

Incluso podemos usar `strings` en el índice, por ejmplo vamor a crear una serie en con los números `[5, 8, 7, 2]` y con índices `["a", "b", "c", "d"]` y el resultado asignarlos a la variable `serie_3`:

In [7]:
...

serie_3

a    5
b    8
c    7
d    2
dtype: int64

Debido a su similitud, podemos incluso crear `Series` usando `diccionarios` y para ello se usa la forma:

    pd.Series(-diccionario-)
    
aquí las llaves pasan a ser nuestro índice.

Vamos a usar el siguiente diccionario para crear una nueva Serie y asignarla a la variable `series_4`:

In [8]:
datos = {
    "Juan": 45,
    "Pepe": 56,
    "Alfonsina": 12,
    "Jenny": 49,
    "Marco P.": 12
}

In [9]:
...

serie_4

Juan         45
Pepe         56
Alfonsina    12
Jenny        49
Marco P.     12
dtype: int64

Al igual que en las listas, podemos acceder a nuestros datos usando los corchetes cuadrados (`[indice]`) y coloando el índice entre ellos, por ejemplo para obtener el primer elemento de la `serie_1` usamos el índice `0`:

In [14]:
...

8

Para obtener el último, no es posible usar `-1` como el caso de listas, así que en su caso se pueden contar los números de elementos con la función `len()` y considerando que en la `serie_1` los índices van de `0` a `4` entonces a la longitud hay que restar uno quedando el índice como `len(serie_1) - 1`, así podemos obtener el último elemento:

In [None]:
...

Sin embargo, las series tienen su propia forma de acceder a los elementos, y es por medio de la propiedad `loc[-indice-]`, por ejemplo para obtener el último elemento de la `serie_2` sería:

In [16]:
...

8

Nota, que no ha sido necesario restar `1` ¿porqué?

También podemos usar también `strings`, vamos a obtener el primero elemento de la `serie_3`:

In [17]:
...

5

Y si queremos el último elemento de la `serie_4`:

In [18]:
...

12

Otra forma:

In [21]:
serie_4.loc[serie_4.index[-1]]

12

¿porqué se puede hacer lo anterior?

¡Vayamos a nuestro primer Reto!