## Ejemplo 2: Series

### 1. Objetivos:
    - Entender qué son las `Series`
    - Aprender a crear `Series` de pandas
    - Aprender los métodos básicos de indexación de las `Series`
 
---
    
### 2. Desarrollo:

Lo primero es realizar la importación del módulo Pandas usando `import nombre_largo as nombre_corto`:

In [1]:
# importa el módulo pandas
import pandas as pd

Las Series son secuencias ordenadas de unidimensionales que pueden contener diferentes tipos de valores, en esto se parecen a las listas. De hecho, podemos crear Series usando listas con la función `pd.Series(-lista-)`. Nota: `-lista-` representa a una lista en Python.

In [2]:
serie_1 = pd.Series([1,2,3,4,5])  # Crea una serie de 5 número enteros
serie_1

0    1
1    2
2    3
3    4
4    5
dtype: int64

Una gran diferencia que tienen con las `listas` es que cada elemento en una `Serie` tiene un índice asociado que no necesariamente es una secuencia de enteros como en las `listas`. En este aspecto, nuestras `Series` se parecen a los `diccionarios`:

La columna de la izquierda es nuestro índice, la columna de la derecha son los datos almacenados en la `Serie`. El texto en la parte inferior es el tipo de dato que tenemos en nuestra `Serie`.

Los tipos de datos más comunes que podemos encontrar son: 

1. `int64`: Equivalente a `int`
2. `float64`: Equivalente a `float`
3. `bool`: Equivalente a `bool` (duh)
4. `object`: Equivalente a `str`, o indica que hay una mezcla de tipos de datos numéricos y no-numéricos en la `Serie`

> **Importante**: Tener `Series` que contengan diversos tipos de datos es una **muy mala** práctica. Lo recomendable es siempre tener homogeneidad de tipos de dato en cada `Serie` que tengamos. De todas maneras, se encontrarán por ahí algunos conjuntos de datos que contienen `Series` con tipos de datos diversos. Es por eso que cuando nos topemos con un tipo de dato `obj` tenemos que ser cuidadosos y no asumir automáticamente que el tipo de dato incluido son `strings`.

Podemos crear `Series` con un índice customizado, por ejemplo crea una lista indicando las ventas totales para los años 2007, 2008, 2009 y 2010 usando la instrucción:

`pd.Series(-lista-, index=-lista-)`

In [3]:
serie_2 = pd.Series([1000, 1500, 2000, 2500], index=[2007, 2008, 2009, 2010])
serie_2

2007    1000
2008    1500
2009    2000
2010    2500
dtype: int64

Ahora crea una serie para la ventas totales para cada cuatrimestre del año 2010 (Q1-2010, Q2-2010, etc):

In [4]:
serie_3 = pd.Series([1000,1500,200,2500], index = ['Q1-2010', 'Q2-2010', 'Q3-2010', 'Q4-2010'])
serie_3

Q1-2010    1000
Q2-2010    1500
Q3-2010     200
Q4-2010    2500
dtype: int64

Debido a su similitud, podemos incluso crear `Series` usando `diccionarios` usando la instrucción:

`pd.Series(-diccionario-)`

In [5]:
datos = {
    "Q1-2010": 1000000,
    "Q2-2010": 1200000,
    "Q3-2010": 1250000,
    "Q4-2010": 1300000
}
serie_4 = pd.Series(datos)
serie_4

Q1-2010    1000000
Q2-2010    1200000
Q3-2010    1250000
Q4-2010    1300000
dtype: int64

Al igual que en las listas, podemos acceder a nuestros datos usando el `operador de indexación`. La diferencia es que en una `Serie` tenemos que incluir el operador `loc` para indicarle a la `Serie` que estamos accesándola usando los nombres de los índices:

Obten el primer y último elemento de las `serie_1` y `serie_2` usando índices como en el caso de listas `lista_1[0]` y usando el atributo `loc[0]`:

In [6]:
serie_1[0] # primer elemento

1

In [7]:
serie_1.loc[0]  # primer elemento

1

In [10]:
serie_2[2007]  # primer elemento

1000

In [11]:
serie_2.loc[2007]  # primer elemento

1000

Obten el valor del 2o y 3o cuatrimestre de `serie_3` usando listas de índices de la forma `serie.loc[-lista de índices-]`:

In [12]:
serie_3.loc[['Q2-2010','Q3-2010']]

Q2-2010    1500
Q3-2010     200
dtype: int64

También podemos indicar rangos de índices haciendo uso de las rebanadas o slides de listas de la forma `serie.loc[-índice inferior-:-índice superior-]`:

In [13]:
serie_3.loc['Q1-2010':'Q3-2010']

Q1-2010    1000
Q2-2010    1500
Q3-2010     200
dtype: int64

¡Vayamos a nuestro primer Reto!

---
---
## Reto 1: Series

### 1. Objetivos:
    - Practicar la creación de `Series` y la indexación básica de éstas
 
---
    
### 2. Desarrollo:

In [14]:
# Realiza aquí los imports que necesites
# para que tu código funcione correctamente
import pandas as pd

#### a) Creación de `Series`

A continuación tenemos unas variables que contienen los nombres de los ejecutivos más importantes de nuestra ya conocida EyePoker Inc. Debajo de eso hay una variable que no ha sido asignada aún:

In [18]:
ejecutivo_1 = 'Marco P.'
ejecutivo_2 = 'Jenny'
ejecutivo_3 = 'Britney Baby'
ejecutivo_4 = 'Pepe Guardabosques'
ejecutivo_5 = 'Lombardo El Destructor'


sueldos = pd.Series([135450,146301,115445,124514,153461], index=[ejecutivo_1, ejecutivo_2, ejecutivo_3, ejecutivo_4, ejecutivo_5])

Tu tarea es crear una `Serie` de `pandas` y asignarla a la variable `sueldos`. La información que hay dentro de esta variable son (oh, sorpresa) los sueldos de dichos ejecutivos.

Los valores de la `Serie` serán los sueldos, mientras que el índice de la `Serie` serán los nombres de los ejecutivos.

Crea una `Serie` y asígnala a `sueldos` de manera que el código que tenemos debajo funcione correctamente:

In [19]:
print('== Sueldos de los principales ejecutivos de EyePoker Inc. ==\n')

print(f'{("Ejecutivo"):25} | {("Sueldo")}')
print('----------------------------------------')
print(f'{ejecutivo_1:25} | ${(sueldos.loc[ejecutivo_1])} MXN')
print(f'{ejecutivo_2:25} | ${(sueldos.loc[ejecutivo_2])} MXN')
print(f'{ejecutivo_3:25} | ${(sueldos.loc[ejecutivo_3])} MXN')
print(f'{ejecutivo_4:25} | ${(sueldos.loc[ejecutivo_4])} MXN')
print(f'{ejecutivo_5:25} | ${(sueldos.loc[ejecutivo_5])} MXN')

== Sueldos de los principales ejecutivos de EyePoker Inc. ==

Ejecutivo                 | Sueldo
----------------------------------------
Marco P.                  | $135450 MXN
Jenny                     | $146301 MXN
Britney Baby              | $115445 MXN
Pepe Guardabosques        | $124514 MXN
Lombardo El Destructor    | $153461 MXN


#### b) Indexación de `Series`

Tenemos una `Serie` que contiene los gastos mensuales totales (en MXN) de distintas divisiones de EyePoker Inc. Tú eres el Contador Oficial y tienes que obtener subconjuntos de datos que sirvan para agregar los gastos totales de diferentes combinaciones de divisiones.

Los datos son los siguientes:

In [20]:
import pandas as pd

gastos_mensuales = {
    'A': 15000,
    'B': 200000,
    'C': 3250000,
    'D': 120000,
    'E': 135000,
    'F': 55000,
    'G': 100000,
    'H': 25000
}

gastos_serie = pd.Series(gastos_mensuales)

In [21]:
gastos_serie

A      15000
B     200000
C    3250000
D     120000
E     135000
F      55000
G     100000
H      25000
dtype: int64

El índice es el nombre de la división y los valores son los gastos mensuales en MXN.

Indexando la serie `gastos_serie` extrae las combinaciones de divisiones que se indican debajo para poder hacer los cálculos necesarios. Modifica el código según sea necesario.

In [23]:
# Los gastos de la división 'D' y 'G'
gastos_D_G = gastos_serie.loc["D":"G"]
print(sum(gastos_D_G))

# Los gastos de la división 'B', 'F' y 'H'
gastos_B_F_H = gastos_serie.loc[['B','F','H']]
print(sum(gastos_B_F_H))

# Los gastos desde la primera división hasta la división 'E'
gastos_principio_a_E = gastos_serie.loc['A':'E']
print(sum(gastos_principio_a_E))

# Los gastos desde la división 'D' hasta la 'G'
gastos_D_a_G = gastos_serie.loc['D':'G']
print(sum(gastos_D_a_G))

410000
280000
3720000
410000
