<a href="https://colab.research.google.com/github/fermuba/Procesamiento-de-Datos/blob/main/S6/Retos/Reto_4_concat_solucion.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Reto 4: Concatenación de `Series` y `DataFrames`

### 1. Objetivos:
    - Practicar la concatenación de `Series` y `DataFrames` usando `np.concat` y `pandas.DataFrame.append`

---
    
### 2. Desarrollo:

### a) Sumando ventas por producto y por mes

Eres el analista financiero de EyePoker Inc. Tienes 12 listas con datos. Cada lista contiene la cantidad de unidades vendidas por producto en un mes determinado.

Tienes también una lista con los nombres de los productos que ofrece la empresa.

Tanto las listas de ventas como la lista de nombres están ordenadas igual. Eso quiere decir que cada índice de cada lista pertenece a datos del mismo producto (es decir, `ventas_enero[3]`, `ventas_febrero[3]`, `ventas_marzo[3]`, `ventas_abril[3]`, etc, todas pertenecen al producto en `productos[3]`).

Tu reto es el siguiente:

1. Convierte las listas es `Series` de pandas.
2. Concatena horizontalmente las `Series` de ventas de manera que cada fila del `DataFrame` resultante corresponda al mismo producto.
3. En alguno de los pasos anteriores, agrega los nombres de los productos como índice.
4. Crea una nueva columna llamada `total_por_producto` que contenga la suma horizontal de las ventas mensuales de cada producto (es decir, un resumen de las ventas del año por producto).
5. (Opcional) Agrega también una fila hasta el final que tenga como índice `total_por_mes` que contenga la suma vertical de las ventas de cada mes (la última celda va a ser la suma total de las ventas de todos los productos en todo el año).

> **Tip**: Si quieres hacer el paso número 5, busca en Google el método `pandas.DataFrame.append`.

In [1]:
# Realiza aquí los imports que necesites
import pandas as pd

In [2]:
productos = ["Pokemaster", "Cegatron", "Pikame Mucho", "Lazarillo de Tormes", "Stevie Wonder", "Needle", "El AyMeDuele", "El Desretinador", "Sacamel Ojocles", "Desojado", "Maribel Buenas Noches", "Cíclope", "El Cuatro Ojos"]

ventas_enero = [3, 5, 4, 45, 2, 32, 7, 89, 7, 6, 24, 51, 12]
ventas_febrero = [7, 9, 0, 76, 4, 34, 1, 2, 34, 67, 8, 9, 0]
ventas_marzo = [1, 1, 3, 56, 7, 98, 2, 34, 1, 0, 23, 1, 12]
ventas_abril = [2, 34, 2, 1, 56, 78, 23, 3, 4, 23, 1, 78, 9]
ventas_mayo = [1, 2, 32, 4, 32, 1, 45, 67, 87, 8, 9, 45, 2]
ventas_junio = [1, 2, 32, 1, 45, 78, 8, 90, 0, 98, 7, 46, 15]
ventas_julio = [15, 62, 37, 85, 5, 8, 9, 0, 75, 36, 52, 15, 12]
ventas_agosto = [1, 2, 32, 4, 35, 6, 78, 43, 45, 12, 34, 67, 89]
ventas_septiembre = [9, 87, 7, 6, 56, 7, 0, 34, 23, 1, 2, 51, 35]
ventas_octubre = [16, 62, 75, 58, 97, 6, 9, 0, 98, 78, 2, 3, 4]
ventas_noviembre = [1, 3, 2, 1, 4, 5, 2, 4, 7, 8, 4, 3, 5]
ventas_diciembre = [7, 9, 0, 6, 3, 7, 3, 85, 9, 7, 8, 0, 9]

In [3]:
## Tu código va aquí
# Punto 1
serie_enero = pd.Series(ventas_enero)
serie_febrero = pd.Series(ventas_febrero)
serie_marzo = pd.Series(ventas_marzo)
serie_abril = pd.Series(ventas_abril)
serie_mayo = pd.Series(ventas_mayo)
serie_junio = pd.Series(ventas_junio)
serie_julio = pd.Series(ventas_julio)
serie_agosto = pd.Series(ventas_agosto)
serie_septiembre = pd.Series(ventas_septiembre)
serie_octubre = pd.Series(ventas_octubre)
serie_noviembre = pd.Series(ventas_noviembre)
serie_diciembre = pd.Series(ventas_diciembre)

# Punto 2
lista_series = [serie_enero,
                serie_febrero,
                serie_marzo,
                serie_abril,
                serie_mayo,
                serie_junio,
                serie_julio,
                serie_agosto,
                serie_septiembre,
                serie_octubre,
                serie_noviembre,
                serie_diciembre]

indice = ['enero',
          'febrero',
          'marzo',
          'abril',
          'mayo',
          'junio',
          'julio',
          'agosto',
          'septiembre',
          'octubre',
          'noviembre',
          'diciembre']

df_concat = pd.concat(lista_series, axis=1, keys= indice)

# Punto 3
df_concat.index = productos

# Punto 4
df_concat['total_por_producto'] = df_concat.sum(axis=1)

# Punto 5
# Lo agrego con loc para que tengan otra opcion mas aparte de concat
df_concat.loc['total_por_mes'] = df_concat.sum(axis=0)

df_concat
# Asigna tu resultado final a esta variable
ventas_dataframe = df_concat    # Asigno el dataframe a otro nombre no es una copia

ventas_dataframe

Unnamed: 0,enero,febrero,marzo,abril,mayo,junio,julio,agosto,septiembre,octubre,noviembre,diciembre,total_por_producto
Pokemaster,3,7,1,2,1,1,15,1,9,16,1,7,64
Cegatron,5,9,1,34,2,2,62,2,87,62,3,9,278
Pikame Mucho,4,0,3,2,32,32,37,32,7,75,2,0,226
Lazarillo de Tormes,45,76,56,1,4,1,85,4,6,58,1,6,343
Stevie Wonder,2,4,7,56,32,45,5,35,56,97,4,3,346
Needle,32,34,98,78,1,78,8,6,7,6,5,7,360
El AyMeDuele,7,1,2,23,45,8,9,78,0,9,2,3,187
El Desretinador,89,2,34,3,67,90,0,43,34,0,4,85,451
Sacamel Ojocles,7,34,1,4,87,0,75,45,23,98,7,9,390
Desojado,6,67,0,23,8,98,36,12,1,78,8,7,344


Pídele a tu experta la función de verificación `revisar_dataframe` (encontrada en el archivo `helpers.py` de la carpeta donde se encuentra este Reto), pégala debajo y corre la celda para verificar tu resultado:

In [None]:
# Pega aquí la función de verificación


# Llamada a la función de verificación
revisar_dataframe(ventas_dataframe, productos, ventas_enero, ventas_febrero, ventas_marzo, ventas_abril, ventas_mayo,
                      ventas_junio, ventas_julio, ventas_agosto, ventas_septiembre,
                      ventas_octubre, ventas_noviembre, ventas_diciembre)


<details><summary>Solución</summary>

```python
def concatenar_listas_horizontalmente(lista_de_listas, indice):
    
    meses = ['enero', 'febrero', 'marzo', 'abril', 'mayo', 'junio', 'julio', 'agosto', 'septiembre', 'octubre', 'noviembre',
            'diciembre']
    
    lista_de_series = []
    for i in range(len(lista_de_listas)):
        lista_de_series.append(pd.Series(lista_de_listas[i], index=indice, name=meses[i]))

    dataframe = pd.concat(lista_de_series, axis=1)
    return dataframe
    
ventas_dataframe = concatenar_listas_horizontalmente([ventas_enero, ventas_febrero, ventas_marzo, ventas_abril, ventas_mayo,
                                                      ventas_junio, ventas_julio, ventas_agosto, ventas_septiembre,
                                                      ventas_octubre, ventas_noviembre, ventas_diciembre], productos)
    
ventas_dataframe['total_por_producto'] = ventas_dataframe.sum(axis=1)
    
total_por_mes = ventas_dataframe.sum(axis=0)

total_por_mes.name = 'total_por_mes'
ventas_dataframe = ventas_dataframe.append(total_por_mes)
```
    
</details>