# DataFrame IV

Los objetivos de aprendizaje son:

1. Joining DataFrames
    + pd.concat()
    + merge()
2. Exportar Datos
    + CSV
    + Excel     


## 1. Joining DataFrames

En ocasiones nos interesa juntar los valores de dos `DataFrames`, Tenemos dos opciones.

### pd.concat()

Tal y como su nombre nos lo indica, la función [`pd.concat()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.concat.html) sirve para concatenar dos objetos tales como `Series` o `DataFrame`. Sus parámetros más importantes son:

* `objs`: son los `DataFrame`s o `Series` que concatenaremos, los deberemos pasar en formato de lista.
* `axis`: Indicamos si la concatenación se hará mediante renglones o columnas.



In [None]:
import numpy as np
import pandas as pd

week1 = pd.read_csv("./Data/pandas/Restaurant - Week 1 Sales.csv")
week2 = pd.read_csv("./Data/pandas/Restaurant - Week 2 Sales.csv")
customers = pd.read_csv("./Data/pandas/Restaurant - Customers.csv")
foods = pd.read_csv("./Data/pandas/Restaurant - Foods.csv")

In [None]:
display(week1.head())
print("Ordenes de la primera semana: {}".format(week1.shape[0]))
display(week2.head())
print("Ordenes de la segunda semana: {}".format(week2.shape[0]))

In [None]:
weeks = pd.concat(
    objs = [week1, week2],
    axis = 0)

In [None]:
display(weeks.head())
print("Las ordenes totales son: {}".format(weeks.shape[0]))
display(weeks.tail())

¿Qué ha sucedido con los índices?

In [None]:
weeks.loc[1]

Se han duplicado. Para resolverlo conservando los valores originales de los índices, podemos añadir un segundo índice:

In [None]:
weeks =pd.concat([week1, week2], keys = ["w1", "w2"])
weeks

O reiniciar los índices una vez concatenados los datos:

In [None]:
weeks = pd.concat([week1, week2], ignore_index = True)
weeks

## Merge

El método [`.merge()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html) nos da la oportunidad de unir dos objetos de las clases `DataFrame` o `Series` respetando alguna condición de igualdad entre sus columnas. Para aquellos que han programado previamente en SQL, `.merge()` es el equivalente al `Left, right, inner, outer - join`.

Veamos un ejemplo:

El `DataFrame` week1 contiene órdenes por cliente. Tanto los clientes `Customer ID` como las comidas `Food ID` están en formato numérico.


In [None]:
week1.head()

In [None]:
week1.merge( 
    customers,
    how = "left",
    left_on = ["Customer ID"],
    right_on = ['ID']
)

## 2. Exportar Datos

Supongamos que queremos guardar en disco el siguiente `DataFrame`:

In [None]:
week1_customer = week1.merge( 
    customers[["ID", "First Name"]],
    how = "left",
    left_on = ["Customer ID"],
    right_on = ['ID']).drop(['ID', 'Customer ID'], axis = 1)

### csv 

Para guardarlo en formato csv se puede utilizar el método [`.to_csv()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_csv.html)

In [None]:
week1_customer.to_csv(
    path_or_buf = "./Data/pandas/week1_customer.csv")

Veamos cómo ha quedado:

In [None]:
pd.read_csv("./Data/pandas/week1_customer.csv").head()

In [None]:
week1_customer.to_csv(
    path_or_buf = "./Data/pandas/week1_customer_v2.csv", 
    index = False
)

In [None]:
pd.read_csv("./Data/pandas/week1_customer_v2.csv").head()

### excel

Excel es un formato muy amigable para casi todos los usuarios. Veamos cómo exportar un DataFrame en formato excel con el método [`.to_excel()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_excel.html) 

In [None]:
week1_customer.to_excel("./Data/pandas/week1_customer.xlsx", sheet_name = "week1", index = False)

In [None]:
pd.read_excel("./Data/pandas/week1_customer.xlsx").head()