# Junções

In [1]:
# Biblioteca:
import pandas as pd

# Dados
precos_cafe_18022024 = pd.read_csv('precos_cafe_dia18.csv')
precos_cafe_19022024 = pd.read_csv('precos_cafe_dia19.csv')

> Dia 18-02-204:

In [2]:
precos_cafe_18022024

Unnamed: 0,Data,Tipo_cafe,Preco_loja_A,Preco_loja_B,Preco_loja_C
0,2024-02-18,Café Tradicional,5.99,6.49,5.79
1,2024-02-18,Café Espresso,3.49,3.99,3.29
2,2024-02-18,Café Descafeinado,6.99,7.49,6.79


> Dia 19-02-204:

In [3]:
precos_cafe_19022024

Unnamed: 0,Data,Tipo_cafe,Preco_loja_A,Preco_loja_B,Preco_loja_C
0,2024-02-19,Café Tradicional,5.89,6.59,5.69
1,2024-02-19,Café Espresso,3.59,4.09,3.39
2,2024-02-19,Café Descafeinado,6.79,7.59,6.89


### **1. Concatenação de dataframes**

```python
pd.concat([df_1, df_2], axis=EIXO, ignore_index=True):
```

In [4]:
# concatenação:
preco_cafes = pd.concat(
    [precos_cafe_18022024, precos_cafe_19022024],
    axis=0,
    ignore_index=True
)

# resultado:
preco_cafes

Unnamed: 0,Data,Tipo_cafe,Preco_loja_A,Preco_loja_B,Preco_loja_C
0,2024-02-18,Café Tradicional,5.99,6.49,5.79
1,2024-02-18,Café Espresso,3.49,3.99,3.29
2,2024-02-18,Café Descafeinado,6.99,7.49,6.79
3,2024-02-19,Café Tradicional,5.89,6.59,5.69
4,2024-02-19,Café Espresso,3.59,4.09,3.39
5,2024-02-19,Café Descafeinado,6.79,7.59,6.89


### **2. Junções com o método merge**

In [5]:
# DataFrame de funcionários:
funcionarios = pd.DataFrame({
    'ID_funcionario': [1, 2, 3, 4, 5],
    'Nome': ['João', 'Maria', 'Pedro', 'Ana', 'Paula'],
    'Departamento_ID': [101, 102, 101, 103, 102]
})

# DataFrame de departamentos:
departamentos = pd.DataFrame({
    'ID_depto': [101, 102, 103, 104],
    'Departamento': ['Vendas', 'Marketing', 'TI', 'RH']
})

In [6]:
funcionarios

Unnamed: 0,ID_funcionario,Nome,Departamento_ID
0,1,João,101
1,2,Maria,102
2,3,Pedro,101
3,4,Ana,103
4,5,Paula,102


In [7]:
departamentos

Unnamed: 0,ID_depto,Departamento
0,101,Vendas
1,102,Marketing
2,103,TI
3,104,RH


> Junção **inner join**

In [9]:
inner_join = pd.merge(
    funcionarios,
    departamentos,
    how='inner',
    left_on='Departamento_ID',
    right_on='ID_depto'
)

inner_join

Unnamed: 0,ID_funcionario,Nome,Departamento_ID,ID_depto,Departamento
0,1,João,101,101,Vendas
1,3,Pedro,101,101,Vendas
2,2,Maria,102,102,Marketing
3,5,Paula,102,102,Marketing
4,4,Ana,103,103,TI


> Junção **left join**/**right join**

In [10]:
left_join = pd.merge(
    departamentos,
    funcionarios,
    how='left',
    left_on='ID_depto',
    right_on='Departamento_ID'
)

left_join

Unnamed: 0,ID_depto,Departamento,ID_funcionario,Nome,Departamento_ID
0,101,Vendas,1.0,João,101.0
1,101,Vendas,3.0,Pedro,101.0
2,102,Marketing,2.0,Maria,102.0
3,102,Marketing,5.0,Paula,102.0
4,103,TI,4.0,Ana,103.0
5,104,RH,,,


> Junção **full outer join**

In [11]:
# Full Outer Join: retorna todos os registros quando há uma correspondência em um dos dataframes
full_outer_join = pd.merge(funcionarios, departamentos, how='outer', left_on='Departamento_ID', right_on='ID_depto')
full_outer_join

Unnamed: 0,ID_funcionario,Nome,Departamento_ID,ID_depto,Departamento
0,1.0,João,101.0,101,Vendas
1,3.0,Pedro,101.0,101,Vendas
2,2.0,Maria,102.0,102,Marketing
3,5.0,Paula,102.0,102,Marketing
4,4.0,Ana,103.0,103,TI
5,,,,104,RH


---

#### **Dica**
> É possível fazer a junção de mais de 2 dataframes que estejam relacionados entre si. Para isso, cada junção é salva em um novo dataframe (ou sobrescrita) até que se tenha o dataframe final.

```python
# Realizando a primeira junção entre dois dataframe:
juncao_temporaria = pd.merge(df_A, df_B, how='inner', on='ID')

# Realizando a segunda junção entre o resultado da primeira junção e um terceiro dataframe:
juncao_final = pd.merge(juncao_temporaria, df_C, how='inner', on='ID')

# Exibindo o DataFrame resultante da junção interna (inner join):
juncao_final
```

> Vejamos um exemplo:

In [23]:
# Dados dos cargos e seus respectivos IDs
cargos = pd.DataFrame({
    'ID_cargo': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],
    'Cargo': [
        'Gerente de Vendas', 'Consultor de Vendas',
        'Desenvolvedor', 'Analista de Marketing Digital',
        'Recrutador',  'Estrategista de Mídias Sociais',
        'Analista de Dados', 'Analista de Banco de Dados',
        'Engenheiro de Dados', 'Cientista de Dados', 'CEO'
    ]
})

cargos

Unnamed: 0,ID_cargo,Cargo
0,1,Gerente de Vendas
1,2,Consultor de Vendas
2,3,Desenvolvedor
3,4,Analista de Marketing Digital
4,5,Recrutador
5,6,Estrategista de Mídias Sociais
6,7,Analista de Dados
7,8,Analista de Banco de Dados
8,9,Engenheiro de Dados
9,10,Cientista de Dados


In [24]:
# Adicionando um ID a cada cargo:
funcionarios['ID_cargo'] = 2, 4, 1, 7, 6
funcionarios

Unnamed: 0,ID_funcionario,Nome,Departamento_ID,ID_cargo
0,1,João,101,2
1,2,Maria,102,4
2,3,Pedro,101,1
3,4,Ana,103,7
4,5,Paula,102,6


In [27]:
juncao_temporaria = pd.merge(
    funcionarios,
    departamentos,
    how='inner',
    left_on='Departamento_ID',
    right_on='ID_depto'
)

juncao_final = pd.merge(
    juncao_temporaria,
    cargos,
    how='inner',
    on='ID_cargo'
)

juncao_final.drop(['Departamento_ID',	'ID_cargo',	'ID_depto'], axis=1, inplace=True)
juncao_final

Unnamed: 0,ID_funcionario,Nome,Departamento,Cargo
0,1,João,Vendas,Consultor de Vendas
1,3,Pedro,Vendas,Gerente de Vendas
2,2,Maria,Marketing,Analista de Marketing Digital
3,5,Paula,Marketing,Estrategista de Mídias Sociais
4,4,Ana,TI,Analista de Dados
