# Exercício

1. **Gráfico de Linha:**
   Crie um gráfico de linha mostrando o crescimento populacional ao longo dos anos (populacao_brasileira.csv) ou variação de idades ao longo dos registros (german_credit_data.csv).

2. **Gráfico de Barras:**
   Represente a distribuição de frequência de variáveis qualitativas (categorias) (por exemplo, pessoas por sexo). 

1. **Gráfico de Pizza:**
   Mostre a distribuição percentual de variáveis categóricas (por exemplo, distribuição dos propósitos).

2. **Histograma:**
   Crie um histograma para analisar a distribuição de uma variável (por exemplo, idade) em um conjunto de dados.

3. **Gráfico de Dispersão:**
   Visualize a relação entre 2 variáveis (por exemplo idade vs. valor do crédito) usando um gráfico de dispersão.

4. **Gráfico de Boxplot:**
   Crie um boxplot para analisar a distribuição de variáveis (por exemplo, distribuição de idade por sexo).

5. **Mapa de Calor (Heatmap):**
   Crie um mapa de calor para visualizar a correlação entre diferentes variáveis em um conjunto de dados.

In [1]:
import pandas as pd
import plotly.express as px
import matplotlib.pyplot as plt
import plotly.graph_objects as go

In [2]:
data = pd.read_csv('../../Datasets/german_credit_data.csv')
data

Unnamed: 0.1,Unnamed: 0,Age,Sex,Job,Housing,Saving accounts,Checking account,Credit amount,Duration,Purpose
0,0,67,male,2,own,,little,1169,6,radio/TV
1,1,22,female,2,own,little,moderate,5951,48,radio/TV
2,2,49,male,1,own,little,,2096,12,education
3,3,45,male,2,free,little,little,7882,42,furniture/equipment
4,4,53,male,2,free,little,little,4870,24,car
...,...,...,...,...,...,...,...,...,...,...
995,995,31,female,1,own,little,,1736,12,furniture/equipment
996,996,40,male,3,own,little,little,3857,30,car
997,997,38,male,2,own,little,,804,12,radio/TV
998,998,23,male,2,free,little,little,1845,45,radio/TV


In [3]:
# Gráfico de Linha: Variação de idades ao longo dos registros
fig = px.line(data, x=data.index, y='Age', title='Variação de Idades')
fig.show()

In [4]:
# Questão 1: Gráfico de Linha - Variação de Idades
fig1 = go.Figure()
fig1.add_trace(go.Scatter(x=data.index, y=data['Age'], mode='lines'))
fig1.update_layout(title='Variação de Idades', xaxis_title='Registro', yaxis_title='Idade')
fig1.show()


In [5]:
# Gráfico de Barras: Contagem de Pessoas por Sexo
fig = px.bar(data, x='Sex', title='Contagem de Pessoas por Sexo', width=800, height=400)
fig.show()

In [6]:
data['Sex'].value_counts()

male      690
female    310
Name: Sex, dtype: int64

In [7]:
# Questão 2: Gráfico de Barras - Contagem de Pessoas por Sexo
fig2 = go.Figure()
fig2.add_trace(go.Bar(x=data['Sex'].value_counts().index, y=data['Sex'].value_counts().values))
fig2.update_layout(title='Contagem de Pessoas por Sexo', xaxis_title='Sexo', yaxis_title='Contagem', width=800, height=400)
fig2.show()

In [8]:
# Gráfico de Pizza: Distribuição de Pessoas por propósito
fig = px.pie(data, names='Purpose', title='Distribuição dos propósitos', hole=0.3)
fig.show()

In [9]:
# Questão 3: Gráfico de Pizza - Distribuição de Pessoas por propósito
fig3 = go.Figure()
fig3.add_trace(go.Pie(labels=data['Purpose'].value_counts().index,
                      values=data['Purpose'].value_counts().values,
                      hole=0.3))
fig3.update_layout(title='Distribuição dos propósitos')
fig3.show()

In [10]:
# Histograma: Distribuição de Idades
fig = px.histogram(data, x='Age', nbins=30, title='Distribuição de Idades', width=800, height=400)
fig.show()

In [11]:
# Questão 4: Histograma - Distribuição de Idades
fig4 = go.Figure()
fig4.add_trace(go.Histogram(x=data['Age'], nbinsx=30))
fig4.update_layout(title='Distribuição de Idades', xaxis_title='Idade', yaxis_title='Frequência', width=800, height=400)
fig4.show()

In [12]:
# Gráfico de Dispersão: Idade vs. Valor do Crédito
fig = px.scatter(data, x='Age', y='Credit amount', title='Gráfico de Dispersão: Idade vs. Valor do Crédito')
fig.show()

In [13]:
# Questão 5: Gráfico de Dispersão - Idade vs. Valor do Crédito
fig5 = go.Figure()
fig5.add_trace(go.Scatter(x=data['Age'], y=data['Credit amount'], mode='markers'))
fig5.update_layout(title='Gráfico de Dispersão: Idade vs. Valor do Crédito',
                   xaxis_title='Idade', yaxis_title='Valor do Crédito')
fig5.show()

In [14]:
# Gráfico de Boxplot: Distribuição de Idade por Sexo
fig = px.box(data, x='Sex', y='Age', title='Comparação de Idade por Sexo')
fig.show()

In [15]:
# Questão 6: Gráfico de Boxplot - Comparação de Idade por Sexo
fig6 = go.Figure()
fig6.add_trace(go.Box(x=data['Sex'], y=data['Age']))#, boxpoints='all'))
fig6.update_layout(title='Comparação de Idade por Sexo', xaxis_title='Sexo', yaxis_title='Idade')
fig6.show()

In [22]:
# Calcular a matriz de correlação
correlation_matrix = data.corr()

# Gráfico de Mapa de Calor (Heatmap)
fig = px.imshow(correlation_matrix.values, x=correlation_matrix.index, y=correlation_matrix.columns, 
                color_continuous_scale='RdBu_r', title='Mapa de Calor: Matriz de Correlação')#, text_auto = True)


# Adicionar os valores de correlação nas células
for i in range(len(correlation_matrix.index)):
    for j in range(len(correlation_matrix.columns)):
        fig.add_annotation(text=f'{correlation_matrix.iloc[i, j]:.2f}',
                           x=correlation_matrix.columns[j], y=correlation_matrix.index[i],
                           showarrow=False, font=dict(color="white"))

fig.show()





In [23]:
# Questão 7: Mapa de Calor (Heatmap) - Matriz de Correlação
correlation_matrix = data.corr()
fig7 = go.Figure(data=go.Heatmap(z=correlation_matrix.values,
                                  x=correlation_matrix.columns,
                                  y=correlation_matrix.index,
                                  colorscale='RdBu_r'))

# Adicionar os valores de correlação nas células
for i in range(len(correlation_matrix.index)):
    for j in range(len(correlation_matrix.columns)):
        fig7.add_annotation(text=f'{correlation_matrix.iloc[i, j]:.2f}',
                           x=correlation_matrix.columns[j], y=correlation_matrix.index[i],
                           showarrow=False, font=dict(color="white"))
        
fig7.update_layout(title='Mapa de Calor: Matriz de Correlação')

fig7.show()



