# Etapa 1 - Projeto Desenvolvedor 🚀

### Introdução
**Integrantes do projeto**: Aline Santos, Luana Tavares, Gustavo Luca e Marcus Eduardo Resende. 

O objetivo deste trabalho é proporcionar aos participantes a vivência de diversos desafios enfrentados por cientistas de dados em sua atuação profissional.Para isso, estão disponíveis dois conjuntos de dados: **dados de criminalidade do estado de São Paulo (SPSafe) e dados demográficos dos municípios brasileiros (BrStats)**.

Cada conjunto de dados é acompanhado por um artigo que descreve detalhadamente o processo de geração e organização das informações. A leitura atenta desses artigos é essencial para o bom desenvolvimento do projeto e deve ser realizada por todos os membros do grupo. 

A escolha do conjunto de dados a ser utilizado está  vinculada à turma prática no qual o grupo está matriculado. Como pertecemos à **turma prática P1**, utilizaremos o conjunto de dados **BrStats**.

O artigo de referência para esse conjunto de dados pode ser acessado por meio do seguinte link: https://sol.sbc.org.br/index.php/dsw/article/view/25506

### Descrição Etapa 1
Nesta etapa, o grupo irá fazer uma primeira análise dos dados, para identificar os atributos existentes, e elaborar uma lista com pelo menos 10 perguntas que pretende responder com o trabalho. Também devem ser feitos tratamentos dos dados em termos de formatação, enriquecimento com novos atributos externos, tratamento de ausências, dentre outros. Essa etapa envolve entender os atributos e objetos dos dados, o tipo e o domínio de cada atributo, verificar e identificar possíveis ruídos ou informações ausentes, criar novos atributos se necessário, formatar valores, juntar conjuntos de dados, dentre outras atividades.

### Divisão de Tarefas
O trabalho foi dividido entre os quatro integrantes do grupo, com as seguintes responsabilidades:   
- Retirada de 7 colunas da tabela: **Aline e Marcus** foram responsáveis por essa tarefa.   
- Conversão de moedas: **Luana e Aline** ficou encarregada dessa etapa.   
- Conversão de unidades nas colunas: **Gustavo** foi o responsável por realizar as conversões de unidades.   
- Retirada das linhas da tabela: **Marcus** do grupo contribuíram com ideias e conhecimentos para essa parte do trabalho.   
- As perguntas de pesquisa foram decididas e discutidas em uma reunião pelo Google Meet, onde todos os integrantes participaram ativamente. O tratamento dos dados também foi    discutido e definido durante essa reunião.O relatório de participação da reunião no Google Meet pode ser acessado através deste link:   
 https://docs.google.com/spreadsheets/d/1nYTdsyvY9Kk3X73YN4Af45I4sEfED_4RbvQ6LWWLkZQ/edit?usp=sharing   
- Todos os integrantes leram os artigos relacionados ao projeto e analisaram os dados disponíveis para garantir uma abordagem comum e fundamentada. A comunicação entre os  integrantes foi realizada por meio de um grupo criado no WhatsApp, onde discutimos o andamento das tarefas e tiramos dúvidas em tempo real.
-As aulas em laboratório foram fundamentais para o andamento da primeira etapa do projeto. Os integrantes puderam compartilhar ideias, conhecimentos e opiniões para melhor análise dos dados do DataSet. 
A documentação em Markdown foi realizada à medida que os integrantes completavam suas respectivas tarefas. Para os itens que não faziam parte da tarefa de um integrante específico, a **Aline** ficou responsável pela elaboração.

* Em relação ao GitHub, optamos por organizar o repositório em duas branches:   
dev: utilizada para armazenar versões intermediárias, ainda em desenvolvimento, das etapas.   
main: destinada a armazenar as versões finais de cada etapa, sendo a versão atual a da Etapa 1.  


### 🛠️ Preparação do Ambiente
Nesta seção, serão apresentados os comandos necessários para preparar o ambiente de análise. Isso inclui a importação das bibliotecas utilizadas, o carregamento do conjunto de dados e sua visualização inicial.


#### 📚 Bibliotecas Necessárias

In [1]:
import pandas as pd
import numpy as np
import os

#### 📥 Importação dos Dados
Utilizamos o seguinte comando para carregar a tabela de dados localizada no mesmo diretório do projeto.O parâmetro sep=";" é utilizado para informar que os dados no arquivo estão separados por ponto e vírgula (;).Dessa forma, o pandas consegue interpretar corretamente as colunas e montar a tabela (DataFrame) com os dados organizados.

In [2]:
# Cria a pasta "Pibs" se ela ainda não existir
os.makedirs('dataFrame', exist_ok=True)
df = pd.read_csv("dataFrame/BrStats.csv", sep = ";")

  df = pd.read_csv("dataFrame/BrStats.csv", sep = ";")


#### 👀 Visualização Inicial dos Dados
Para confirmar que a base de dados foi importada corretamente, exibimos as 5 primeiras linhas utilizando o comando df.head(), que permite uma visualização rápida e concisa do conteúdo. Caso seja necessário consultar o dataframe completo, ele está disponível na pasta do projeto com o nome "BrStats.csv".

In [3]:
pd.set_option('display.max_colwidth', 50)
df.head()

Unnamed: 0,Ano,CDMunicipio,Populacao,PessoalOcupado,PessoalAssalariado,VrSalarios,PIB,QtEmpresas,AreaPlantada_h,AreaColhida_h,...,Exportacoes_US$,Receitas_R$,Transferencias_correntes_R$,Transferencias_capital_R$,NrNascimentos,NrObitosInfantis,povoamento,UF,Municipio,Regiao
0,2016,3509452,5.932,854.0,537.0,13.692,111.19,252.0,38.0,38.0,...,,"25.511.889,220","18.911.068,400","1.665.392,540",80.0,0.0,32065,SP,Campina do Monte Alegre,Sudeste
1,2016,3123601,27.505,5.68,4.778,104.977,554.663,671.0,3.0,3.0,...,"1.777.256,000","63.002.672,933","45.304.154,440","538.882,600",299.0,3.0,55065,MG,Elói Mendes,Sudeste
2,2016,3552007,6.193,668.0,580.0,12.519,62.441,83.0,0.0,0.0,...,,"30.492.825,449","21.861.157,950","1.048.458,040",59.0,2.0,14930,SP,Silveiras,Sudeste
3,2016,3305604,21.279,3.087,2.669,80.161,403.121,290.0,0.0,0.0,...,,"140.538.926,872","100.508.822,360","871.234,340",272.0,2.0,22698,RJ,Silva Jardim,Sudeste
4,2016,1717008,4.534,212.0,183.0,5.309,48.551,34.0,94.0,34.0,...,,"15.541.375,953","13.178.989,760","8.037,870",43.0,1.0,2908,TO,Pindorama do Tocantins,Norte


### 🧹 Limpeza e Preparação dos Dados
A seguir, apresentamos as etapas que escolhemos para o tratamento e organização dos dados da tabela utilizada em nossa análise.

#### 🗑️Remoção de Colunas
Removemos as colunas CDMunicipio, VrSalarios, AreaColhida_h, Importacoes_US, Receitas, Transferencias_correntes e Transferencias_capital após uma análise cuidadosa da equipe. Concluímos que esses atributos não contribuirão de forma significativa para responder às perguntas propostas na pesquisa.

Além de não serem úteis para as análises futuras, essas colunas poderiam introduzir ruído nos dados e complicar a construção de insights relevantes, desviando o foco das variáveis realmente importantes para os nossos objetivos. Por isso, optamos por eliminá-las, mantendo o dataset mais limpo, enxuto e direcionado às metas da investigação.


In [4]:

df = df.drop(columns=[
    'CDMunicipio',
    'VrSalarios',
    'AreaColhida_h',
    'Transferencias_correntes_R$',
    'Transferencias_capital_R$',
    'Receitas_R$',
    'Importacoes_US$'
])



#### 🗑️Remoção de Linhas
Durante a etapa de tratamento dos dados, identificamos a presença de valores ausentes em diversas linhas e colunas do dataframe. No entanto, sabemos que remover dados sem critério ou embasamento estatístico pode comprometer a integridade da análise.

Por isso, estabelecemos um critério objetivo: todas as linhas que possuem mais de 3 valores nulos foram removidas. Acreditamos que a permanência dessas linhas, com grande quantidade de informações faltantes, comprometeria a qualidade das análises futuras, podendo gerar distorções ou interpretações equivocadas.

Consideramos esses valores nulos como possíveis erros de coleta ou dados indisponíveis. Abaixo, é possível visualizar a quantidade de linhas que foram excluídas com base nesse critério:

In [5]:
# Lista de colunas que devem ser verificadas 
colunas_verificar = ['Populacao', 'PIB', 'PessoalOcupado', 'PessoalAssalariado', 
                    'AreaPlantada_h', 'VlProducaoAgricola', 'VlProducaoPecuaria', 
                    'Area', 'NrNascimentos', 'NrObitosInfantis', 'povoamento', 'Exportacoes_US$']

#Identificar linhas com mais de 3 valores nulos nas colunas selecionadas
linhas_remover = df[df[colunas_verificar].isnull().sum(axis=1) > 3]

#Mostrar as cidades que serão removidas
if not linhas_remover.empty:
    
    # Remover as linhas problemáticas
    qtd_removida = len(linhas_remover)
    df = df[df[colunas_verificar].isnull().sum(axis=1) <= 3]
    
    print(f"\total de linhas removidas: {qtd_removida}")
else:
    print("Nenhuma linha com mais de 3 colunas nulas encontrada")




	otal de linhas removidas: 33


#### 💵Conversão De Moedas e Tipos
Outra etapa importante do tratamento de dados foi a conversão dos valores da coluna “Exportações”, originalmente em dólares americanos, para reais. Optamos por essa conversão para padronizar a unidade monetária em todo o dataset, já que as demais informações financeiras presentes estão em reais. Trabalhar com diferentes moedas exigiria ajustes constantes e dificultaria comparações e análises futuras.

Além disso, decidimos converter algumas colunas que estavam no tipo object para o tipo float, permitindo o uso correto dessas variáveis em análises estatísticas e cálculos numéricos mais precisos.

Com essas conversões, garantimos maior consistência nos dados e facilitamos a interpretação dos resultados, otimizando as etapas futuras da análise.

In [6]:
df["Exportacoes_US$"] = df["Exportacoes_US$"].astype(str)

df["Exportacoes_US$"] = (
    df["Exportacoes_US$"]
    .str.replace(".", "", regex=False)  
    .str.replace(",", ".")            
)


df["Exportacoes_US$"] = df["Exportacoes_US$"].astype(float)

taxa_cambio = 5.68

# Criar a nova coluna em reais
df["Exportacoes_R$"] = df["Exportacoes_US$"] * taxa_cambio

# Remover a coluna original
df = df.drop(columns=["Exportacoes_US$"])


df["Area"]=df["Area"].astype(str)
df["Area"] = (
    df["Area"]
    .str.replace(".","",regex=False)
    .str.replace(",",".")
)
df["Area"]=df["Area"].astype(float)

df["povoamento"]=df["povoamento"].astype(str)
df["povoamento"] = (
    df["povoamento"]
    .str.replace(".","",regex=False)
    .str.replace(",",".")
)
df["povoamento"]=df["povoamento"].astype(float)

df["Populacao"]=df["Populacao"].astype(str)
df["Populacao"] = (
    df["Populacao"]
    .str.replace(".","",regex=False)
    .str.replace(",",".")
)
df["Populacao"]=df["Populacao"].astype(float)

df["PessoalOcupado"]=df["PessoalOcupado"].astype(str)
df["PessoalOcupado"] = (
    df["PessoalOcupado"]
    .str.replace(".","",regex=False)
    .str.replace(",",".")
)
df["PessoalOcupado"]=df["PessoalOcupado"].astype(float)

df["PessoalAssalariado"]=df["PessoalAssalariado"].astype(str)
df["PessoalAssalariado"] = (
    df["PessoalAssalariado"]
    .str.replace(".","",regex=False)
    .str.replace(",",".")
)
df["PessoalAssalariado"]=df["PessoalAssalariado"].astype(float)





#### 📏 Ajuste de Unidades dos Dados
De acordo com o artigo que acompanha a base de dados, algumas colunas apresentam seus valores em unidades escaladas, o que pode causar interpretações equivocadas caso não seja considerado no momento da análise.

Para facilitar a leitura e garantir que os dados reflitam valores reais e interpretáveis diretamente, realizamos os seguintes ajustes:

Multiplicamos as colunas PIB, VlProducaoAgricola e VlProducaoPecuaria por 1.000, já que seus valores estavam originalmente representados em milhares (10³).

Multiplicamos a coluna AreaPlantada_h por 10.000, pois os dados estavam expressos em dezenas de mil (10⁴).

A decisão de realizar essas conversões foi tomada tanto por motivos estéticos quanto práticos: ao apresentar os dados já na unidade correta, evitamos que o usuário precise realizar conversões manuais para interpretar os valores, tornando a análise mais fluida, precisa e acessível.


In [7]:
df["PIB"] = df["PIB"].str.replace(".", "", regex=False)
df["PIB"] = df["PIB"].astype(float)

df["PIB"] *= 1000
df["VlProducaoAgricola"] *= 1000
df["VlProducaoPecuaria"] *= 1000
df["AreaPlantada_h"] *= 10000

#### ✏️ Renomeando Coluna 
De acordo com o artigo científico que acompanha a base de dados, a coluna "Povoamento" representa, na prática, a densidade populacional dos municípios.

Para garantir que o nome da variável reflita de forma mais precisa seu conteúdo e esteja alinhado com a nomenclatura técnica correta, optamos por renomear a coluna "Povoamento" para "Densidade". Essa alteração facilita a compreensão e interpretação dos dados, especialmente durante as análises e visualizações futuras.

In [8]:
df.rename(columns={'povoamento': 'Densidade'}, inplace=True)

#### 🛠️ Atualização dos dados de PIB com base no IBGE (2021)
Para garantir maior precisão nos dados econômicos, atualizamos os valores de PIB do ano de 2021 no nosso dataset principal, utilizando os dados oficiais do IBGE.Carregamos uma base complementar (PIB dos Municípios - base de dados 2021.csv), que contém os valores atualizados do PIB por município e UF. Para integrar essa informação ao nosso dataset original (BrStats.csv), usamos um processo de merge indireto, criando uma chave única de correspondência (Municipio-UF) entre as duas bases. Após isso, substituímos apenas os valores de PIB de 2021 onde havia correspondência entre os municípios, mantendo todos os demais dados e anos intactos. Esse processo garante que a análise futura utilize valores econômicos confiáveis e atualizados, sem interferir em outras partes da base de dados.
Link para acessar o dataFrame do IBGE: [PIB-2021](https://www.ibge.gov.br/estatisticas/economicas/contas-nacionais/9088-produto-interno-bruto-dos-municipios.html?t=downloads&c=1100015)

In [39]:
# Passo 1: Carrega os dois datasets
df = pd.read_csv('dataFrame/BrStats.csv', sep=';', encoding='utf-8')
df_ibge_2021 = pd.read_csv('dataFrame/PIB dos Municípios - base de dados 2021.csv', sep=';', encoding='utf-8', low_memory=False)
# Passo 2: Renomeia colunas e ajusta nomes
df_ibge_2021 = df_ibge_2021.rename(columns={
    'Nome do Município': 'Municipio',
    'Sigla da Unidade da Federação': 'UF',
    'Produto Interno Bruto, \na preços correntes\n(R$ 1.000)': 'PIB_2021'
})
# Passo 3: Converte PIB para float e multiplica por 1000 (para tirar a escala de mil)
df_ibge_2021['PIB_2021'] = df_ibge_2021['PIB_2021'].astype(str).str.replace('.', '', regex=False).str.replace(',', '.', regex=False)
df_ibge_2021['PIB_2021'] = pd.to_numeric(df_ibge_2021['PIB_2021'], errors='coerce') * 1000
# Passo 4: Filtra apenas os dados de 2021 no df
mask_2021 = df['Ano'] == 2021
# Passo 5: Cria uma chave de merge (Municipio + UF) para ambos os DataFrames
df['chave'] = df['Municipio'] + '-' + df['UF']
df_ibge_2021['chave'] = df_ibge_2021['Municipio'] + '-' + df_ibge_2021['UF']
# Passo 6: Cria um dicionário com o PIB do IBGE por chave
pib_dict = df_ibge_2021.set_index('chave')['PIB_2021'].to_dict()
# Passo 7: Atualiza os valores de PIB de 2021 no DataFrame original, apenas onde existir correspondência
df.loc[mask_2021, 'PIB'] = df.loc[mask_2021, 'chave'].map(pib_dict).combine_first(df.loc[mask_2021, 'PIB'])
# Remove a coluna auxiliar
df = df.drop(columns=['chave'])
#df.to_csv("dataFrame/BrStatsAtualizada.csv", index=False, sep=";", decimal=",")



Columns (2,3,4,5,13,14,15) have mixed types. Specify dtype option on import or set low_memory=False.



#### 📊 Criação da Tabela de PIB per Capita
Para aprofundar nossa análise econômica, decidimos criar uma tabela auxiliar com o PIB per capita, segmentado por região, estado e município, ao longo dos diferentes anos. Essa métrica é essencial para avaliar o desenvolvimento relativo entre as localidades de forma mais justa e proporcional à sua população.

No entanto, como o cálculo depende diretamente das colunas PIB e População, precisamos garantir que os dados utilizados sejam consistentes. Por isso, removemos todas as linhas que apresentavam valores nulos nessas duas colunas, evitando assim resultados incorretos ou distorcidos.

O cálculo do PIB per capita foi feito utilizando a fórmula:

PIB per capita = PIB/população

Em seguida, organizamos a nova tabela com as colunas: Ano,Região,Estado,Município,PIB,População e PIB per capita

Essa tabela nos permitirá realizar comparações mais precisas entre diferentes regiões do país, com base em indicadores padronizados.

In [40]:


# Limpa nomes das colunas
df.columns = df.columns.str.strip()


df['Ano'] = df['Ano'].astype(str)

# Lista de colunas que NÃO devem ser convertidas para número
colunas_nao_numericas = ['Municipio', 'UF', 'Regiao','Ano']


# Converte todas as outras colunas para float, tratando o formato brasileiro
for col in df.columns:
    if col not in colunas_nao_numericas:
        df[col] = df[col].astype(str).str.replace('.', '', regex=False).str.replace(',', '.', regex=False)
        try:
            df[col] = df[col].astype(float)
        except ValueError:
            print(f"⚠️ Não foi possível converter a coluna '{col}' para float.")

# Filtra linhas com PIB e População válidos
df_pib_percapita = df.dropna(subset=['PIB', 'Populacao'])

# Calcula o PIB per capita
df_pib_percapita['PIB_per_capita'] = df_pib_percapita['PIB'] / df_pib_percapita['Populacao']

# Seleciona colunas relevantes
df_pib_percapita = df_pib_percapita[['Ano', 'Regiao', 'UF', 'Municipio', 'PIB', 'Populacao', 'PIB_per_capita']]

# Calcula médias por estado e região
df_estado = df_pib_percapita.groupby(['Ano', 'UF'])['PIB_per_capita'].mean().reset_index()
df_regiao = df_pib_percapita.groupby(['Ano', 'Regiao'])['PIB_per_capita'].mean().reset_index()


df_regiao['Ano'] = df_regiao['Ano'].astype(str)

# Cria pasta para salvar os resultados
os.makedirs('pib_per_capita', exist_ok=True)

# Salva os arquivos
df_pib_percapita.to_csv('pib_per_capita/pib_per_capita_municipios.csv', index=False)
df_estado.to_csv('pib_per_capita/pib_per_capita_estados.csv', index=False)
df_regiao.to_csv('pib_per_capita/pib_per_capita_regioes.csv', index=False)





A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



#### 👀 Visualização da Tabela Após Tratamentos e Limpeza de Dados
Após realizar os tratamentos e ajustes necessários nos dados, conseguimos reduzir a tabela para focar apenas nas informações essenciais para responder às 10 perguntas-chave do nosso projeto. Essa limpeza permitiu que os dados fossem mais objetivos e relevantes para a análise das questões propostas. 

In [41]:

# Arredondar os valores para 2 casas decimais
df = df.round(2)

# Salvar o arquivo com as médias arredondadas
df.to_csv("dataFrame/BrStatsAtualizada.csv", index=False, sep=";", decimal=",")

print("Salvo em 'dataFrame/BrStatsAtualizada.csv'.")

Salvo em 'dataFrame/BrStatsAtualizada.csv'.


#### 🧹 Conclusões com o Tratamento dos Dados
Com os ajustes feitos nos dados, conseguimos filtrar  as informações de maneira que os anos de 2016 a 2021 foram tratados, e as colunas e linhas que não eram relevantes para o projeto foram removidas. Isso resultou em uma tabela mais enxuta e focada, o que facilita a análise das questões propostas.

O tratamento realizado também garantiu que as unidades das colunas fossem ajustadas corretamente, permitindo que as comparações entre os dados fossem mais precisas.Além disso, realizar a conversão de moedas ajudará com as análises futuras. 

Agora, com os dados organizados e refinados, estamos prontos para avançar nas análises e começar a responder às questões do projeto de maneira mais eficaz.

# Etapa 2 - Projeto Desenvolvedor 🚀

### Descrição Etapa 2
Com os dados preparados e entendidos, nesta etapa o grupo deve gerar estatísticas descritivas, gráficos e tabelas para conhecer os dados. Todo conhecimento importante extraído deverá ser documentado e discutido. Pensem fora da caixa e tentem extrair correlações não óbvias entre os atributos e objetos. Nesta etapa, o objetivo é responder parte das perguntas elaboradas. Lembrem-se que novos questionamentos podem surgir.


### Divisão de Tarefas

#### 🧩 Importação da Biblioteca de Visualização

Para a criação dos gráficos interativos e animados, utilizaremos a biblioteca `plotly.express`, uma das ferramentas mais completas para visualização de dados em Python.
Se você ainda não possui a biblioteca instalada, basta rodar o seguinte comando:

```bash
pip install plotly


In [42]:
import plotly.express as px

#### 📊 Análise Exploratória do PIB per capita ao longo do tempo

O **PIB per capita** é uma métrica fundamental para diversas das perguntas que orientam nossa análise, pois reflete o nível de desenvolvimento econômico das cidades, estados e regiões brasileiras. Muitas das nossas hipóteses envolvem a relação entre o PIB per capita e outros indicadores sociais e econômicos, como saúde, produção agrícola, empregos e exportações.

Por isso, nesta etapa, iniciamos nossa visualização dos dados analisando a **evolução do PIB per capita** ao longo do tempo (de 2016 a 2021). Para isso, construímos gráficos **animados** que mostram o comportamento dessa métrica por:

- **Região**  
- **Estado (UF)**  
- **10 municípios com os maiores valores em cada ano**

Essas visualizações nos ajudarão a identificar **padrões temporais e espaciais**, e a comparar o desempenho econômico entre diferentes localidades. Além disso, ao final desta etapa, também calculamos a **média geral do PIB per capita** por região, estado e município, o que irá complementar nossas análises futuras.

##### 🌎 PIB per capita por Região (2016–2021)

Este gráfico animado mostra a evolução do PIB per capita médio em cada região do Brasil entre os anos de 2016 e 2021. A visualização facilita a comparação entre as regiões e nos ajuda a entender quais delas apresentaram maior crescimento econômico ao longo do tempo.


In [None]:

df_regiao = pd.read_csv('pib_per_capita/pib_per_capita_regioes.csv')
df_regiao['Ano'] = df_regiao['Ano'].astype(str)

# Crie o gráfico animado
fig_regiao = px.bar(
    df_regiao,
    x='Regiao',
    y='PIB_per_capita',
    color='Regiao',
    animation_frame='Ano',
    animation_group='Regiao',  # Importante para manter as cores consistentes
    title='PIB per capita por Região (2016–2021)',
    labels={'PIB_per_capita': 'PIB per capita (R$)'},
    range_y=[0, df_regiao['PIB_per_capita'].max() * 1.1]
)

# Ajustes de layout
fig_regiao.update_layout(
    xaxis_title="Região",
    yaxis_title="PIB per capita (R$)",
    # Configura o botão de play/pause
    updatemenus=[{
        "type": "buttons",
        "buttons": [
            {
                "label": "Play",
                "method": "animate",
                "args": [None, {"frame": {"duration": 1000, "redraw": True}, "fromcurrent": True}]
            },
            {
                "label": "Pause",
                "method": "animate",
                "args": [[None], {"frame": {"duration": 0, "redraw": True}, "mode": "immediate"}]
            }
        ]
    }]
)

# Mostra o gráfico
fig_regiao.show()

### 📜Referências
Pandas Documentation. "Pandas Documentation". Disponível em: https://pandas.pydata.org/docs/. Acesso em: 20 mar. 2025.   

Pandas 10-Minute Tutorial. "Pandas 10-Minute Tutorial". Disponível em: https://pandas.pydata.org/docs/user_guide/10min.html. Acesso em: 20 mar. 2025.   

W3Schools. "Pandas Tutorial". Disponível em: https://www.w3schools.com/python/pandas/default.asp. Acesso em: 20 mar. 2025
