# Análise do PIB por estado (2002 a 2020)

## Análise e Estatística de Dados com Python

**Nome do Aluno:** Mateus Felipe Granzotto de Campos.<BR>
**RA:** H769248 <BR>
**Nome do Aluno:** Jonathans Martine Cardoso.<BR>
**RA:** H701422 <BR>
**Curso:** **Análise e Desenvolvimento De Sistemas**<BR>
**Professora:** Rogério Silva  <BR>

---

## Resumo

Neste trabalho, nós exploramos os conceitos básicos da linguagem de programação Python, incluindo variáveis, gráficos, funções e bibliotecas. O objetivo é demonstrar a aplicação prática desses conceitos através de exemplos e exercícios.

---


## Importação de Bibliotecas Essenciais em Python

Para iniciar seu projeto de análise de dados e visualização em Python, é fundamental importar as bibliotecas necessárias. Utilize os seguintes comandos no seu terminal ou prompt de comando para instalar e garantir que as bibliotecas estejam disponíveis no seu ambiente:


py -m pip install pandas
py -m pip install numpy
py -m pip install matplotlib
py -m pip install ipywidgets
py -m pip install IPython
py -m pip install jinja2

# validação

O código apresentado é uma função em Python que carrega dados de um arquivo CSV denominado `pib_estados.csv`, utilizando a biblioteca `pandas`. Abaixo estão os principais pontos:

## Função: `carregar_dados()`

- **Descrição**: Carrega dados do arquivo CSV e retorna um DataFrame contendo informações sobre o PIB dos estados.
- **Retorno**:
  - `pandas.DataFrame`: Um DataFrame com os dados do PIB.
  - `None`: Retorna `None` em caso de erro ao tentar ler o arquivo.

### Detalhes da Implementação

1. **Importação da Biblioteca**:
   - A biblioteca `pandas` é importada como `pd`.

2. **Leitura do Arquivo**:
   - O arquivo `pib_estados.csv` é lido utilizando `pd.read_csv`, com a primeira coluna definida como índice do DataFrame.

3. **Tratamento de Erros**:
   - O código utiliza um bloco `try-except` para capturar a exceção `FileNotFoundError`. Se o arquivo não for encontrado, uma mensagem de erro é exibida.

4. **Mensagem de Sucesso**:
   - Ao carregar os dados com sucesso, uma mensagem é impressa no console.

### Execução da Função

- A função `carregar_dados()` é chamada e o resultado (DataFrame ou None) é armazenado na variável `tabelas`.

In [79]:
import pandas as pd

def carregar_dados():
  """Carrega os dados do arquivo CSV 'pib_estados.csv'.

  Returns:
      pandas.DataFrame: DataFrame contendo os dados do PIB dos estados, ou None em caso de erro.
  """
  try:
    # Lê o arquivo CSV 'pib_estados.csv' e define a primeira coluna como índice do DataFrame.
    tabelas = pd.read_csv("pib_estados.csv", index_col=0)
    print("Tabela carregada com sucesso!")

    return tabelas
  except FileNotFoundError:
    print("Erro: Arquivo 'pib_estados.csv' não encontrado.\n Verique a importação do arquivo")
    return None

# Chama a função para carregar os dados
tabelas = carregar_dados()

Tabela carregada com sucesso!


Este código realiza o tratamento e transformação de dados em um DataFrame Pandas chamado `tabelas`.

1. **Limpeza dos nomes dos anos:**
   - Remove a parte "#\d+" dos nomes dos anos no índice do DataFrame, convertendo-os para inteiros.

2. **Transposição e transformação dos dados:**
   - Transpõe o DataFrame para que os estados se tornem uma coluna e os anos se tornem variáveis.
   - Renomeia a coluna do índice transposto para "Estado".
   - Utiliza `melt()` para transformar o DataFrame em um formato longo, com colunas "Estado", "Ano" e "PIB".
   - Converte a coluna "Ano" para inteiros.

3. **Criação de listas de estados e anos:**
   - Cria duas listas ordenadas:
     - `estados_disponiveis`: Contém os nomes únicos dos estados.
     - `anos_disponiveis`: Contém os anos únicos.

In [80]:
# Limpar os nomes dos anos
tabelas.index = tabelas.index.str.replace(r'#\d+', '', regex=True).astype(int)

# Transpor e transformar os dados
tabelas = tabelas.T.reset_index().rename(columns={'index': 'Estado'})
tabelas = tabelas.melt(id_vars='Estado', var_name='Ano', value_name='PIB')
tabelas['Ano'] = tabelas['Ano'].astype(int)

# Lista de estados e anos
estados_disponiveis = sorted(tabelas['Estado'].unique())
anos_disponiveis = sorted(tabelas['Ano'].unique())

Este código define uma função chamada `calcular_estatisticas` que recebe uma série de dados como entrada e retorna um dicionário contendo as seguintes estatísticas descritivas:

* **Média:** A média aritmética dos dados.
* **Mediana:** O valor central dos dados ordenados.
* **Moda:** O valor mais frequente nos dados.
* **Desvio Padrão:** A medida da dispersão dos dados em relação à média.

A função utiliza as funções `np.mean()`, `np.median()`, `dados.mode()` e `np.std()` da biblioteca NumPy para calcular as estatísticas.

In [81]:
import numpy as np
# Função para calcular estatísticas
def calcular_estatisticas(dados):
    estatisticas = {
        'Média': np.mean(dados),
        'Mediana': np.median(dados),
        'Moda': dados.mode()[0],
        'Desvio Padrão': np.std(dados)
    }
    return estatisticas

Este código define uma função chamada `formatar_valor` que formata valores numéricos para exibição em milhões (M) ou bilhões (B), dependendo da magnitude do valor.

* **Se o valor for maior ou igual a 1 bilhão (1e9):**
   - Retorna o valor dividido por 1 bilhão, com uma casa decimal, seguido de "B".
* **Se o valor for maior ou igual a 1 milhão (1e6):**
   - Retorna o valor dividido por 1 milhão, com uma casa decimal, seguido de "M".
* **Caso contrário:**
   - Retorna o valor formatado como um inteiro (sem casas decimais).

Esta função é útil para exibir valores grandes de forma mais legível em gráficos ou tabelas.

In [82]:
# Função para formatar valores em milhões/bilhões
def formatar_valor(y, pos):
    if y >= 1e9:
        return f'{y*1e-9:.1f}B'
    elif y >= 1e6:
        return f'{y*1e-6:.1f}M'
    else:
        return f'{y:.0f}'

Este código importa as bibliotecas necessárias para análise de dados e visualização interativa em um ambiente Jupyter Notebook.

* **pandas (pd):** Para manipulação e análise de dados tabulares.
* **matplotlib.pyplot (plt):** Para criação de gráficos estáticos.
* **numpy (np):** Para operações numéricas eficientes.
* **ipywidgets (interact, widgets):** Para criação de widgets interativos (controles) na interface do Jupyter Notebook.
* **IPython.display (display, HTML):** Para exibir elementos HTML e outros objetos na saída do Jupyter Notebook.

Essas bibliotecas são comumente usadas em conjunto para criar dashboards interativos e análises exploratórias de dados em notebooks Python.

In [83]:
import matplotlib.pyplot as plt
from ipywidgets import interact, widgets
from IPython.display import display, HTML

Este código Python define uma função chamada `plotar_comparacao` que gera gráficos comparativos do Produto Interno Bruto (PIB) entre dois estados brasileiros ao longo de um período especificado.

## Função `plotar_comparacao`

A função `plotar_comparacao` recebe quatro argumentos:

* `ano_inicio`: O ano inicial para o período de análise.
* `ano_fim`: O ano final para o período de análise.
* `estado1`: O nome do primeiro estado a ser comparado.
* `estado2`: O nome do segundo estado a ser comparado.

A função gera dois gráficos:

1.  **Gráfico 1: Evolução do PIB**

    * Este gráfico mostra a evolução do PIB dos dois estados ao longo do tempo.
    * O eixo x representa os anos, e o eixo y representa o PIB em bilhões ou milhões de reais.
    * Cada estado é representado por uma linha diferente no gráfico.
    * A função também adiciona anotações aos pontos de dados no gráfico, mostrando os valores exatos do PIB para cada ano.

2.  **Gráfico 2: Estatísticas Comparativas**

    * Este gráfico compara as estatísticas descritivas do PIB dos dois estados.
    * As estatísticas comparadas são: média, mediana, moda e desvio padrão.
    * Cada estado é representado por um conjunto de barras diferentes no gráfico.
    * A função também adiciona anotações às barras, mostrando os valores exatos das estatísticas.

## Interpretação dos Gráficos

Os gráficos gerados pela função `plotar_comparacao` podem ser usados para comparar o desempenho econômico de dois estados brasileiros ao longo do tempo.

* O Gráfico 1 mostra como o PIB dos dois estados evoluiu ao longo do tempo, permitindo identificar tendências de crescimento ou declínio.
* O Gráfico 2 compara as estatísticas descritivas do PIB dos dois estados, permitindo identificar diferenças na distribuição do PIB.

## Uso

Este código é útil para analisar e comparar o desempenho econômico de diferentes estados brasileiros. Ele pode ser usado para identificar tendências, padrões e diferenças no PIB dos estados ao longo do tempo.

## Widgets Interativos

O código também inclui widgets interativos que permitem ao usuário selecionar os anos e estados a serem comparados. Isso torna a análise mais flexível e personalizada.

## Observações

* A função `calcular_estatisticas` calcula a média, mediana, moda e desvio padrão dos dados do PIB.
* A função `formatar_valor` formata os valores do PIB para exibição em milhões ou bilhões de reais.
* O código utiliza as bibliotecas `pandas`, `matplotlib.pyplot`, `numpy` e `ipywidgets`.
* Os gráficos são exibidos em um layout de duas colunas.
* As estatísticas descritivas são exibidas em formato de tabela abaixo dos gráficos.

In [84]:


# Função principal para os gráficos
def plotar_comparacao(ano_inicio, ano_fim, estado1, estado2):
    if ano_inicio > ano_fim:
        display(HTML("<div style='color:red; font-weight:bold;'>Erro: O ano de início não pode ser maior que o ano final!</div>"))
        return

    # Filtrar dados
    dados_estado1 = tabelas[(tabelas['Estado'] == estado1) & (tabelas['Ano'] >= ano_inicio) & (tabelas['Ano'] <= ano_fim)]
    dados_estado2 = tabelas[(tabelas['Estado'] == estado2) & (tabelas['Ano'] >= ano_inicio) & (tabelas['Ano'] <= ano_fim)]

    # Calcular estatísticas
    stats_estado1 = calcular_estatisticas(dados_estado1['PIB'])
    stats_estado2 = calcular_estatisticas(dados_estado2['PIB'])

    # Criar figura
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(18, 7))
    plt.subplots_adjust(wspace=0.3)

    # --- Gráfico 1: Evolução do PIB ---
    ax1.plot(dados_estado1['Ano'], dados_estado1['PIB'], marker='o', label=estado1, color='#1f77b4', linewidth=2)
    ax1.plot(dados_estado2['Ano'], dados_estado2['PIB'], marker='o', label=estado2, color='#2ca02c', linewidth=2)

    # Configurações do eixo Y
    ax1.yaxis.set_major_formatter(plt.FuncFormatter(formatar_valor))
    ax1.set_ylim(bottom=0, top=max(max(dados_estado1['PIB']), max(dados_estado2['PIB'])) * 1.1)

    ax1.set_title(f'Comparação do PIB ({ano_inicio}-{ano_fim})\n{estado1} vs {estado2}', pad=20)
    ax1.set_xlabel('Ano', labelpad=10)
    ax1.set_ylabel('PIB (em Bilhões/Milhões)', labelpad=10)
    ax1.legend(loc='upper left')
    ax1.grid(True, linestyle='--', alpha=0.4)

    # Adicionar valores nos pontos
    for x, y in zip(dados_estado1['Ano'], dados_estado1['PIB']):
        ax1.annotate(formatar_valor(y, None), (x, y), textcoords="offset points", xytext=(0,5), ha='center', fontsize=8)

    for x, y in zip(dados_estado2['Ano'], dados_estado2['PIB']):
        ax1.annotate(formatar_valor(y, None), (x, y), textcoords="offset points", xytext=(0,5), ha='center', fontsize=8)

    # --- Gráfico 2: Estatísticas Comparativas ---
    categorias = ['Média', 'Mediana', 'Moda', 'Desvio Padrão']
    valores_estado1 = [stats_estado1[cat] for cat in categorias]
    valores_estado2 = [stats_estado2[cat] for cat in categorias]

    x = np.arange(len(categorias))
    barras1 = ax2.bar(x - 0.2, valores_estado1, width=0.4, label=estado1, color='#1f77b4')
    barras2 = ax2.bar(x + 0.2, valores_estado2, width=0.4, label=estado2, color='#2ca02c')

    # Configurações do eixo Y
    ax2.yaxis.set_major_formatter(plt.FuncFormatter(formatar_valor))
    ax2.set_ylim(top=max(max(valores_estado1), max(valores_estado2)) * 1.2)

    ax2.set_title('Estatísticas Comparativas', pad=20)
    ax2.set_xticks(x)
    ax2.set_xticklabels(categorias)
    ax2.set_ylabel('Valor (em Bilhões/Milhões)', labelpad=10)
    ax2.legend()
    ax2.grid(True, linestyle='--', alpha=0.4)

    # Adicionar valores nas barras
    for bar in barras1:
        height = bar.get_height()
        ax2.annotate(formatar_valor(height, None),
                    xy=(bar.get_x() + bar.get_width() / 2, height),
                    xytext=(0, 3),
                    textcoords="offset points",
                    ha='center', va='bottom', fontsize=9)

    for bar in barras2:
        height = bar.get_height()
        ax2.annotate(formatar_valor(height, None),
                    xy=(bar.get_x() + bar.get_width() / 2, height),
                    xytext=(0, 3),
                    textcoords="offset points",
                    ha='center', va='bottom', fontsize=9)

    plt.tight_layout()
    plt.show()

    # Exibir tabela de estatísticas
    print(f"\nEstatísticas para {estado1} ({ano_inicio}-{ano_fim}):")
    print(pd.DataFrame([stats_estado1]))
    print(f"\nEstatísticas para {estado2} ({ano_inicio}-{ano_fim}):")
    print(pd.DataFrame([stats_estado2]))

# Widgets interativos
interact(
    plotar_comparacao,
    ano_inicio=widgets.IntSlider(min=min(anos_disponiveis), max=max(anos_disponiveis), step=1, value=min(anos_disponiveis), description='Ano Início'),
    ano_fim=widgets.IntSlider(min=min(anos_disponiveis), max=max(anos_disponiveis), step=1, value=max(anos_disponiveis), description='Ano Fim'),
    estado1=widgets.Dropdown(options=estados_disponiveis, description='Estado 1', value='São Paulo'),
    estado2=widgets.Dropdown(options=estados_disponiveis, description='Estado 2', value='Rio de Janeiro')
)

interactive(children=(IntSlider(value=2002, description='Ano Início', max=2020, min=2002), IntSlider(value=202…

<function __main__.plotar_comparacao(ano_inicio, ano_fim, estado1, estado2)>

Este dicionário Python chamado `regioes` mapeia os nomes das cinco regiões geográficas do Brasil para listas de seus respectivos estados.

## Estrutura do Dicionário

* As chaves do dicionário são os nomes das regiões: 'Norte', 'Nordeste', 'Centro-Oeste', 'Sudeste' e 'Sul'.
* Os valores associados a cada chave são listas contendo os nomes dos estados que compõem cada região.



In [85]:
# Dicionário de estados por região
regioes = {
    'Norte': ['Acre', 'Amapá', 'Amazonas', 'Pará', 'Rondônia', 'Roraima', 'Tocantins'],
    'Nordeste': ['Alagoas', 'Bahia', 'Ceará', 'Maranhão', 'Paraíba', 'Pernambuco', 'Piauí', 'Rio Grande do Norte', 'Sergipe'],
    'Centro-Oeste': ['Distrito Federal', 'Goiás', 'Mato Grosso', 'Mato Grosso do Sul'],
    'Sudeste': ['Espírito Santo', 'Minas Gerais', 'Rio de Janeiro', 'São Paulo'],
    'Sul': ['Paraná', 'Rio Grande do Sul', 'Santa Catarina']
}

Este código carrega e prepara dados do arquivo CSV "pib_estados.csv"

## Explicação Detalhada

1.  **Carregamento dos Dados:**
    * `tabelas = pd.read_csv("pib_estados.csv", index_col=0)`: Lê o arquivo CSV "pib_estados.csv" e armazena os dados em um DataFrame Pandas chamado `tabelas`. A primeira coluna do arquivo é definida como índice do DataFrame.

2.  **Limpeza do Índice:**
    * `tabelas.index = tabelas.index.str.replace(r'#\d+', '', regex=True).astype(int)`: Remove a parte "#\d+" dos nomes dos anos no índice do DataFrame e converte os valores do índice para inteiros. Isso é feito para limpar os nomes dos anos, que podem conter caracteres indesejados.

3.  **Transposição e Renomeação:**
    * `tabelas = tabelas.T.reset_index().rename(columns={'index': 'Estado'})`: Transpõe o DataFrame para que os estados se tornem colunas e os anos se tornem linhas. A coluna do índice transposto é renomeada para "Estado".

4.  **Transformação dos Dados:**
    * `tabelas = tabelas.melt(id_vars='Estado', var_name='Ano', value_name='PIB')`: Transforma o DataFrame em um formato longo, com colunas "Estado", "Ano" e "PIB". Isso é feito para facilitar a análise dos dados ao longo do tempo.

5.  **Conversão do Ano:**
    * `tabelas['Ano'] = tabelas['Ano'].astype(int)`: Converte a coluna "Ano" para inteiros.

## Uso

È útil para preparar dados de PIB de estados brasileiros para análise. Ele limpa os dados, transforma-os em um formato adequado e converte as colunas para os tipos de dados corretos. Isso facilita a realização de análises estatísticas e a criação de visualizações dos dados.



In [86]:
# Carregar e preparar os dados
tabelas = pd.read_csv("pib_estados.csv", index_col=0)
tabelas.index = tabelas.index.str.replace(r'#\d+', '', regex=True).astype(int)
tabelas = tabelas.T.reset_index().rename(columns={'index': 'Estado'})
tabelas = tabelas.melt(id_vars='Estado', var_name='Ano', value_name='PIB')
tabelas['Ano'] = tabelas['Ano'].astype(int)

Este código carrega e prepara dados de PIB de estados brasileiros a partir de do arquivo CSV "pib_estados.csv".

## Explicação

1.  **Carregamento:**
    * `pd.read_csv(...)`: Lê o arquivo CSV e armazena os dados em um DataFrame Pandas.

2.  **Limpeza do Índice:**
    * `tabelas.index.str.replace(...)`: Remove caracteres indesejados dos nomes dos anos no índice.
    * `.astype(int)`: Converte os nomes dos anos para inteiros.

3.  **Transposição e Renomeação:**
    * `tabelas.T`: Transpõe o DataFrame (estados como linhas, anos como colunas).
    * `.reset_index()`: Reseta o índice para criar uma coluna "Estado".
    * `.rename(...)`: Renomeia a coluna do índice para "Estado".

4.  **Transformação para Formato Longo:**
    * `tabelas.melt(...)`: Transforma o DataFrame para um formato longo, com colunas "Estado", "Ano" e "PIB".

5.  **Conversão do Ano:**
    * `tabelas['Ano'].astype(int)`: Converte a coluna "Ano" para inteiros.

## Resumo

O código carrega dados de PIB de estados, limpa e transforma os dados para um formato adequado para análise, com colunas "Estado", "Ano" e "PIB".

In [87]:
# Carregar e preparar os dados
tabelas = pd.read_csv("pib_estados.csv", index_col=0)
tabelas.index = tabelas.index.str.replace(r'#\d+', '', regex=True).astype(int)
tabelas = tabelas.T.reset_index().rename(columns={'index': 'Estado'})
tabelas = tabelas.melt(id_vars='Estado', var_name='Ano', value_name='PIB')
tabelas['Ano'] = tabelas['Ano'].astype(int)


Este código realiza um **teste t para amostras independentes** usando a biblioteca SciPy. O teste t é usado para comparar as médias de duas amostras e determinar se há uma diferença estatisticamente significativa entre elas.

## Explicação Detalhada

1.  **Importação da Biblioteca SciPy:**
    * `from scipy import stats`: Importa o módulo `stats` da biblioteca SciPy, que contém funções para testes estatísticos.

2.  **Preparação dos Dados:**
    * `grupo1 = df[df['grupo'] == 'A']['coluna']`: Cria uma variável `grupo1` que contém os valores da coluna 'coluna' do DataFrame `df` onde a coluna 'grupo' é igual a 'A'.
    * `grupo2 = df[df['grupo'] == 'B']['coluna']`: Cria uma variável `grupo2` que contém os valores da coluna 'coluna' do DataFrame `df` onde a coluna 'grupo' é igual a 'B'.

3.  **Realização do Teste t:**
    * `t_stat, p_value = stats.ttest_ind(grupo1, grupo2)`: Realiza o teste t para amostras independentes, comparando as médias de `grupo1` e `grupo2`.
        * `t_stat`: A estatística t calculada.
        * `p_value`: O valor p associado ao teste t.

4.  **Impressão dos Resultados:**
    * `print(f"Estatística T: {t_stat}, Valor-p: {p_value}")`: Imprime a estatística t e o valor p.

## Interpretação dos Resultados

* **Estatística T (t_stat):** Mede a diferença entre as médias das duas amostras em relação à variabilidade dentro das amostras.
* **Valor-p (p_value):** A probabilidade de observar uma diferença entre as médias tão grande quanto a observada, assumindo que não há diferença real entre as populações.
    * Um valor p baixo (geralmente ≤ 0,05) indica que há evidência estatisticamente significativa para rejeitar a hipótese nula de que as médias são iguais.

## Uso

Este código é útil para comparar duas amostras independentes e determinar se há uma diferença estatisticamente significativa entre suas médias. Por exemplo, você pode usá-lo para comparar o desempenho de dois grupos de alunos em um teste, ou para comparar o efeito de dois medicamentos diferentes.

In [88]:
# Adicionar coluna de região
tabelas['Região'] = tabelas['Estado'].apply(lambda x: next((reg for reg, estados in regioes.items() if x in estados), None))

# Agrupar por região e ano
pib_regioes = tabelas.groupby(['Região', 'Ano'])['PIB'].sum().reset_index()

# Listas para os menus
regioes_disponiveis = sorted(pib_regioes['Região'].unique())
anos_disponiveis = sorted(pib_regioes['Ano'].unique())

Este código define funções auxiliares e uma paleta de cores para análise e visualização de dados de PIB por região.

## Funções Auxiliares

1.  **Formatação de Valores:**
    * `formatar_valor(y, pos)`: Formata valores numéricos para exibição em reais (R$) com sufixos "B" (bilhões) ou "M" (milhões), dependendo da magnitude do valor.

2.  **Cálculo de Estatísticas:**
    * `calcular_estatisticas(dados)`: Calcula e retorna um dicionário com estatísticas descritivas para uma série de dados:
        * Média
        * Mediana
        * Desvio padrão
        * Crescimento total percentual

## Paleta de Cores

* `cores_regioes`: Um dicionário que mapeia nomes de regiões brasileiras para cores específicas em formato hexadecimal, utilizado para padronizar as cores em gráficos e visualizações.

## Resumo

O código fornece ferramentas para formatar e analisar dados de PIB, além de definir uma paleta de cores para visualizações consistentes.

In [89]:
# Função para formatar valores
def formatar_valor(y, pos):
    if y >= 1e9:
        return f'R${y*1e-9:.1f}B'
    elif y >= 1e6:
        return f'R${y*1e-6:.1f}M'
    return f'R${y:.0f}'

# Função para calcular estatísticas
def calcular_estatisticas(dados):
    return {
        'Média': np.mean(dados),
        'Mediana': np.median(dados),
        'Desvio Padrão': np.std(dados),
        'Crescimento Total': f"{((dados.iloc[-1] - dados.iloc[0])/dados.iloc[0]*100).round(2)}%"
    }

# Paleta de cores por região
cores_regioes = {
    'Norte': '#1f77b4',
    'Nordeste': '#ff7f0e',
    'Centro-Oeste': '#2ca02c',
    'Sudeste': '#d62728',
    'Sul': '#9467bd'
}

Este código define funções para formatar valores, calcular estatísticas e gerar gráficos comparativos do Produto Interno Bruto (PIB) entre regiões brasileiras ao longo do tempo.

## Funções Auxiliares

1.  **`formatar_valor(y, pos)`:**
    * Esta função formata valores numéricos para exibição em reais (R$) com sufixos "B" (bilhões) ou "M" (milhões), dependendo da magnitude do valor.
    * Se o valor for maior ou igual a 1 bilhão, ele é formatado como "R$X.XB".
    * Se o valor for maior ou igual a 1 milhão, ele é formatado como "R$X.XM".
    * Caso contrário, o valor é formatado como "R$X".

2.  **`calcular_estatisticas(dados)`:**
    * Esta função calcula e retorna um dicionário com estatísticas descritivas para uma série de dados (PIB):
        * `Média`: A média dos valores.
        * `Mediana`: A mediana dos valores.
        * `Desvio Padrão`: O desvio padrão dos valores.
        * `Crescimento Total`: O crescimento percentual total do PIB ao longo do período.

## Paleta de Cores

* `cores_regioes`: Um dicionário que mapeia nomes de regiões brasileiras para cores específicas em formato hexadecimal, utilizado para padronizar as cores em gráficos e visualizações.

## Função Principal `plotar_comparacao_regioes`

* Esta função gera gráficos comparativos do PIB entre duas regiões brasileiras ao longo de um período especificado.
* **Entrada:**
    * `ano_inicio`: O ano inicial para o período de análise.
    * `ano_fim`: O ano final para o período de análise.
    * `regiao1`: O nome da primeira região a ser comparada.
    * `regiao2`: O nome da segunda região a ser comparada.
* **Saída:**
    * Dois gráficos:
        1.  Evolução do PIB das duas regiões ao longo do tempo.
        2.  Comparação do PIB anual entre as duas regiões.
    * Tabelas com estatísticas descritivas e participação relativa das regiões no período.
* **Lógica:**
    1.  **Validação:** Verifica se o ano de início é menor ou igual ao ano final.
    2.  **Filtragem:** Filtra os dados de PIB para as duas regiões e o período especificado.
    3.  **Cálculo de estatísticas:** Calcula as estatísticas descritivas para cada região usando a função `calcular_estatisticas`.
    4.  **Criação de gráficos:**
        * **Gráfico de linhas:** Exibe a evolução do PIB das duas regiões ao longo do tempo.
        * **Gráfico de barras:** Compara o PIB anual entre as duas regiões.
    5.  **Formatação:** Formata os valores de PIB para exibição em milhões ou bilhões usando a função `formatar_valor`.
    6.  **Anotações:** Adiciona valores aos pontos e barras dos gráficos.
    7.  **Tabelas:** Exibe as estatísticas descritivas e a participação relativa das regiões em formato de tabela.

## Widgets Interativos

* A função `interact` do `ipywidgets` é utilizada para criar widgets interativos que permitem ao usuário selecionar os anos e regiões a serem comparados.

## Gráficos

1.  **Gráfico 1: Evolução do PIB por Região**
    * Mostra a evolução do PIB das duas regiões ao longo do tempo.
    * O eixo x representa os anos, e o eixo y representa o PIB total em reais.
    * Cada região é representada por uma linha diferente no gráfico.
    * A função `formatar_valor` é usada para formatar os valores do PIB no eixo y.

2.  **Gráfico 2: Comparativo Anual entre Regiões**
    * Compara o PIB anual das duas regiões.
    * O eixo x representa os anos, e o eixo y representa o PIB anual em reais.
    * Cada região é representada por um conjunto de barras diferentes no gráfico.
    * A função `formatar_valor` é usada para formatar os valores do PIB no eixo y.

## Tabelas

* A função `display` do `IPython.display` é utilizada para exibir as estatísticas descritivas e a participação relativa das regiões em formato de tabela.

## Resumo

Este código fornece uma ferramenta interativa para explorar e comparar o desempenho econômico das regiões brasileiras ao longo do tempo, usando dados de PIB. Ele permite uma análise visual e interativa dos dados, facilitando a identificação de tendências e padrões.

In [90]:
# Função principal
def plotar_comparacao_regioes(ano_inicio, ano_fim, regiao1, regiao2):
    if ano_inicio > ano_fim:
        display(HTML("<div style='color:red; font-weight:bold;'>Erro: O ano de início não pode ser maior que o ano final!</div>"))
        return

    # Filtrar dados
    dados_regiao1 = pib_regioes[(pib_regioes['Região'] == regiao1) & (pib_regioes['Ano'] >= ano_inicio) & (pib_regioes['Ano'] <= ano_fim)]
    dados_regiao2 = pib_regioes[(pib_regioes['Região'] == regiao2) & (pib_regioes['Ano'] >= ano_inicio) & (pib_regioes['Ano'] <= ano_fim)]

    # Calcular estatísticas
    stats_regiao1 = calcular_estatisticas(dados_regiao1['PIB'])
    stats_regiao2 = calcular_estatisticas(dados_regiao2['PIB'])

    # Criar figura
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(20, 8))
    plt.subplots_adjust(wspace=0.25)

    # --- Gráfico 1: Evolução do PIB por Região ---
    ax1.plot(dados_regiao1['Ano'], dados_regiao1['PIB'],
             marker='o', linestyle='-', linewidth=2.5,
             color=cores_regioes[regiao1], label=regiao1)
    ax1.plot(dados_regiao2['Ano'], dados_regiao2['PIB'],
             marker='s', linestyle='--', linewidth=2.5,
             color=cores_regioes[regiao2], label=regiao2)

    # Configurar eixo Y
    ax1.yaxis.set_major_formatter(plt.FuncFormatter(formatar_valor))
    ax1.set_ylim(0, max(max(dados_regiao1['PIB']), max(dados_regiao2['PIB'])) * 1.15)

    ax1.set_title(f'Evolução do PIB por Região ({ano_inicio}-{ano_fim})', pad=20, fontsize=14)
    ax1.set_xlabel('Ano', fontsize=12)
    ax1.set_ylabel('PIB Total', fontsize=12)
    ax1.legend(fontsize=12)
    ax1.grid(True, linestyle=':', alpha=0.6)

    # Adicionar valores
    for x, y in zip(dados_regiao1['Ano'], dados_regiao1['PIB']):
        ax1.annotate(formatar_valor(y, None), (x, y), textcoords="offset points",
                    xytext=(0,8), ha='center', fontsize=9, bbox=dict(boxstyle='round,pad=0.2', fc='white', alpha=0.7))

    for x, y in zip(dados_regiao2['Ano'], dados_regiao2['PIB']):
        ax1.annotate(formatar_valor(y, None), (x, y), textcoords="offset points",
                    xytext=(0,8), ha='center', fontsize=9, bbox=dict(boxstyle='round,pad=0.2', fc='white', alpha=0.7))

    # --- Gráfico 2: Comparativo entre Regiões ---
    comparativo = pd.DataFrame({
        regiao1: dados_regiao1.set_index('Ano')['PIB'],
        regiao2: dados_regiao2.set_index('Ano')['PIB']
    }).dropna()

    anos_completos = comparativo.index
    largura_barra = 0.35
    x = np.arange(len(anos_completos))

    ax2.bar(x - largura_barra/2, comparativo[regiao1], width=largura_barra,
            color=cores_regioes[regiao1], label=regiao1)
    ax2.bar(x + largura_barra/2, comparativo[regiao2], width=largura_barra,
            color=cores_regioes[regiao2], label=regiao2)

    # Configurar eixo Y
    ax2.yaxis.set_major_formatter(plt.FuncFormatter(formatar_valor))
    ax2.set_ylim(0, max(max(comparativo[regiao1]), max(comparativo[regiao2])) * 1.2)

    ax2.set_title(f'Comparativo Anual entre Regiões', pad=20, fontsize=14)
    ax2.set_xlabel('Ano', fontsize=12)
    ax2.set_xticks(x)
    ax2.set_xticklabels(anos_completos)
    ax2.legend(fontsize=12)
    ax2.grid(True, axis='y', linestyle=':', alpha=0.6)

    # Adicionar rótulos
    for i in x:
        ax2.annotate(formatar_valor(comparativo[regiao1].iloc[i], None),
                    xy=(i - largura_barra/2, comparativo[regiao1].iloc[i]),
                    xytext=(0, 3), textcoords="offset points",
                    ha='center', va='bottom', fontsize=9)

        ax2.annotate(formatar_valor(comparativo[regiao2].iloc[i], None),
                    xy=(i + largura_barra/2, comparativo[regiao2].iloc[i]),
                    xytext=(0, 3), textcoords="offset points",
                    ha='center', va='bottom', fontsize=9)

    plt.tight_layout()
    plt.show()

    # Exibir estatísticas comparativas
    print("\n" + "="*50)
    print(f"COMPARAÇÃO ENTRE REGIÕES ({ano_inicio}-{ano_fim})")
    print("="*50)

    df_stats = pd.DataFrame({
        regiao1: stats_regiao1,
        regiao2: stats_regiao2
    }).T

    display(df_stats.style.set_caption(f"Estatísticas Comparativas: {regiao1} vs {regiao2}"))

    # Calcular participação relativa
    total_regiao1 = dados_regiao1['PIB'].sum()
    total_regiao2 = dados_regiao2['PIB'].sum()
    total_geral = total_regiao1 + total_regiao2

    participacao = pd.DataFrame({
        'Participação': [
            f"{(total_regiao1/total_geral*100).round(2)}%",
            f"{(total_regiao2/total_geral*100).round(2)}%"
        ]
    }, index=[regiao1, regiao2])

    print("\nParticipação relativa no período:")
    display(participacao)

# Widgets interativos
interact(
    plotar_comparacao_regioes,
    ano_inicio=widgets.IntSlider(min=min(anos_disponiveis), max=max(anos_disponiveis), step=1,
                               value=min(anos_disponiveis), description='Ano Início'),
    ano_fim=widgets.IntSlider(min=min(anos_disponiveis), max=max(anos_disponiveis), step=1,
                             value=max(anos_disponiveis), description='Ano Fim'),
    regiao1=widgets.Dropdown(options=regioes_disponiveis, description='Região 1',
                            value='Sudeste', style={'description_width': 'initial'}),
    regiao2=widgets.Dropdown(options=regioes_disponiveis, description='Região 2',
                            value='Nordeste', style={'description_width': 'initial'})
)

interactive(children=(IntSlider(value=2002, description='Ano Início', max=2020, min=2002), IntSlider(value=202…

<function __main__.plotar_comparacao_regioes(ano_inicio, ano_fim, regiao1, regiao2)>