# ECONOVISION

Neste projeto, desenvolvemos um dashboard que utiliza dados de indicadores socioecon√¥micos para criar gr√°ficos e an√°lises de regress√£o. O objetivo √© explorar correla√ß√µes e identificar padr√µes que possam auxiliar na compreens√£o desses dados de forma mais intuitiva e visual.

# Coleta de indicadores
De in√≠cio precisamos coletar os dados dos indicadores, sendo eles fornecidos pela API do Banco Central do Brasil.

In [None]:
import pandas as pd
!pip install Python-bcb
from bcb import sgs

def carregar_dados():
    def obter_dado(codigo, nome):
        try:
            df = sgs.get({nome: codigo}, start='2016-01-01')
            df = df.reset_index()
            df.columns = ['Data', nome]
            df['Data'] = pd.to_datetime(df['Data'], dayfirst=True)
            return df
        except Exception as e:
            print(f"Erro ao carregar {nome}: {e}")
            return pd.DataFrame(columns=['Data', nome])

    dfSelic = obter_dado(1178, 'Selic')
    dfIpca = obter_dado(433, 'Ipca')
    dfMediaDeflacionada = obter_dado(24381, 'Remunera√ß√£o M√©dia Deflacionada')
    dfIgpm = obter_dado(189, 'Igpm')
    dfInad = obter_dado(21082, 'Inadimpl√™ncia')
    dfInadFamilia = obter_dado(29038, 'Inadimpl√™ncia Familiar')
    dfCredTotal = obter_dado(20631, 'Cr√©dito Total')
    dfDolar = obter_dado(1, 'D√≥lar')

    # Ajuste Selic para frequ√™ncia mensal
    if not dfSelic.empty:
        dfSelic = dfSelic.set_index('Data').resample('MS').first().reset_index()

    return dfSelic, dfIpca, dfMediaDeflacionada, dfIgpm, dfInad, dfInadFamilia, dfCredTotal, dfDolar


Neste c√≥digo criamos uma fun√ß√£o na qual devolve um vetor para cada indicador que buscamos. Sendo eles: Selic, Remunera√ß√£o M√©dia Deflacionada, Igpm, Ipca, Inadimpl√™ncia, Cr√©dito Total, D√≥lar.

## Cria√ß√£o dos Gr√°ficos

Cria√ß√£o dos Gr√°ficos
Ap√≥s a coleta dos dados dos indicadores, come√ßamos a cria√ß√£o dos gr√°ficos para a an√°lise.

In [None]:
!pip install streamlit
import streamlit as st
import plotly.express as px

class Graficos:
    def exibir_grafico_linha(self, df):
        st.subheader('Gr√°fico de Linha')
        if df.empty:
            st.error("N√£o h√° dados para o gr√°fico de linha.")
            return
        try:
            fig = px.line(df, x='Data', y=df.columns[1:], title="Evolu√ß√£o dos Indicadores", template='plotly_dark')
            st.plotly_chart(fig, use_container_width=True)
        except Exception as e:
            st.error(f"Erro no gr√°fico de linha: {e}")

    def exibir_grafico_dispersao(self, df):
        st.subheader('Gr√°fico de Dispers√£o')
        if df.empty:
            st.error("N√£o h√° dados para o gr√°fico de dispers√£o.")
            return
        try:
            col1 = st.selectbox("Indicador X:", df.columns[1:], key="disp1")
            col2 = st.selectbox("Indicador Y:", df.columns[1:], key="disp2")
            fig = px.scatter(df, x=col1, y=col2, title=f"Dispers√£o: {col1} vs {col2}", template='plotly_dark')
            st.plotly_chart(fig, use_container_width=True)
        except Exception as e:
            st.error(f"Erro no gr√°fico de dispers√£o: {e}")

    def exibir_grafico_barras(self, df):
        st.subheader('Gr√°fico de Barras')
        if df.empty:
            st.error("N√£o h√° dados para o gr√°fico de barras.")
            return
        try:
            col = st.selectbox("Indicador:", df.columns[1:], key="bar")
            fig = px.bar(df, x='Data', y=col, title=f"{col} ao longo do tempo", template='plotly_dark')
            st.plotly_chart(fig, use_container_width=True)
        except Exception as e:
            st.error(f"Erro no gr√°fico de barras: {e}")

    def exibir_grafico_boxplot(self, df):
        st.subheader('Gr√°fico de Boxplot')
        if df.empty:
            st.error("N√£o h√° dados para o gr√°fico de boxplot.")
            return
        try:
            col = st.selectbox("Indicador:", df.columns[1:], key="box")
            fig = px.box(df, y=col, title=f"Distribui√ß√£o de {col}", template='plotly_dark')
            st.plotly_chart(fig, use_container_width=True)
        except Exception as e:
            st.error(f"Erro no gr√°fico de boxplot: {e}")

    def exibir_matriz_correlacao(self, df):
        st.subheader('Matriz de Correla√ß√£o de Pearson')
        if df.empty or df.shape[1] <= 2:
            st.info("Selecione pelo menos dois indicadores para gerar a matriz de correla√ß√£o.")
            return
        try:
            df_corr = df.drop(columns=['Data']).corr(method='pearson')
            fig = px.imshow(
                df_corr,
                text_auto=True,
                color_continuous_scale='RdBu_r',
                title="Correla√ß√£o de Pearson entre Indicadores",
                aspect='auto',
                template='plotly_dark'
            )
            st.plotly_chart(fig, use_container_width=True)
        except Exception as e:
            st.error(f"Erro ao gerar a matriz de correla√ß√£o: {e}")


Com esse c√≥digo criamos os seguites gr√°ficos:

Gr√°fico de Linha:

*   Mostra a evolu√ß√£o dos indicadores ao longo do tempo, agregando todos os indicadores selecionados para uma vis√£o ampla.


Gr√°fico de Dispers√£o:

*   Compara a rela√ß√£o entre dois indicadores, sendo √∫til para identificar padr√µes e correla√ß√µes diretas.


Gr√°fico de Barras:
* Similar ao gr√°fico de linha, mas focado em indicadores individuais, permitindo analisar a evolu√ß√£o de um indicador espec√≠fico.

Gr√°fico de Boxplot:
* Mostra a dispers√£o do conjunto de dados, destacando mediana, quartis e poss√≠veis outliers.

Correla√ß√£o de Pearson:
* Mede a for√ßa e a dire√ß√£o da rela√ß√£o linear entre os indicadores, identificando as vari√°veis mais correlacionadas.

# Gr√°fico de Regress√£o

Com o gr√°fico de regress√£o linear podemos fazer a predi√ß√£o de dados futuros.

In [5]:
import streamlit as st
import pandas as pd
import plotly.express as px
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import r2_score, mean_absolute_error
from statsmodels.stats.outliers_influence import variance_inflation_factor
from sklearn.metrics import root_mean_squared_error

class Regressao:
    def exibir_regressao_linear(self, df):
        st.subheader("Regress√£o Linear M√∫ltipla")

        if df.shape[1] > 2:
            target = st.selectbox("Selecione o indicador a ser previsto (vari√°vel dependente):", df.columns[1:], key="reg_target")
            features = st.multiselect("Selecione as vari√°veis preditoras (independentes):", [col for col in df.columns[1:] if col != target], key="reg_features")

            if features and st.button("Executar Regress√£o"):
                df_modelo = df.dropna(subset=[target] + features)
                X = df_modelo[features]
                y = df_modelo[target]

                scaler = StandardScaler()
                X_scaled = scaler.fit_transform(X)

                st.markdown("### Verifica√ß√£o de Multicolinearidade (VIF)")
                vif_data = pd.DataFrame()
                vif_data["Vari√°vel"] = features
                vif_data["VIF"] = [variance_inflation_factor(X_scaled, i) for i in range(X_scaled.shape[1])]
                st.dataframe(vif_data)

                st.markdown("### Correla√ß√£o entre Vari√°veis Preditivas")
                fig_corr = px.imshow(pd.DataFrame(X, columns=features).corr(), text_auto=True, color_continuous_scale='RdBu_r', zmin=-1, zmax=1)
                st.plotly_chart(fig_corr, use_container_width=True)

                X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
                modelo = LinearRegression()
                modelo.fit(X_train, y_train)
                y_pred = modelo.predict(X_test)

                r2 = r2_score(y_test, y_pred)
                mae = mean_absolute_error(y_test, y_pred)
                rmse = root_mean_squared_error(y_test, y_pred)

                st.markdown(f"### Avalia√ß√£o do Modelo")
                st.write(f"**R¬≤ (coeficiente de determina√ß√£o):** {r2:.2f}")
                st.write(f"**MAE (erro absoluto m√©dio):** {mae:.2f}")
                st.write(f"**RMSE (raiz do erro quadr√°tico m√©dio):** {rmse:.2f}")

                st.markdown("### Coeficientes do Modelo")
                for var, coef in zip(features, modelo.coef_):
                    st.write(f"- {var}: {coef:.4f}")

                futuro_data = pd.to_datetime(df['Data'].max()) + pd.DateOffset(years=1)
                st.markdown(f"### Previs√£o para o Ano de {futuro_data.year}")

                features_futuras = X.iloc[-1:].copy()
                features_futuras['Data'] = futuro_data

                X_futuro_scaled = scaler.transform(features_futuras[features])
                y_futuro = modelo.predict(X_futuro_scaled)
                st.write(f"**Previs√£o do {target} para {futuro_data.year}:** {y_futuro[0]:.2f}")

                fig_pred = px.scatter(
                    x=y_test,
                    y=y_pred,
                    labels={"x": "Valores Reais", "y": "Valores Previsto"},
                    title="Valores Reais vs. Previsto",
                    template="plotly_dark"
                )
                fig_pred.add_shape(
                    type="line",
                    x0=min(y_test),
                    y0=min(y_test),
                    x1=max(y_test),
                    y1=max(y_test),
                    line=dict(color="red", dash="dash")
                )
                st.plotly_chart(fig_pred, use_container_width=True)


Esse c√≥digo define uma classe chamada Regressao e utiliza a API Sklearn para realizar a regress√£o linear com machine learning. Al√©m disso √© utilizado o  Streamlit para a interface, Pandas para manipula√ß√£o de dados e Plotly para visualiza√ß√£o.

# Apresenta√ß√£o dos gr√°ficos no Dashboard
Agora com os dados coletados e com os gr√°ficos criados, falta montar o Dashboard, na qual vai conter todas essas informa√ß√µes.

In [None]:
import streamlit as st
import pandas as pd

SELIC = 'Selic'
IPCA = 'IPCA'
REMUNERACAO_DEFLACIONADA = 'Remunera√ß√£o M√©dia Deflacionada'
IGPM = 'IGPM'
INADIMPLENCIA = 'Inadimpl√™ncia'
INADIMPLENCIA_FAMILIA = 'Inadimpl√™ncia Fam√≠lia'
CREDITO_TOTAL = 'Cr√©dito Total'
DOLAR = 'D√≥lar'

class AppStreamlit:
    def __init__(self):
        self.df_selic, self.df_ipca, self.df_salario, self.df_igpm, self.df_inad, self.df_inad_familia, self.df_cred_total, self.df_dolar = carregar_dados()
        self.graficos = Graficos()
        self.regressao = Regressao()

    def exibir(self):
        st.set_page_config(layout='wide')
        st.title('Painel de Indicadores Econ√¥micos')

        st.sidebar.title("Sele√ß√£o de Indicadores")
        indicadores = [SELIC, IPCA, REMUNERACAO_DEFLACIONADA, IGPM, INADIMPLENCIA, INADIMPLENCIA_FAMILIA, CREDITO_TOTAL, DOLAR]
        selecionados = st.sidebar.multiselect("Escolha os Indicadores para compara√ß√£o", indicadores)

        df_base = self.df_selic.copy()
        df_base['Data'] = pd.to_datetime(df_base['Data'], errors='coerce')
        data_minima = df_base['Data'].min().replace(day=1)
        data_maxima = df_base['Data'].max().replace(day=1)

        data_inicial = st.sidebar.date_input("A partir de:", data_minima, min_value=data_minima, max_value=data_maxima)

        if selecionados:
            data_inicial = pd.to_datetime(data_inicial).replace(day=1)
            df = self._preparar_comparacao(selecionados, data_inicial)

            self.graficos.exibir_grafico_linha(df)
            self.graficos.exibir_grafico_dispersao(df)
            self.graficos.exibir_grafico_barras(df)
            self.graficos.exibir_grafico_boxplot(df)
            self.graficos.exibir_matriz_correlacao(df)

            self.regressao.exibir_regressao_linear(df)

    def _preparar_comparacao(self, selecionados, data_inicial):
        df_base = self.df_selic.copy()
        df_base['Data'] = pd.to_datetime(df_base['Data'], errors='coerce')
        df_base = df_base.dropna(subset=['Data']).set_index('Data')
        df_base = df_base[df_base.index >= data_inicial]

        df_comparado = pd.DataFrame(index=df_base.index)

        if SELIC in selecionados:
            df_comparado['Selic'] = df_base['Selic']

        def join_df(indicador, df, coluna):
            if indicador in selecionados and not df.empty:
                temp = df.copy()
                temp['Data'] = pd.to_datetime(temp['Data'], errors='coerce')
                temp.set_index('Data', inplace=True)
                temp = temp[temp.index >= data_inicial]
                return df_comparado.join(temp[[coluna]], how='outer')
            return df_comparado

        df_comparado = join_df(IPCA, self.df_ipca, 'Ipca')
        df_comparado = join_df(REMUNERACAO_DEFLACIONADA, self.df_salario, 'Remunera√ß√£o M√©dia Deflacionada')
        df_comparado = join_df(IGPM, self.df_igpm, 'Igpm')
        df_comparado = join_df(INADIMPLENCIA, self.df_inad, 'Inadimpl√™ncia')
        df_comparado = join_df(INADIMPLENCIA_FAMILIA, self.df_inad_familia, 'Inadimpl√™ncia Familiar')
        df_comparado = join_df(CREDITO_TOTAL, self.df_cred_total, 'Cr√©dito Total')
        df_comparado = join_df(DOLAR, self.df_dolar, 'D√≥lar')

        df_comparado = df_comparado.dropna(how='all').reset_index()
        return df_comparado

if __name__ == '__main__':
    app = AppStreamlit()
    app.exibir()


Al√©m da apresenta√ß√£o dos gr√°ficos, foi criada uma sele√ß√£o de indicadores, assim permitindo apenas a visualiza√ß√£o dos indicadores da prefer√™ncia do usu√°rio. Tamb√©m foi adicionada uma fun√ß√£o que filtra os dados a partir do tempo escolhido.

# P√°ginas Complementares

In [None]:
import streamlit as st
import pandas as pd
import plotly.express as px

dfs = carregar_dados()

df_merged = dfs[0]
for df in dfs[1:]:
    df_merged = pd.merge(df_merged, df, on="Data", how="inner")

st.title("Resumo e Interpreta√ß√µes de Indicadores Econ√¥micos")

def show_analysis(title, desc, x, y):
    st.markdown(f"### {title}")
    st.markdown(desc)
    fig = px.scatter(df_merged, x=x, y=y, trendline="ols", title=f"{x} vs {y}")
    st.plotly_chart(fig)
    st.markdown("---")
st.markdown("""
## üßæ Descri√ß√£o dos Indicadores Econ√¥micos

### üè¶ Selic (Taxa B√°sica de Juros)
A Selic √© a taxa b√°sica de juros da economia brasileira, definida pelo Banco Central. Ela influencia diretamente todas as outras taxas de juros do pa√≠s, como as cobradas em empr√©stimos, financiamentos e rendimentos de investimentos. Quando a Selic aumenta, o cr√©dito tende a ficar mais caro, o que reduz o consumo e ajuda a conter a infla√ß√£o.

### üìà IPCA (√çndice de Pre√ßos ao Consumidor Amplo)
√â o √≠ndice oficial de infla√ß√£o do Brasil, calculado pelo IBGE. Mede a varia√ß√£o de pre√ßos de um conjunto de produtos e servi√ßos consumidos pelas fam√≠lias. √â usado como refer√™ncia para metas de infla√ß√£o do governo.

### üíº Remunera√ß√£o M√©dia Deflacionada
Refere-se ao rendimento m√©dio real dos trabalhadores, j√° descontada a infla√ß√£o. Um aumento neste indicador significa que o poder de compra da popula√ß√£o est√° aumentando, o que pode impactar o consumo, endividamento e capacidade de pagamento.

### üìä IGP-M (√çndice Geral de Pre√ßos ‚Äì Mercado)
√â um √≠ndice de infla√ß√£o calculado pela FGV e amplamente utilizado para reajustes de contratos (como aluguel). Ele reflete a varia√ß√£o de pre√ßos em diferentes est√°gios da economia, como atacado, constru√ß√£o civil e consumidor final.

### ‚ùó Inadimpl√™ncia
Mede o percentual de opera√ß√µes de cr√©dito em atraso no sistema financeiro. Altas taxas de inadimpl√™ncia indicam dificuldades generalizadas da popula√ß√£o ou empresas em manter os pagamentos em dia.

### üë®‚Äçüë©‚Äçüëß‚Äçüë¶ Inadimpl√™ncia das Fam√≠lias
√â um recorte da inadimpl√™ncia que considera exclusivamente pessoas f√≠sicas. Est√° relacionada com o endividamento familiar, desemprego, infla√ß√£o e varia√ß√µes na renda.

### üí≥ Cr√©dito Total
Representa o total de cr√©dito concedido pelo sistema financeiro, incluindo pessoas f√≠sicas e jur√≠dicas. Esse indicador mostra a disponibilidade de capital na economia e o grau de atividade financeira.

### üíµ D√≥lar
Cota√ß√£o da moeda americana em rela√ß√£o ao real. O d√≥lar afeta importa√ß√µes, exporta√ß√µes, infla√ß√£o, investimentos e expectativas do mercado. Seu comportamento est√° ligado a fatores internos (como pol√≠tica econ√¥mica) e externos (como juros dos EUA).

---
""")



# An√°lises de interesse
show_analysis(
    "üìâ Selic vs IGP-M",
    "**Correla√ß√£o negativa forte (-0.54)**: Alta da Selic tende a conter infla√ß√£o medida pelo IGP-M.",
    "Selic", "Igpm"
)

show_analysis(
    "üí≥ Selic vs Inadimpl√™ncia",
    "**Correla√ß√£o positiva (0.64)**: Juros maiores tornam o cr√©dito mais caro, aumentando inadimpl√™ncia.",
    "Selic", "Inadimpl√™ncia"
)

show_analysis(
    "üè¶ Cr√©dito Total vs Inadimpl√™ncia Familiar",
    "**Correla√ß√£o fort√≠ssima (0.90)**: Mais cr√©dito dispon√≠vel aumenta o risco de inadimpl√™ncia nas fam√≠lias.",
    "Cr√©dito Total", "Inadimpl√™ncia Familiar"
)

show_analysis(
    "üíº Remunera√ß√£o M√©dia vs Cr√©dito Total",
    "**Correla√ß√£o moderada (0.29)**: Melhora na renda pode estimular o aumento do cr√©dito.",
    "Remunera√ß√£o M√©dia Deflacionada", "Cr√©dito Total"
)

show_analysis(
    "üíº Remunera√ß√£o M√©dia vs Inadimpl√™ncia Familiar",
    "**Correla√ß√£o fraca (0.15)**: Pode haver impacto, mas outros fatores como juros e desemprego pesam mais.",
    "Remunera√ß√£o M√©dia Deflacionada", "Inadimpl√™ncia Familiar"
)


Essa p√°gina tem o prop√≥sito de auxiliar o usu√°rio, nela h√° a descri√ß√£o de cada Indicador, al√©m disso √© apresentada as analises mais comuns e correlacionadas.

In [None]:
import streamlit as st

st.title("Sobre o Projeto")
st.markdown("""
## Grupo de An√°lise Econ√¥mica



### Integrantes:
- **Beatriz de Souza Santos Rio Branco**
- **S√°tiro Gabriel de Souza Santos**
- **Sabrinna Cristina Gomes Vicente**
- **Rodrigo Correa da Gama**
---

Este painel foi desenvolvido como parte de um trabalho acad√™mico para explorar indicadores econ√¥micos usando Python e Streamlit.
""")


P√°gina de Cr√©ditos, na qual mostra o nome dos criadores do projeto.

# Conclus√£o
O dashboard da Econovision utiliza de Indicadores Socioecon√¥micos para criar gr√°ficos que auxiliam na an√°lise de dados, al√©m de ser capaz de fazer previs√µes futuras a partir de machine learning.

# O dashboard est√° hospedado em:
#**https://dashboard-bcb.streamlit.app/**