# üî¨ Ind√∫stria Microeletr√¥nica no Brasil ‚Äî An√°lise Temporal

> **TCC (2021)** ‚Äî An√°lise de s√©rie temporal dos estados brasileiros e munic√≠pios de S√£o Paulo sobre a quantidade de funcion√°rios e estabelecimentos referentes ao ramo da Microeletr√¥nica, observando mudan√ßas no per√≠odo de 2006 a 2019.

**Dados:** RAIS (Rela√ß√£o Anual de Informa√ß√µes Sociais)  
**M√©tricas analisadas:** N¬∫ de estabelecimentos e N¬∫ de empregados  
**Recortes geogr√°ficos:** Estados do Brasil e Munic√≠pios de S√£o Paulo

In [None]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from pathlib import Path

# Diret√≥rio dos dados ‚Äî ajuste conforme necess√°rio
DATA_DIR = Path("data/raw")

# Paleta de cores consistente
COLORS = px.colors.qualitative.Set2

def carregar_dados(arquivo: str, label_linha: str = "UF", remover_total: bool = True) -> pd.DataFrame:
    """
    Carrega e limpa um arquivo Excel de dados da RAIS.
    
    Par√¢metros:
        arquivo: Nome do arquivo .xlsx dentro de DATA_DIR
        label_linha: Valor da primeira coluna a ser removido ap√≥s transpor (ex: 'UF', 'Munic√≠pio-S√£o Paulo')
        remover_total: Se True, remove a coluna 'Total'
    
    Retorna:
        DataFrame com anos como √≠ndice e localidades como colunas
    """
    caminho = DATA_DIR / arquivo
    xlsx = pd.ExcelFile(caminho)
    df = pd.read_excel(xlsx, xlsx.sheet_names[0])
    
    # A primeira linha cont√©m os nomes reais das colunas
    df.columns = df.iloc[0].values.tolist()
    
    # Remove linhas de cabe√ßalho, totais e notas de rodap√©
    linhas_remover = [i for i in [0, 1, 26, 28, 29, 30, 31, 32] if i < len(df)]
    df = df.drop(linhas_remover).reset_index(drop=True)
    
    # Remove linhas extras no final (notas de rodap√©), se existirem
    df = df.dropna(how="all")
    
    # Transp√µe: localidades viram colunas, anos viram linhas
    df = df.transpose()
    df.columns = df.iloc[0].values.tolist()
    df = df.drop(label_linha)
    df = df.sort_index(ascending=True)
    
    if remover_total and "Total" in df.columns:
        df = df.drop("Total", axis=1)
    
    # Converte valores para num√©rico
    df = df.apply(pd.to_numeric, errors="coerce")
    
    return df


def plotar_serie_temporal(
    df: pd.DataFrame,
    colunas: list[str],
    titulo: str,
    ylabel: str,
    top_n: int | None = None,
) -> go.Figure:
    """
    Cria um gr√°fico de s√©rie temporal interativo com Plotly.
    
    Par√¢metros:
        df: DataFrame com anos como √≠ndice
        colunas: Lista de colunas (localidades) para plotar
        titulo: T√≠tulo do gr√°fico
        ylabel: Label do eixo Y
        top_n: Se fornecido, plota apenas as top_n primeiras colunas
    """
    cols = colunas[:top_n] if top_n else colunas
    
    fig = go.Figure()
    for i, col in enumerate(cols):
        fig.add_trace(go.Scatter(
            x=df.index,
            y=df[col],
            mode="lines+markers",
            name=col,
            marker=dict(size=8),
            line=dict(color=COLORS[i % len(COLORS)], width=2.5),
            hovertemplate=f"<b>{col}</b><br>Ano: %{{x}}<br>{ylabel}: %{{y:,.0f}}<extra></extra>",
        ))
    
    fig.update_layout(
        title=dict(text=titulo, font=dict(size=18)),
        xaxis_title="Ano",
        yaxis_title=ylabel,
        template="plotly_white",
        hovermode="x unified",
        legend=dict(
            orientation="h",
            yanchor="bottom",
            y=-0.3,
            xanchor="center",
            x=0.5,
        ),
        height=500,
        margin=dict(l=60, r=30, t=60, b=80),
    )
    
    return fig

---
## 1. Estabelecimentos por Estado

An√°lise da quantidade de estabelecimentos do setor de microeletr√¥nica por unidade federativa do Brasil.

In [None]:
estab_estados = carregar_dados("Estabelecimentos_estados.xlsx", label_linha="UF")
estab_estados


### Top 3 estados com mais estabelecimentos

In [None]:
estados = list(estab_estados.columns)

fig = plotar_serie_temporal(
    estab_estados,
    colunas=estados,
    titulo="Top 3 estados com mais estabelecimentos de microeletr√¥nica",
    ylabel="N¬∫ de Estabelecimentos",
    top_n=3,
)
fig.show()


### Todos os estados

In [None]:
fig = plotar_serie_temporal(
    estab_estados,
    colunas=estados,
    titulo="Estabelecimentos de microeletr√¥nica ‚Äî Todos os estados",
    ylabel="N¬∫ de Estabelecimentos",
)
fig.show()


---
## 2. Estabelecimentos por Munic√≠pio de S√£o Paulo

An√°lise detalhada dos munic√≠pios paulistas com maior presen√ßa de estabelecimentos do setor.

In [None]:
estab_municipios_sp = carregar_dados(
    "Analise_Estabelecimentos_3rank_municipio_sp.xlsx",
    label_linha="Munic√≠pio-S√£o Paulo",
    remover_total=False,
)
estab_municipios_sp

### Top 3 munic√≠pios de SP com mais estabelecimentos

In [None]:
municipios_sp = list(estab_municipios_sp.columns)

fig = plotar_serie_temporal(
    estab_municipios_sp,
    colunas=municipios_sp,
    titulo="Top 3 munic√≠pios de SP com mais estabelecimentos de microeletr√¥nica",
    ylabel="N¬∫ de Estabelecimentos",
    top_n=3,
)
fig.show()


### Todos os munic√≠pios de SP

In [None]:
fig = plotar_serie_temporal(
    estab_municipios_sp,
    colunas=municipios_sp,
    titulo="Estabelecimentos de microeletr√¥nica ‚Äî Munic√≠pios de SP",
    ylabel="N¬∫ de Estabelecimentos",
)
fig.show()

---
## 3. Empregados por Estado

An√°lise da quantidade de empregados no setor de microeletr√¥nica por unidade federativa.

In [None]:
empreg_estados = carregar_dados("Analise_Funcionarios_3rank_estados.xlsx", label_linha="UF")
empreg_estados


### Top 3 estados com mais empregados

In [None]:
estados_empreg = list(empreg_estados.columns)

fig = plotar_serie_temporal(
    empreg_estados,
    colunas=estados_empreg,
    titulo="Top 3 estados com mais empregados na microeletr√¥nica",
    ylabel="N¬∫ de Empregados",  # BUG CORRIGIDO: antes dizia "Estabelecimentos"
    top_n=3,
)
fig.show()

---
## 4. Empregados por Munic√≠pio de S√£o Paulo

An√°lise da quantidade de empregados no setor nos munic√≠pios paulistas.

In [None]:
empreg_municipios_sp = carregar_dados(
    "Analise_Funcionarios_3rank_municipio_sp.xlsx",
    label_linha="Munic√≠pio-S√£o Paulo",
    remover_total=False,
)
empreg_municipios_sp

In [None]:
municipios_sp_empreg = list(empreg_municipios_sp.columns)

fig = plotar_serie_temporal(
    empreg_municipios_sp,
    colunas=municipios_sp_empreg,
    titulo="Top 3 munic√≠pios de SP com mais empregados na microeletr√¥nica",
    ylabel="N¬∫ de Empregados",  # BUG CORRIGIDO: antes dizia "Estabelecimentos"
    top_n=3,
)
fig.show()

---
## üìå Pr√≥ximos Passos

- [ ] Incluir dados p√≥s-2019 (per√≠odo pand√™mico) ‚Äî fonte: RAIS/CAGED
- [ ] Adicionar mapas geogr√°ficos (choropleth por estado)
- [ ] Criar dashboard interativo com Streamlit
- [ ] Calcular taxas de crescimento (CAGR) e tend√™ncias
- [ ] Correlacionar n¬∫ de estabelecimentos √ó n¬∫ de empregados
- [ ] Contextualizar com eventos do setor (crise dos chips, pandemia)

> Veja o arquivo `MELHORIAS.md` para o plano completo de moderniza√ß√£o.