In [8]:
# =============================================================================
# CÉLULA 1: IMPORTAÇÕES E CONFIGURAÇÃO INICIAL
# =============================================================================

# --- Importação das Bibliotecas Essenciais ---
import pandas as pd
import numpy as np
import os
import glob
import matplotlib.pyplot as plt
import seaborn as sns
from fpdf import FPDF
import re
from PIL import Image

print("Bibliotecas importadas com sucesso.")

# --- Definição dos Caminhos (Paths) ---
# Usando os caminhos especificados pelo usuário
output_dir = '../../analises/'
temp_img_dir = os.path.join(output_dir, 'temp_images/')

# --- Criação dos Diretórios de Saída ---
# Garante que as pastas para salvar o relatório e as imagens existam
os.makedirs(output_dir, exist_ok=True)
os.makedirs(temp_img_dir, exist_ok=True)

print(f"Diretório de saída configurado em: {os.path.abspath(output_dir)}")
print(f"Diretório de imagens temporárias configurado em: {os.path.abspath(temp_img_dir)}")



Bibliotecas importadas com sucesso.
Diretório de saída configurado em: c:\Users\pedro\OneDrive\Documentos\GitHub\Repositorio_pesquisas\analises_vitimizacao\analises
Diretório de imagens temporárias configurado em: c:\Users\pedro\OneDrive\Documentos\GitHub\Repositorio_pesquisas\analises_vitimizacao\analises\temp_images


In [9]:
# Função adaptada para ler os dados usando o arquivo de mapa
def carregar_dados_mapeados(caminhos_csv):
    """
    Carrega arquivos CSV que foram salvos com nomes de hash, utilizando um
    arquivo '_mapa_de_nomes.csv' para restaurar os nomes originais como chaves
    do dicionário.
    """
    dados = {}
    
    # Se a lista de caminhos estiver vazia, não faz nada
    if not caminhos_csv:
        print("[AVISO] Nenhuma arquivo CSV encontrado para carregar.")
        return dados

    # Pega o diretório da categoria a partir do primeiro arquivo da lista
    dir_categoria = os.path.dirname(caminhos_csv[0])
    caminho_mapa = os.path.join(dir_categoria, '_mapa_de_nomes.csv')

    # 1. Tenta carregar o arquivo de mapeamento
    try:
        print(f"\n--- Carregando dados da categoria em '{dir_categoria}' ---")
        mapa_df = pd.read_csv(caminho_mapa, sep=';', encoding='utf-8')
        print(f"[INFO] Arquivo de mapa '{caminho_mapa}' carregado com sucesso.")
    except FileNotFoundError:
        print(f"[ERRO] Arquivo de mapa '_mapa_de_nomes.csv' não encontrado em '{dir_categoria}'.")
        print("       Não é possível carregar os dados sem o mapa. Pulando esta categoria.")
        return dados
    except Exception as e:
        print(f"[ERRO] Falha ao ler o arquivo de mapa '{caminho_mapa}': {e}")
        return dados

    # 2. Itera sobre o mapa para carregar cada arquivo de dados
    for index, linha in mapa_df.iterrows():
        nome_original = linha['nome_original']
        nome_hash = linha['nome_arquivo_hash']
        
        caminho_dado = os.path.join(dir_categoria, f"{nome_hash}.csv")
        
        try:
            df = pd.read_csv(
                caminho_dado,
                sep=';',
                encoding='utf-8',
                header=0,
                index_col=0,
            )
            # Usa o NOME ORIGINAL como chave do dicionário
            dados[nome_original] = df
            print(f"  [OK] CSV para '{nome_original}' carregado com sucesso.")
        
        except FileNotFoundError:
            print(f"  [ERRO] Arquivo de dados '{caminho_dado}' não encontrado, mas listado no mapa.")
        except Exception as e:
            print(f"  [ERRO] Ao ler o arquivo de dados '{caminho_dado}': {e}")
            
    return dados

# --- SCRIPT PRINCIPAL DE CARREGAMENTO ---

# 1. Encontra todos os arquivos .csv como antes
caminho_pasta = '../../dados_tratados/PNAD_2009/csv'

agressao_paths = glob.glob(os.path.join(caminho_pasta, 'agressao/*.csv'), recursive=True)
furto_paths = glob.glob(os.path.join(caminho_pasta, 'furto/*.csv'), recursive=True)
roubo_paths = glob.glob(os.path.join(caminho_pasta, 'roubo/*.csv'), recursive=True)
roubofurto_paths = glob.glob(os.path.join(caminho_pasta, 'roubofurto/*.csv'), recursive=True)
seguranca_paths = glob.glob(os.path.join(caminho_pasta, 'seguranca/*.csv'), recursive=True)
tentativa_paths = glob.glob(os.path.join(caminho_pasta, 'tentativa/*.csv'), recursive=True)

# 2. Usa a NOVA função para carregar os dados
dados_carregados = {
    "agressao": carregar_dados_mapeados(agressao_paths),
    "furto": carregar_dados_mapeados(furto_paths),
    "roubo": carregar_dados_mapeados(roubo_paths),
    "roubofurto": carregar_dados_mapeados(roubofurto_paths),
    "seguranca": carregar_dados_mapeados(seguranca_paths),
    "tentativa": carregar_dados_mapeados(tentativa_paths)
}

print("\n\n[SUCESSO] Processo de carregamento de dados concluído.")

# 3. Verificação (opcional, mas recomendado)
# Vamos verificar as chaves carregadas para a categoria 'agressao'
print("\nVerificando as chaves (nomes dos DataFrames) carregadas para a categoria 'agressao':")
if dados_carregados['agressao']:
    print(list(dados_carregados['agressao'].keys()))
else:
    print("Nenhum dado carregado para 'agressao'.")

"""
Gere visualizações de dados a partir dos arquivos CSV anexados sobre violência (`agressao.xlsx - *.csv`).

Cada arquivo é uma tabela onde a primeira coluna é a categoria principal. Priorize a análise e criação de gráficos que explorem as relações entre:

- Tipos de **agressão** (física, psicológica, etc.).
- Comparações por **sexo** (colunas 'Homens' e 'Mulheres').
- Distribuição por **cor/raça** (colunas 'Branca', 'Preta', 'Parda', etc.).
- Recortes por **faixa etária** ou **ciclo de vida**.
- O **local da ocorrência** da agressão.

Crie gráficos de barras, de pizza e comparativos que revelem os padrões mais significativos nesses cruzamentos de dados.
"""

[AVISO] Nenhuma arquivo CSV encontrado para carregar.
[AVISO] Nenhuma arquivo CSV encontrado para carregar.
[AVISO] Nenhuma arquivo CSV encontrado para carregar.
[AVISO] Nenhuma arquivo CSV encontrado para carregar.
[AVISO] Nenhuma arquivo CSV encontrado para carregar.
[AVISO] Nenhuma arquivo CSV encontrado para carregar.


[SUCESSO] Processo de carregamento de dados concluído.

Verificando as chaves (nomes dos DataFrames) carregadas para a categoria 'agressao':
Nenhum dado carregado para 'agressao'.


"\nGere visualizações de dados a partir dos arquivos CSV anexados sobre violência (`agressao.xlsx - *.csv`).\n\nCada arquivo é uma tabela onde a primeira coluna é a categoria principal. Priorize a análise e criação de gráficos que explorem as relações entre:\n\n- Tipos de **agressão** (física, psicológica, etc.).\n- Comparações por **sexo** (colunas 'Homens' e 'Mulheres').\n- Distribuição por **cor/raça** (colunas 'Branca', 'Preta', 'Parda', etc.).\n- Recortes por **faixa etária** ou **ciclo de vida**.\n- O **local da ocorrência** da agressão.\n\nCrie gráficos de barras, de pizza e comparativos que revelem os padrões mais significativos nesses cruzamentos de dados.\n"

In [10]:
dados_carregados['agressao']['Coeficiente de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de agressão física, no período de referência de 365 dias, por sexo e cor ou raça, segundo algumas Unidades da Federação e Regiões Metropolitanas']

KeyError: 'Coeficiente de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de agressão física, no período de referência de 365 dias, por sexo e cor ou raça, segundo algumas Unidades da Federação e Regiões Metropolitanas'

In [None]:
crime_categories = {
    # CATEGORIAS DE 'tentativa.xlsx' (Tentativa de roubo/furto)
    "tentativa": [
        {
            "nome_completo": "Coeficientes de variação das estimativas de percentual de pessoas que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, na população de 10 anos ou mais de idade, por sexo e cor ou raça, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, por grupos de idade, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de percentual de pessoas que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, na população de 10 anos ou mais de idade, por classes de rendimento mensal domiciliar per capita, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, por nível de instrução, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, por condição de atividade e de ocupação na semana de referência, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade, ocupadas na semana de referência, que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, por posição na ocupação no trabalho principal, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade, ocupadas na semana de referência, que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, por grupamentos de atividade do trabalho principal, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, por sexo e cor ou raça, segundo algumas Unidades da Federação e Regiões Metropolitanas",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, por grupos de idade, segundo algumas Unidades da Federação e Regiões Metropolitanas",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de tentativa de roubo ou furto, no período de referência de 365 dias, por classes de rendimento mensal domiciliar per capita, segundo algumas Unidades da Federação e Regiões Metropolitanas",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento (2)", "superior completo ou equivalente"]
        }
    ],

    # CATEGORIAS DE 'agressao.xlsx' (Agressão física)
    "agressao": [
        {
            "nome_completo": "Coeficientes de variação das estimativas de percentual de pessoas que foram vítimas de agressão física, no período de referência de 365 dias, na população de 10 anos ou mais de idade, por sexo e cor ou raça, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "realizaram", "nao realizaram", "nao acreditavam na policia", "nao queriam envolver a policia ou medo de represalias", "outro", "superior incompleto ou equivalente", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de agressão física, no período de referência de 365 dias, por grupos de idade, segundo a situação do domicílio e as Grandes Regiões",
            "colunas": ["total", "10 a 15 anos", "16 a 24 anos", "25 a 34 anos", "35 a 49 anos", "50 a 59 anos(ou mais)", "60 a 69 anos", "70 anos ou mais"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de agressão física, no período de referência de 365 dias, por agressor na última agressão física, segundo a situação do domicílio e as Grandes Regiões",
            "colunas": ["total", "homens", "mulheres", "branca", "preta/parda"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de agressão física, no período de referência de 365 dias, por local de ocorrência da última agressão física, segundo a situação do domicílio e as Grandes Regiões",
            "colunas": ["total", "propria residencia", "via publica", "outro"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de agressão física, no período de referência de 365 dias, por procura pela polícia em decorrência da última agressão física, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "realizaram", "nao realizaram"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que não procuraram a polícia em decorrência da última agressão física que foram vítimas, no período de referência de 365 dias, por motivo de não terem procurado a polícia em decorrência da última agressão física",
            "colunas": ["total", "falta de provas", "nao era importante", "nao acreditavam na policia", "nao queriam envolver a policia ou medo de represalias", "outro"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de agressão física, no período de referência de 365 dias, por nível de instrução, segundo a situação do domicílio e as Grandes Regiões",
            "colunas": ["total", "fundamental incompleto ou equivalente", "fundamental completo ou equivalente", "médio incompleto ou equivalente", "médio completo ou equivalente", "superior incompleto ou equivalente", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de agressão física, no período de referência de 365 dias, por condição de atividade e de ocupação na semana de referência, segundo a situação do domicílio e as Grandes Regiões",
            "colunas": ["total", "economicamente ativas", "condição de ocupação na semana de referência(ocupadas)", "condição de ocupação na semana de referência(desocupadascupadas)", "nao economicamente ativas"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade, ocupadas na semana de referência, que foram vítimas de agressão física, no período de referência de 365 dias, por posição na ocupação no trabalho principal, segundo a situação do domicílio e as Grandes Regiões",
            "colunas": ["total", "empregado com carteira", "empregado sem carteira", "conta própria", "empregador", "trabalhador familiar nao remunerado"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de agressão física, no período de referência de 365 dias, por sexo e cor ou raça, segundo algumas Unidades da Federação e Regiões Metropolitanas",
            "colunas": ["total", "homens", "mulheres", "branca", "preta/parda"]
        }
    ],

    # CATEGORIAS DE 'furto.xlsx' (Furto)
    "furto": [
        {
            "nome_completo": "Coeficientes de variação das estimativas de percentual de pessoas que foram vítimas de furto, no período de referência de 365 dias, na população de 10 anos ou mais de idade, por sexo e cor ou raça, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "realizaram", "nao realizaram", "nao acreditavam na policia", "nao queriam envolver a policia ou medo de represalias", "outro", "superior incompleto ou equivalente", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de furto, no período de referência de 365 dias, por grupos de idade, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "10 a 15 anos", "16 a 24 anos", "25 a 34 anos", "35 a 49 anos", "50 a 59 anos(ou mais)", "60 a 69 anos", "70 anos ou mais"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de furto, no período de referência de 365 dias, por tipo de bem furtado no último furto, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "celular", "dinheiro", "bolsa/carteira", "joias/relógios", "veículo", "outro"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de furto, no período de referência de 365 dias, por local de ocorrência do último furto, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "propria residencia", "via publica", "outro"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de furto, no período de referência de 365 dias, por procura pela polícia em decorrência do último furto, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "realizaram", "nao realizaram"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que não procuraram a polícia em decorrência do último furto que foram vítimas, no período de referência de 365 dias, por motivo de não terem procurado a polícia em decorrência do último furto, segundo a situação do domicílio",
            "colunas": ["total", "falta de provas", "nao era importante", "nao acreditavam na policia", "nao queriam envolver a policia ou medo de represalias", "outro"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de furto, no período de referência de 365 dias, por nível de instrução, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "fundamental incompleto ou equivalente", "fundamental completo ou equivalente", "médio incompleto ou equivalente", "médio completo ou equivalente", "superior incompleto ou equivalente", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de furto, no período de referência de 365 dias, por condição de atividade e de ocupação na semana de referência, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "economicamente ativas", "condição de ocupação na semana de referência(ocupadas)", "condição de ocupação na semana de referência(desocupadascupadas)", "nao economicamente ativas"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade, ocupadas na semana de referência, que foram vítimas de furto, no período de referência de 365 dias, por posição na ocupação no trabalho principal, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "empregado com carteira", "empregado sem carteira", "conta própria", "empregador", "trabalhador familiar nao remunerado"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de furto, no período de referência de 365 dias, por sexo e cor ou raça, segundo algumas Unidades da Federação e Regiões Metropolitanas",
            "colunas": ["total", "homens", "mulheres", "branca", "preta/parda"]
        }
    ],

    # CATEGORIAS DE 'roubo.xlsx' (Roubo)
    "roubo": [
        {
            "nome_completo": "Coeficientes de variação das estimativas de percentual de pessoas que foram vítimas de roubo, no período de referência de 365 dias, na população de 10 anos ou mais de idade, por sexo e cor ou raça, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "economicamente ativas", "condição de ocupação na semana de referência(ocupadas)", "condição de ocupação na semana de referência(desocupadascupadas)", "nao economicamente ativas", "2 ou mais", "superior incompleto ou equivalente", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo, no período de referência de 365 dias, por grupos de idade, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "10 a 15 anos", "16 a 24 anos", "25 a 34 anos", "35 a 49 anos", "50 a 59 anos(ou mais)", "60 a 69 anos", "70 anos ou mais"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo, no período de referência de 365 dias, por tipo de bem roubado no último roubo, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "celular", "dinheiro", "bolsa/carteira", "joias/relógios", "veículo", "outro"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo, no período de referência de 365 dias, por local de ocorrência do último roubo, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "propria residencia", "via publica", "outro"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo, no período de referência de 365 dias, por procura pela polícia em decorrência do último roubo, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "realizaram", "nao realizaram"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que não procuraram a polícia em decorrência do último roubo que foram vítimas, no período de referência de 365 dias, por motivo de não terem procurado a polícia em decorrência do último roubo, segundo a situação do domicílio",
            "colunas": ["total", "falta de provas", "nao era importante", "nao acreditavam na policia", "nao queriam envolver a policia ou medo de represalias", "outro"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo, no período de referência de 365 dias, por nível de instrução, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "fundamental incompleto ou equivalente", "fundamental completo ou equivalente", "médio incompleto ou equivalente", "médio completo ou equivalente", "superior incompleto ou equivalente", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo, no período de referência de 365 dias, por condição de atividade e de ocupação na semana de referência, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "economicamente ativas", "condição de ocupação na semana de referência(ocupadas)", "condição de ocupação na semana de referência(desocupadascupadas)", "nao economicamente ativas"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade, ocupadas na semana de referência, que foram vítimas de roubo, no período de referência de 365 dias, por posição na ocupação no trabalho principal, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "empregado com carteira", "empregado sem carteira", "conta própria", "empregador", "trabalhador familiar nao remunerado"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo, no período de referência de 365 dias, por sexo e cor ou raça, segundo algumas Unidades da Federação e Regiões Metropolitanas",
            "colunas": ["total", "homens", "mulheres", "branca", "preta/parda"]
        }
    ],

    # CATEGORIAS DE 'roubofurto.xlsx' (Roubo ou Furto)
    "roubofurto": [
        {
            "nome_completo": "Coeficientes de variação das estimativas de percentual de pessoas que foram vítimas de roubo ou furto, no período de referência de 365 dias, na população de 10 anos ou mais de idade, por sexo e cor ou raça, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo ou furto, no período de referência de 365 dias, por grupos de idade, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo ou furto, no período de referência de 365 dias, por classes de rendimento mensal domiciliar per capita, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo ou furto, no período de referência de 365 dias, por nível de instrução, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo ou furto, no período de referência de 365 dias, por condição de atividade e de ocupação na semana de referência, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade, ocupadas na semana de referência, que foram vítimas de roubo ou furto, no período de referência de 365 dias, por posição na ocupação no trabalho principal, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade, ocupadas na semana de referência, que foram vítimas de roubo ou furto, no período de referência de 365 dias, por grupamentos de atividade do trabalho principal, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo ou furto, no período de referência de 365 dias, por sexo e cor ou raça, segundo algumas Unidades da Federação e Regiões Metropolitanas",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo ou furto, no período de referência de 365 dias, por grupos de idade, segundo algumas Unidades da Federação e Regiões Metropolitanas",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que foram vítimas de roubo ou furto, no período de referência de 365 dias, por classes de rendimento mensal domiciliar per capita, segundo algumas Unidades da Federação e Regiões Metropolitanas",
            "colunas": ["total", "agrícola", "indústria", "construção", "comércio e reparação", "serviços", "sem rendimento a menos de 1/4", "superior completo ou equivalente"]
        }
    ],
    # NOVA CATEGORIA DE 'seguranca.xlsx' (Percepção de Segurança, Medo, etc.)
    "segurança": [
        {
            "nome_completo": "Coeficientes de variação das estimativas de percentual de pessoas que se sentem seguras em seu domicílio, no período de referência de 365 dias, na população de 10 anos ou mais de idade, por sexo e cor ou raça, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "homens", "mulheres", "branca", "preta/parda", "outra", "rural", "urbana"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que sentem medo de andar sozinhas à noite em sua área, no período de referência de 365 dias, por grupos de idade, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "10 a 15 anos", "16 a 24 anos", "25 a 34 anos", "35 a 49 anos", "50 a 59 anos(ou mais)", "60 a 69 anos", "70 anos ou mais"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que consideram a polícia confiável, no período de referência de 365 dias, por nível de instrução, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "fundamental incompleto ou equivalente", "fundamental completo ou equivalente", "médio incompleto ou equivalente", "médio completo ou equivalente", "superior incompleto ou equivalente", "superior completo ou equivalente"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de percentual de domicílios que sofreram arrombamento ou tentativa de arrombamento, no período de referência de 365 dias, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "rural", "urbana", "capital", "região metropolitana", "outros municípios"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de percentual de pessoas que foram vítimas de crimes (qualquer tipo) e não reportaram à polícia, no período de referência de 365 dias, por motivo de não terem reportado, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "falta de provas", "nao era importante", "nao acreditavam na policia", "nao queriam envolver a policia ou medo de represalias", "outro"]
        },
        {
            "nome_completo": "Coeficientes de variação das estimativas de pessoas de 10 anos ou mais de idade que mudaram hábitos por medo da violência, no período de referência de 365 dias, por tipo de mudança de hábito, segundo a situação do domicílio, as Grandes Regiões e as Unidades da Federação",
            "colunas": ["total", "evitar sair a noite", "evitar certos locais", "nao usar joias/celular na rua", "nao reagir a assaltos", "outro"]
        }
    ]
}

In [None]:
# =============================================================================
# CÉLULA 3: FUNÇÕES DE ANÁLISE E GERAÇÃO DE GRÁFICOS (ATUALIZADA)
# =============================================================================


# --- Configurações dos Gráficos ---


# --- Funções de Plotagem Genéricas ---

def plot_barra_vertical(df, x_col, y_col, title, filename):
    """Gera e salva um gráfico de barras verticais."""
    plt.figure(figsize=(10, 7))
    sns.barplot(data=df, x=x_col, y=y_col, palette="viridis")
    plt.title(title, fontsize=16)
    plt.ylabel(y_col)
    plt.xlabel(x_col)
    plt.xticks(rotation=0)
    plt.tight_layout()
    filepath = os.path.join(output_dir, filename)
    plt.savefig(filepath)
    plt.close()
    print(f"Gráfico de barras salvo em: {filepath}")

def plot_pizza(df, values_col, labels_col, title, filename):
    """Gera e salva um gráfico de pizza."""
    plt.figure(figsize=(10, 10))
    # Garante que não haja valores negativos que causariam erro no gráfico de pizza
    values = df[values_col].clip(lower=0)
    plt.pie(values, labels=df[labels_col], autopct='%1.1f%%', startangle=140,
            colors=sns.color_palette("viridis", len(df)))
    plt.title(title, fontsize=16)
    plt.axis('equal')  # Assegura que o gráfico seja um círculo.
    plt.tight_layout()
    filepath = os.path.join(output_dir, filename)
    plt.savefig(filepath)
    plt.close()
    print(f"Gráfico de pizza salvo em: {filepath}")

def plot_barras_facetadas(df, x_col, y_col, title, filename, col=None, row=None):
    """Gera e salva gráficos de barras facetados (usando catplot)."""
    g = sns.catplot(data=df, x=x_col, y=y_col, col=col, row=row,
                    kind="bar", height=5, aspect=1.2, palette="viridis", errorbar=None)
    g.fig.suptitle(title, y=1.03, fontsize=16)
    g.set_xticklabels(rotation=45, ha='right')
    g.set_axis_labels(x_col, y_col)
    filepath = os.path.join(output_dir, filename)
    g.savefig(filepath)
    plt.close()
    print(f"Gráfico facetado salvo em: {filepath}")


# --- Funções de Análise Específicas para "Roubo ou Furto" ---
# Cada função gera um ou mais gráficos para uma análise específica.

def analisar_por_sexo_e_raca(df_original, crime_nome):
    """
    Gera um gráfico de barras para sexo e um de pizza para raça/cor.
    """
    print(f"--- Iniciando análise por Sexo e Raça/Cor para '{crime_nome}' ---")
    df = df_original.copy()
    
    # ATENÇÃO: Esta é uma etapa de pré-processamento crucial.
    # Assumimos que a coluna 'sexo_cor_raca' tem um formato como "Homem - Branco".
    # Se o formato for diferente, este trecho precisa ser ajustado.
    try:
        split_cols = df['sexo_cor_raca'].str.split(' - ', n=1, expand=True)
        df['sexo'] = split_cols[0]
        df['cor_raca'] = split_cols[1]
    except Exception as e:
        print(f"AVISO: Não foi possível dividir a coluna 'sexo_cor_raca'. Verifique o formato dos dados. Erro: {e}")
        # Se não for possível dividir, pula esta análise específica.
        return

    # Para simplificar a visualização em gráficos de pizza/barra, agregamos os dados.
    # Aqui, calculamos a média do coeficiente de variação para cada grupo.
    # Você pode querer usar outra métrica (soma, etc.) dependendo da sua necessidade.
    df_sexo = df.groupby('sexo')['coef_variacao'].mean().reset_index()
    df_raca = df.groupby('cor_raca')['coef_variacao'].mean().reset_index()

    # Gerar Gráfico de Barras para Sexo
    plot_barra_vertical(
        df=df_sexo,
        x_col='sexo',
        y_col='coef_variacao',
        title=f'Média do CV de Vítimas de {crime_nome} por Sexo',
        filename=f'{crime_nome}_analise_sexo.png'
    )

    # Gerar Gráfico de Pizza para Raça/Cor
    plot_pizza(
        df=df_raca,
        values_col='coef_variacao',
        labels_col='cor_raca',
        title=f'Distribuição (Média do CV) de Vítimas de {crime_nome} por Raça/Cor',
        filename=f'{crime_nome}_analise_raca_cor.png'
    )

def analisar_por_idade(df, crime_nome):
    """Gera um gráfico facetado por idade, situação de domicílio e região."""
    print(f"--- Iniciando análise por Idade para '{crime_nome}' ---")
    plot_barras_facetadas(
        df=df,
        x_col='grupo_idade',
        y_col='coef_variacao',
        col='situacao_domicilio',
        row='grande_regiao',
        title=f'CV de Vítimas de {crime_nome} por Idade, Domicílio e Grande Região',
        filename=f'{crime_nome}_analise_idade.png'
    )

def analisar_por_rendimento(df, crime_nome):
    """Gera um gráfico facetado por rendimento, situação de domicílio e região."""
    print(f"--- Iniciando análise por Rendimento para '{crime_nome}' ---")
    plot_barras_facetadas(
        df=df,
        x_col='rendimento_per_capita',
        y_col='coef_variacao',
        col='situacao_domicilio',
        row='grande_regiao',
        title=f'CV de Vítimas de {crime_nome} por Rendimento, Domicílio e Grande Região',
        filename=f'{crime_nome}_analise_rendimento.png'
    )
# ------------------------ NOVAS FUNÇÕES DE GRÁFICO ------------------------

def plot_boxplot(df, x_col, y_col, title, filename):
    """Gera e salva um boxplot."""
    plt.figure(figsize=(10, 7))
    sns.boxplot(data=df, x=x_col, y=y_col, palette="Set3")
    plt.title(title)
    plt.xticks(rotation=45)
    plt.tight_layout()
    filepath = os.path.join(output_dir, filename)
    plt.savefig(filepath)
    plt.close()
    print(f"Boxplot salvo em: {filepath}")

def plot_violinplot(df, x_col, y_col, title, filename):
    """Gera e salva um violinplot."""
    plt.figure(figsize=(10, 7))
    sns.violinplot(data=df, x=x_col, y=y_col, palette="Spectral")
    plt.title(title)
    plt.xticks(rotation=45)
    plt.tight_layout()
    filepath = os.path.join(output_dir, filename)
    plt.savefig(filepath)
    plt.close()
    print(f"Violinplot salvo em: {filepath}")

def plot_heatmap_correlacao(df, title, filename):
    """Gera e salva um heatmap de correlação das variáveis numéricas."""
    plt.figure(figsize=(12, 9))
    corr = df.corr(numeric_only=True)
    sns.heatmap(corr, annot=True, cmap='coolwarm', fmt=".2f", square=True)
    plt.title(title)
    plt.tight_layout()
    filepath = os.path.join(output_dir, filename)
    plt.savefig(filepath)
    plt.close()
    print(f"Heatmap de correlação salvo em: {filepath}")

def plot_histograma(df, coluna, title, filename, bins=20):
    """Gera e salva um histograma de uma variável numérica."""
    plt.figure(figsize=(10, 7))
    sns.histplot(data=df, x=coluna, bins=bins, kde=True, color="steelblue")
    plt.title(title)
    plt.xlabel(coluna)
    plt.ylabel("Frequência")
    plt.tight_layout()
    filepath = os.path.join(output_dir, filename)
    plt.savefig(filepath)
    plt.close()
    print(f"Histograma salvo em: {filepath}")

def plot_scatter(df, x_col, y_col, hue_col, title, filename):
    """Gera e salva um gráfico de dispersão (scatterplot)."""
    plt.figure(figsize=(10, 7))
    sns.scatterplot(data=df, x=x_col, y=y_col, hue=hue_col, palette="coolwarm")
    plt.title(title)
    plt.tight_layout()
    filepath = os.path.join(output_dir, filename)
    plt.savefig(filepath)
    plt.close()
    print(f"Scatterplot salvo em: {filepath}")

def plot_linha(df, x_col, y_col, group_col, title, filename):
    """Gera e salva um gráfico de linhas para evolução no tempo (ou ordinal)."""
    plt.figure(figsize=(10, 7))
    sns.lineplot(data=df, x=x_col, y=y_col, hue=group_col, marker='o')
    plt.title(title)
    plt.xticks(rotation=45)
    plt.tight_layout()
    filepath = os.path.join(output_dir, filename)
    plt.savefig(filepath)
    plt.close()
    print(f"Gráfico de linha salvo em: {filepath}")



print("\nScript pronto para execução. Descomente as chamadas de análise desejadas.")



Processo de geração de gráficos concluído.


In [None]:

# === CONFIGURAÇÕES ===
pdf_filename = os.path.join(output_dir, "relatorio_pnad_2009.pdf")
graficos = sorted([f for f in os.listdir(output_dir) if f.endswith(".png")])

# === CLASSE PDF ===
class PDF(FPDF):
    def header(self):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, 'Relatório Consolidado - PNAD 2009', 0, 1, 'C')
        self.ln(5)

    def footer(self):
        self.set_y(-15)
        self.set_font('Arial', 'I', 8)
        self.cell(0, 10, f'Página {self.page_no()}', 0, 0, 'C')

    def chapter_title(self, title):
        self.set_font('Arial', 'B', 14)
        self.multi_cell(0, 10, title)
        self.ln(2)

    def chapter_body(self, body):
        self.set_font('Arial', '', 12)
        self.multi_cell(0, 10, body.encode('latin-1', 'replace').decode('latin-1'))
        self.ln()

    def add_summary_page(self, title, summary_text):
        self.add_page()
        self.chapter_title(title)
        self.chapter_body(summary_text)

    def add_analysis_section(self, title, image_path, analysis_text="Análise baseada na PNAD 2009."):
        self.add_page()
        self.chapter_title(title)
        if os.path.exists(image_path):
            self.image(image_path, x=30, w=150)
            self.ln(5)
        else:
            self.set_font('Arial', 'I', 10)
            self.cell(0, 10, f"[Imagem não encontrada: {image_path}]", 0, 1)
        self.chapter_body(analysis_text)

# === TEXTO DO RESUMO ===
resumo_analise = """
A PNAD 2009 traz informações essenciais sobre segurança e vitimização no Brasil, com foco em crimes como roubo, furto, agressão e tentativa de delitos.

Esta análise visualiza as variações de indicadores como raça/cor, idade, renda, escolaridade e ocupação das vítimas, considerando domicílio urbano/rural, grandes regiões e Unidades da Federação.

O presente relatório visa facilitar o entendimento das estatísticas de vitimização, auxiliando em políticas públicas e pesquisas sociais sobre desigualdades e segurança cidadã.
"""

# === GERAÇÃO DO PDF ===
pdf = PDF()
pdf.add_summary_page("Resumo da Análise - PNAD 2009", resumo_analise)

# Adiciona gráficos ao PDF
for grafico in graficos:
    titulo = grafico.replace("_", " ").replace(".png", "").title()
    path_imagem = os.path.join(output_dir, grafico)
    pdf.add_analysis_section(titulo, path_imagem)

# Exporta o PDF
pdf.output(pdf_filename)
print(f"\nPDF gerado com sucesso: {pdf_filename}")



PDF gerado com sucesso: ../../analises/relatorio_pnad_2009.pdf


  self.set_font('Arial', 'B', 12)
  self.cell(0, 10, 'Relatório Consolidado - PNAD 2009', 0, 1, 'C')
  self.set_font('Arial', 'B', 14)
  self.set_font('Arial', '', 12)
  self.set_font('Arial', 'I', 8)
  self.cell(0, 10, f'Página {self.page_no()}', 0, 0, 'C')


In [None]:
# =============================================================================
# CÉLULA 6: LIMPEZA DOS ARQUIVOS TEMPORÁRIOS
# =============================================================================

# print("\nLimpando imagens temporárias...")
# for path in image_paths:
#     try:
#         os.remove(path)
#     except OSError as e:
#         print(f"Erro ao remover o arquivo {path}: {e.strerror}")

# # Opcional: remover o diretório de imagens temporárias se estiver vazio
# try:
#     if not os.listdir(temp_img_dir):
#         os.rmdir(temp_img_dir)
#         print("Diretório de imagens temporárias removido.")
# except OSError as e:
#     print(f"Erro ao remover o diretório {temp_img_dir}: {e.strerror}")

# print("\nProcesso finalizado.")


Limpando imagens temporárias...
Diretório de imagens temporárias removido.

Processo finalizado.
