# Extração das planilhas

In [7]:
import os
from glob import glob

# Buscar todos os arquivos Excel (.xls) na pasta "Planilhas"
file_paths = glob(os.path.join(pasta, '*.xls'))

for fpath in file_paths:
    try:
        # Carregar o arquivo Excel
        xls = pd.ExcelFile(fpath)
        
        # Verificar se existe a planilha "Estoques_2000-2020"
        if "Estoques_2000-2020" in xls.sheet_names:
            df_sheet = xls.parse("Estoques_2000-2020")
            
            # Gerar nome para o CSV de saída
            base_name = os.path.splitext(os.path.basename(fpath))[0]
            csv_path = os.path.join(pasta, f"{base_name}_Estoques_2000-2020.csv")
            
            # Salvar a planilha em CSV
            df_sheet.to_csv(csv_path, index=False)
            print(f"Arquivo convertido: {csv_path}")
        else:
            print(f"Planilha 'Estoques_2000-2020' não encontrada em {fpath}")
    except Exception as e:
        print(f"Erro ao processar {fpath}: {e}")

Arquivo convertido: Planilhas\AC_Mudancas_Estoques_00_10_12_14_16_18_20_serie_revisada_Estoques_2000-2020.csv
Arquivo convertido: Planilhas\AL_Mudancas_Estoques_00_10_12_14_16_18_20_serie_revisada_Estoques_2000-2020.csv
Arquivo convertido: Planilhas\AM_Mudancas_Estoques_00_10_12_14_16_18_20_serie_revisada_Estoques_2000-2020.csv
Arquivo convertido: Planilhas\AP_Mudancas_Estoques_00_10_12_14_16_18_20_serie_revisada_Estoques_2000-2020.csv
Arquivo convertido: Planilhas\BA_Mudancas_Estoques_00_10_12_14_16_18_20_serie_revisada_Estoques_2000-2020.csv
Arquivo convertido: Planilhas\Brasil_Mudancas_Estoques_00_10_12_14_16_18_20_serie_revisada_Estoques_2000-2020.csv
Arquivo convertido: Planilhas\CE_Mudancas_Estoques_00_10_12_14_16_18_20_serie_revisada_Estoques_2000-2020.csv
Arquivo convertido: Planilhas\DF_Mudancas_Estoques_00_10_12_14_16_18_20_serie_revisada_Estoques_2000-2020.csv
Arquivo convertido: Planilhas\ES_Mudancas_Estoques_00_10_12_14_16_18_20_serie_revisada_Estoques_2000-2020.csv
Arquiv

# Extração das variáveis

In [8]:
import pandas as pd
import os
import re

# Caminho da pasta com os arquivos .xls convertidos para .csv
pasta = "CSV"

# Categorias relevantes para fuzzy multiobjetivo
categorias_fuzzy = [
    "Área Agrícola",
    "Pastagem com Manejo",
    "Vegetação Florestal",
    "Mosaico de Ocupações em Área Florestal",
    "Mosaico de Ocupações em Área Campestre",
    "Área Descoberta",
    "Área Artificial",
    "Área Úmida"
]

# Lista para guardar os dados de todos os estados
registros = []

# Percorre cada arquivo na pasta
for arquivo in os.listdir(pasta):
    if arquivo.endswith(".csv"):
        caminho_arquivo = os.path.join(pasta, arquivo)
        estado = arquivo[:2].upper()  # extrair a sigla do estado do nome do arquivo (ex: AC, BA)

        try:
            df = pd.read_csv(caminho_arquivo)
            df.rename(columns={df.columns[0]: "Indicador"}, inplace=True)

            # Identificar linha das categorias
            linha_categorias_index = df[df["Indicador"].astype(str).str.contains("Estoque", case=False, na=False)].index[0] - 1
            categorias = df.iloc[linha_categorias_index, 1:].values

            # Filtrar linhas válidas (Estoque com ano)
            linhas_estoque = df[df["Indicador"].str.contains(r"Estoque \(\d{4}\)", na=False, regex=True)]

            for _, row in linhas_estoque.iterrows():
                ano = re.findall(r"\d{4}", row["Indicador"])[0]
                valores = row[1:].values

                linha_dict = {"Estado": estado, "Ano": int(ano)}
                for cat, val in zip(categorias, valores):
                    if isinstance(cat, str) and cat.strip() in categorias_fuzzy:
                        linha_dict[cat.strip()] = val
                registros.append(linha_dict)

        except Exception as e:
            print(f"Erro ao processar {arquivo}: {e}")

# Criar DataFrame final
df_final = pd.DataFrame(registros)

# Ordenar colunas
colunas_ordenadas = ["Estado", "Ano"] + [cat for cat in categorias_fuzzy if cat in df_final.columns]
df_final = df_final[colunas_ordenadas]
df_final = df_final.sort_values(by=["Estado", "Ano"])

# Salvar como CSV limpo e pronto para fuzzy MO
df_final.to_csv("estoques_fuzzy_todos_estados.csv", index=False)
print("✅ CSV salvo como estoques_fuzzy_todos_estados.csv")


✅ CSV salvo como estoques_fuzzy_todos_estados.csv


# Normalizar INPC

In [22]:
import pandas as pd

# Passo 1: Ler o arquivo manualmente
with open("INPC.txt", "r", encoding="utf-8") as f:
    linhas = f.readlines()

# Supomos que a primeira linha seja o cabeçalho separado por vírgula
cabecalho = linhas[0].strip().split(",")
dados = []
for linha in linhas[1:]:
    # Usar split() (que separa por espaços e tabulações)
    partes = linha.strip().split()
    if len(partes) >= 2:
        dados.append(partes[:2])

# Criar o DataFrame
df = pd.DataFrame(dados, columns=cabecalho)

# Passo 2: Converter a coluna "Valor" – trocar vírgula por ponto e converter para float
df["Valor"] = df["Valor"].astype(str).str.replace(",", ".").astype(float)

# Passo 3: Converter a coluna "Data" para datetime
# Mapeamento dos meses de português para número
month_map_num = {
    'jan': '01', 'fev': '02', 'mar': '03', 'abr': '04', 'mai': '05',
    'jun': '06', 'jul': '07', 'ago': '08', 'set': '09', 'out': '10',
    'nov': '11', 'dez': '12'
}

def convert_date(date_str):
    """
    Converte uma data no formato 'abr/79' para um datetime, assumindo o dia 01.
    Se o ano for >= 50, assume 1900+ano; caso contrário, 2000+ano.
    """
    date_str = date_str.strip()
    partes = date_str.split("/")
    if len(partes) != 2:
        return pd.NaT
    mes, ano = partes[0].strip(), partes[1].strip()
    mes_num = month_map_num.get(mes.lower())
    if not mes_num:
        return pd.NaT
    try:
        ano_int = int(ano)
    except:
        return pd.NaT
    full_year = 1900 + ano_int if ano_int >= 50 else 2000 + ano_int
    data_formatada = f"01/{mes_num}/{full_year}"
    return pd.to_datetime(data_formatada, format="%d/%m/%Y", errors="coerce")

df["Data"] = df["Data"].apply(convert_date)

# Remover linhas onde a conversão falhou
df = df.dropna(subset=["Data"])

# Passo 4: Extrair o ano
df["Ano"] = df["Data"].dt.year

# Passo 5: Calcular a média do INPC por ano
df_anual = df.groupby("Ano")["Valor"].mean().reset_index()
df_anual.rename(columns={"Valor": "INPC_Medio"}, inplace=True)

# Exibir os anos disponíveis para diagnóstico
print("Anos disponíveis:", df_anual["Ano"].tolist())

# Passo 6: Filtrar os anos que interessam (por exemplo, os anos dos estoques)
anos_estoques = [2000, 2010, 2012, 2014, 2016, 2018, 2020]
df_alinhado = df_anual[df_anual["Ano"].isin(anos_estoques)]

# Se não houver nenhum ano de interesse, salva todos os anos (para diagnóstico)
if df_alinhado.empty:
    print("Nenhum dos anos especificados foi encontrado; salvando todos os anos disponíveis.")
    df_alinhado = df_anual

# Passo 7: Salvar o resultado em CSV
df_alinhado.to_csv("inpc_alinhado_com_estoques.csv", index=False)
print("✅ Arquivo gerado: inpc_alinhado_com_estoques.csv")
print(df_alinhado)


Anos disponíveis: [1979, 1980, 1981, 1982, 1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990, 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021, 2022, 2023, 2024]
✅ Arquivo gerado: inpc_alinhado_com_estoques.csv
     Ano  INPC_Medio
21  2000    0.430000
31  2010    0.524167
33  2012    0.502500
35  2014    0.505000
37  2016    0.533333
39  2018    0.282500
41  2020    0.444167


# Normalização e Calculo das funções Fuzzy

In [None]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# Carregar a base de dados dos estoques de uso da terra
# O arquivo deve conter as colunas "Estado", "Ano" e as variáveis dos estoques
df = pd.read_csv("estoques_fuzzy_todos_estados.csv")  # Substitua pelo nome do seu arquivo

# Definir os critérios relevantes para o modelo fuzzy multiobjetivo
criterios = [
    "Área Agrícola",
    "Pastagem com Manejo",
    "Vegetação Florestal",
    "Mosaico de Ocupações em Área Florestal",
    "Mosaico de Ocupações em Área Campestre",
    "Área Descoberta",
    "Área Artificial",
    "Área Úmida"
]

# Definir o objetivo para cada critério:
# "max" indica que queremos maximizar o valor (quanto maior, melhor)
# "min" indica que queremos minimizar o valor (quanto menor, melhor)
objetivos = {
    "Área Agrícola": "max",
    "Pastagem com Manejo": "min",
    "Vegetação Florestal": "max",
    "Mosaico de Ocupações em Área Florestal": "max",
    "Mosaico de Ocupações em Área Campestre": "max",
    "Área Descoberta": "min",
    "Área Artificial": "min",
    "Área Úmida": "max"
}

# Criar uma cópia do DataFrame para aplicar a normalização sem alterar o original
df_norm = df.copy()

# Instanciar o normalizador Min-Max para ajustar os valores entre 0 e 1
scaler = MinMaxScaler()

# Aplicar a normalização para todas as colunas dos critérios
# Isso converte os valores absolutos (em km²) para uma escala de 0 a 1
df_norm[criterios] = scaler.fit_transform(df[criterios])

# Calcular a fuzzy membership (grau de pertinência, µ) para cada critério:
# Se o objetivo é maximizar, usamos o valor normalizado.
# Se o objetivo é minimizar, usamos o complemento (1 - valor normalizado).
for crit in criterios:
    if objetivos[crit] == "max":
        # Para critérios a maximizar, o valor normalizado é o grau de pertinência
        df_norm[crit + "_mu"] = df_norm[crit]
    else:
        # Para critérios a minimizar, definimos µ como 1 - valor normalizado
        df_norm[crit + "_mu"] = 1 - df_norm[crit]
        
# Definir a não-pertinência (ν) e hesitação (π) de forma simples:
# Aqui, ν é o complemento de µ, e π é definido como 0 (sem incerteza adicional)
for crit in criterios:
    df_norm[crit + "_nu"] = 1 - df_norm[crit + "_mu"]
    df_norm[crit + "_pi"] = 0  # Poderíamos ajustar se tivéssemos uma medida de incerteza

# Agregar os valores fuzzy em um índice global.
# Neste exemplo, calculamos a média simples dos graus de pertinência (µ) para todos os critérios.
# Esse índice global serve como o "fuzzy score" da alternativa.
df_norm["Fuzzy_Score"] = df_norm[[crit + "_mu" for crit in criterios]].mean(axis=1)

# Ordenar os dados de forma decrescente, de modo que as alternativas com maior fuzzy score apareçam primeiro
df_norm = df_norm.sort_values(by="Fuzzy_Score", ascending=False)

# Selecionar as colunas que serão exibidas no resultado final:
# "Estado", "Ano", o fuzzy score global e os valores µ para cada critério
colunas_resultado = ["Estado", "Ano", "Fuzzy_Score"] + [crit + "_mu" for crit in criterios]
resultado = df_norm[colunas_resultado]

# Salvar o resultado final em um CSV para análise posterior
resultado.to_csv("fuzzy_model_resultado.csv", index=False)

# Imprimir uma mensagem de confirmação e exibir as primeiras linhas do resultado
print("✅ Resultado do modelo fuzzy salvo em fuzzy_model_resultado.csv")
print(resultado.head())


✅ Resultado do modelo fuzzy salvo em fuzzy_model_resultado.csv
   Estado   Ano  Fuzzy_Score  Área Agrícola_mu  Pastagem com Manejo_mu  \
35     BR  2000     0.614753          0.666241                0.218208   
41     BR  2020     0.613741          1.000000                0.000000   
39     BR  2016     0.609975          0.934488                0.011766   
40     BR  2018     0.609237          0.964993                0.006200   
38     BR  2014     0.605333          0.906709                0.007410   

    Vegetação Florestal_mu  Mosaico de Ocupações em Área Florestal_mu  \
35                1.000000                                   1.000000   
41                0.920615                                   0.972096   
39                0.925846                                   0.994539   
40                0.923918                                   0.981723   
38                0.931974                                   0.975747   

    Mosaico de Ocupações em Área Campestre_mu  Área D

# Análise dos perfis

In [2]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# Carregar a base dos estoques (assegure-se de que o arquivo contenha as colunas:
# "Estado", "Ano", "Área Agrícola", "Pastagem com Manejo", "Vegetação Florestal",
# "Mosaico de Ocupações em Área Florestal", "Mosaico de Ocupações em Área Campestre",
# "Área Descoberta", "Área Artificial" e "Área Úmida")
df = pd.read_csv("estoques_fuzzy_todos_estados.csv")

# Lista dos critérios a serem usados
criterios = [
    "Área Agrícola",
    "Pastagem com Manejo",
    "Vegetação Florestal",
    "Mosaico de Ocupações em Área Florestal",
    "Mosaico de Ocupações em Área Campestre",
    "Área Descoberta",
    "Área Artificial",
    "Área Úmida"
]

# Definir o objetivo de cada critério:
# "max" significa que quanto maior o valor, melhor (ex.: Vegetação Florestal)
# "min" significa que quanto menor o valor, melhor (ex.: Pastagem com Manejo, Área Artificial)
objetivos = {
    "Área Agrícola": "max",
    "Pastagem com Manejo": "min",
    "Vegetação Florestal": "max",
    "Mosaico de Ocupações em Área Florestal": "max",
    "Mosaico de Ocupações em Área Campestre": "max",
    "Área Descoberta": "min",
    "Área Artificial": "min",
    "Área Úmida": "max"
}

# -----------------------------
# PASSO 1: Normalização
# -----------------------------
# Cria uma cópia dos dados para normalizar os critérios sem alterar o original
df_norm = df.copy()

# Normaliza os dados dos critérios para a escala 0 a 1 (Min-Max)
scaler = MinMaxScaler()
df_norm[criterios] = scaler.fit_transform(df[criterios])

# -----------------------------
# PASSO 2: Cálculo da Função Fuzzy (grau de pertinência, µ)
# -----------------------------
# Para cada critério, se o objetivo é "max", então µ = valor normalizado;
# se "min", então µ = 1 - valor normalizado.
for crit in criterios:
    if objetivos[crit] == "max":
        df_norm[crit + "_mu"] = df_norm[crit]
    else:
        df_norm[crit + "_mu"] = 1 - df_norm[crit]
        
# (Opcional) Definindo não-pertinência (ν) como complemento de µ e hesitação (π) como 0.
for crit in criterios:
    df_norm[crit + "_nu"] = 1 - df_norm[crit + "_mu"]
    df_norm[crit + "_pi"] = 0  # Poderia ser ajustado se houvesse informação de incerteza

# -----------------------------
# PASSO 3: Definir os 4 perfis com pesos diferentes
# -----------------------------
# Perfil Conservador: valoriza a sustentabilidade, preservação ambiental e diversidade de uso.
perfil_conservador = {
    "Área Agrícola": 0.10,
    "Pastagem com Manejo": 0.10,
    "Vegetação Florestal": 0.30,
    "Mosaico de Ocupações em Área Florestal": 0.15,
    "Mosaico de Ocupações em Área Campestre": 0.15,
    "Área Descoberta": 0.05,
    "Área Artificial": 0.05,
    "Área Úmida": 0.10
}

# Perfil Produtivista: prioriza a produção, principalmente a área agrícola.
perfil_produtivista = {
    "Área Agrícola": 0.40,
    "Pastagem com Manejo": 0.10,
    "Vegetação Florestal": 0.10,
    "Mosaico de Ocupações em Área Florestal": 0.10,
    "Mosaico de Ocupações em Área Campestre": 0.10,
    "Área Descoberta": 0.05,
    "Área Artificial": 0.05,
    "Área Úmida": 0.10
}

# Perfil Especulativo: foca em identificar concentração de terra (alta pastagem e alta área artificial)
perfil_especulativo = {
    "Área Agrícola": 0.15,
    "Pastagem com Manejo": 0.30,
    "Vegetação Florestal": 0.10,
    "Mosaico de Ocupações em Área Florestal": 0.10,
    "Mosaico de Ocupações em Área Campestre": 0.10,
    "Área Descoberta": 0.05,
    "Área Artificial": 0.15,
    "Área Úmida": 0.05
}

# Perfil Exportador: foca na produção para exportação (alta área agrícola e redução da vegetação nativa)
perfil_exportador = {
    "Área Agrícola": 0.40,
    "Pastagem com Manejo": 0.05,
    "Vegetação Florestal": 0.05,
    "Mosaico de Ocupações em Área Florestal": 0.10,
    "Mosaico de Ocupações em Área Campestre": 0.10,
    "Área Descoberta": 0.05,
    "Área Artificial": 0.05,
    "Área Úmida": 0.20
}

# Agrupar os perfis num dicionário
perfis = {
    "perfil_conservador": perfil_conservador,
    "perfil_produtivista": perfil_produtivista,
    "perfil_especulativo": perfil_especulativo,
    "perfil_exportador": perfil_exportador
}

# -----------------------------
# PASSO 4: Cálculo do Fuzzy Score Ponderado para cada perfil
# -----------------------------
# Para cada perfil, o Fuzzy Score é calculado como a média ponderada dos valores de µ para cada critério.
for perfil, pesos in perfis.items():
    # Para cada linha, calcula a soma dos produtos (peso * µ) e divide pela soma dos pesos (que é 1, mas fazemos para manter a consistência)
    df_norm[perfil + "_Fuzzy_Score"] = df_norm.apply(
        lambda row: sum(row[crit + "_mu"] * pesos[crit] for crit in criterios) / sum(pesos.values()),
        axis=1
    )

# -----------------------------
# PASSO 5: Selecionar e salvar os resultados finais
# -----------------------------
# Seleciona as colunas "Estado", "Ano" e os fuzzy scores de cada perfil
colunas_resultado = ["Estado", "Ano"] + [perfil + "_Fuzzy_Score" for perfil in perfis.keys()]
resultado = df_norm[colunas_resultado]

# Ordena o resultado, por exemplo, usando o fuzzy score do perfil conservador
resultado = resultado.sort_values(by="perfil_conservador_Fuzzy_Score", ascending=False)

# Salvar o resultado final em um CSV para análise
resultado.to_csv("fuzzy_model_resultado_perfis.csv", index=False)
print("✅ Resultado do modelo fuzzy com 4 perfis salvo em fuzzy_model_resultado_perfis.csv")
print(resultado.head())


✅ Resultado do modelo fuzzy com 4 perfis salvo em fuzzy_model_resultado_perfis.csv
   Estado   Ano  perfil_conservador_Fuzzy_Score  \
35     BR  2000                        0.781884   
41     BR  2020                        0.772413   
39     BR  2016                        0.772059   
40     BR  2018                        0.771142   
38     BR  2014                        0.767145   

    perfil_produtivista_Fuzzy_Score  perfil_especulativo_Fuzzy_Score  \
35                         0.685876                         0.522714   
41                         0.789685                         0.492561   
39                         0.767578                         0.487695   
40                         0.776887                         0.486909   
38                         0.754522                         0.481677   

    perfil_exportador_Fuzzy_Score  
35                       0.724966  
41                       0.842760  
39                       0.820653  
40                       0.830323

# Resultados

In [7]:
import pandas as pd

# Carregar o CSV com os fuzzy scores
df = pd.read_csv("fuzzy_model_resultado_perfis.csv")

# Excluir registros de "BR" ou "Brasil" para considerar somente os estados individuais
df = df[~df["Estado"].isin(["BR", "Brasil"])]

# Lista dos nomes dos perfis (colunas de fuzzy score)
profiles = [
    "perfil_conservador_Fuzzy_Score", 
    "perfil_produtivista_Fuzzy_Score", 
    "perfil_especulativo_Fuzzy_Score", 
    "perfil_exportador_Fuzzy_Score"
]

# Dicionário para armazenar os melhores resultados por estado para cada perfil
best_by_profile = {}

# Para cada perfil, vamos agrupar por Estado e pegar a linha com o maior fuzzy score
for profile in profiles:
    # Para cada estado, pega o índice da linha com o máximo valor no perfil
    # Isso retornará, para cada estado, a linha (que contém o Ano e o fuzzy score) em que o valor é máximo.
    best = df.loc[df.groupby("Estado")[profile].idxmax()].copy()
    # Renomeia as colunas "Ano" e o fuzzy score para identificá-los no resultado combinado
    best = best[["Estado", "Ano", profile]]
    new_year_col = "Ano_" + profile.split("_")[1].lower()  # exemplo: "Ano_conservador"
    new_score_col = profile  # mantém o nome do fuzzy score
    best.rename(columns={"Ano": new_year_col, profile: new_score_col}, inplace=True)
    
    best_by_profile[profile] = best

# Agora, vamos unir os resultados de todos os perfis usando somente "Estado" como chave.
# Começamos com o DataFrame de um dos perfis e fazemos merge com os demais.
df_combined = best_by_profile[profiles[0]]
for profile in profiles[1:]:
    df_combined = pd.merge(df_combined, best_by_profile[profile], on="Estado", how="outer")

# Ordena o DataFrame combinado por um dos os fuzzy scores, se desejar (por exemplo, perfil conservador)
df_combined.sort_values(by="perfil_conservador_Fuzzy_Score", ascending=False, inplace=True)

# Exibe o resultado combinado
print("Ranking combinado - Melhor ano e fuzzy score por estado para cada perfil:")
print(df_combined)

# Salva o resultado combinado em um CSV
df_combined.to_csv("ranking_combinado_por_perfil.csv", index=False)
print("✅ Ranking combinado salvo em ranking_combinado_por_perfil.csv")


Ranking combinado - Melhor ano e fuzzy score por estado para cada perfil:
   Estado  Ano_conservador  perfil_conservador_Fuzzy_Score  Ano_produtivista  \
2      AM             2010                        0.331360              2012   
13     PA             2000                        0.286731              2000   
12     MT             2000                        0.258977              2020   
4      BA             2016                        0.256479              2020   
10     MG             2020                        0.245505              2020   
21     RR             2020                        0.228129              2020   
17     PR             2000                        0.221211              2018   
25     SP             2020                        0.217292              2020   
22     RS             2016                        0.217054              2020   
9      MA             2000                        0.216419              2020   
16     PI             2020                    