In [None]:
# ==========================================================
# RECLASSIFICA√á√ÉO AUTOM√ÅTICA ‚Äì RESULTADO DO TAF
# Concurso PMCE / CBMCE
# ----------------------------------------------------------
# Este script:
# 1) L√™ a classifica√ß√£o original (Excel da banca)
# 2) L√™ o PDF do Resultado do TAF
# 3) Mant√©m apenas candidatos com SITUA√á√ÉO = APTO
# 4) Recalcula toda a classifica√ß√£o seguindo a l√≥gica da banca
# 5) Gera um novo arquivo Excel com a classifica√ß√£o atualizada
# ==========================================================

# ==========================================================
# INSTALA√á√ÉO DAS BIBLIOTECAS (Google Colab)
# ==========================================================
!pip install pdfplumber pandas openpyxl

import pandas as pd
import pdfplumber
from google.colab import files

# ==========================================================
# 1) ENVIO DOS ARQUIVOS
# ==========================================================
print("üìÇ Envie o arquivo Excel da classifica√ß√£o original da banca:")
uploaded_excel = files.upload()
excel_path = list(uploaded_excel.keys())[0]

print("\nüìÇ Agora envie o PDF do Resultado do TAF:")
uploaded_pdf = files.upload()
pdf_path = list(uploaded_pdf.keys())[0]

# ==========================================================
# 2) LEITURA DA CLASSIFICA√á√ÉO ORIGINAL
# ==========================================================
df_base = pd.read_excel(excel_path)

# Garantir que as colunas num√©ricas estejam no formato correto
df_base["Pedido"] = pd.to_numeric(df_base["Pedido"], errors="coerce")
df_base["Nota"] = pd.to_numeric(df_base["Nota"], errors="coerce")

# Colunas de ordena√ß√£o usadas pela banca
colunas_ordenacao = [
    "Ordena√ß√£o Geral (Todos)",
    "Ordena√ß√£o Geral (Masc)",
    "Ordena√ß√£o Geral (Fem)",
    "Ordena√ß√£o Especial (Todos)",
    "Ordena√ß√£o Especial (Masc)",
    "Ordena√ß√£o Especial (Fem)"
]

# Se alguma coluna n√£o existir no Excel, ela √© criada vazia
for col in colunas_ordenacao:
    if col not in df_base.columns:
        df_base[col] = pd.NA
    df_base[col] = pd.to_numeric(df_base[col], errors="coerce")

# ==========================================================
# 3) EXTRA√á√ÉO DOS CANDIDATOS APTOS NO TAF
# ==========================================================
def extrair_pedidos_aptos(pdf_path):
    """
    L√™ o PDF do TAF e retorna uma lista com os n√∫meros de pedido
    dos candidatos cuja SITUA√á√ÉO final seja 'Apto'.

    Observa√ß√£o:
    Mesmo que o candidato tenha sido inapto em algum exerc√≠cio,
    ele ser√° mantido se a situa√ß√£o final for 'Apto'.
    """

    pedidos = []

    with pdfplumber.open(pdf_path) as pdf:
        for pagina in pdf.pages:
            texto = pagina.extract_text()
            if not texto:
                continue

            for linha in texto.split("\n"):
                partes = linha.split()

                # Linhas v√°lidas come√ßam com o n√∫mero do pedido
                if partes and partes[0].isdigit():
                    pedido = int(partes[0])

                    # A √∫ltima coluna do PDF √© a SITUA√á√ÉO
                    situacao_final = partes[-1].strip().lower()

                    if situacao_final == "apto":
                        pedidos.append(pedido)

    # Remove duplicados preservando ordem
    return list(dict.fromkeys(pedidos))


pedidos_aptos = extrair_pedidos_aptos(pdf_path)

print(f"\nüîé Total de candidatos APTOS encontrados no PDF: {len(pedidos_aptos)}")

# Filtrar apenas candidatos aptos no TAF
df = df_base[df_base["Pedido"].isin(pedidos_aptos)].copy()

print(f"üìä Candidatos localizados no Excel e mantidos na classifica√ß√£o: {len(df)}")

# ==========================================================
# 4) IDENTIFICA√á√ÉO DO SEXO (conforme estrutura da banca)
# ==========================================================
def deduzir_sexo(row):
    """
    O sexo √© identificado verificando em quais colunas
    de ordena√ß√£o o candidato possui valor.
    """

    if pd.notna(row["Ordena√ß√£o Geral (Masc)"]):
        return "M"
    if pd.notna(row["Ordena√ß√£o Geral (Fem)"]):
        return "F"
    if pd.notna(row["Ordena√ß√£o Especial (Masc)"]):
        return "M"
    if pd.notna(row["Ordena√ß√£o Especial (Fem)"]):
        return "F"

    return pd.NA


df["Sexo"] = df.apply(deduzir_sexo, axis=1)

# ==========================================================
# 5) FUN√á√ÉO PADR√ÉO DE ORDENA√á√ÉO
# ==========================================================
def ordenar(df_local, coluna_ordenacao):
    """
    Se a coluna oficial de ordena√ß√£o existir,
    utiliza a ordena√ß√£o da banca.
    Caso contr√°rio, ordena pela Nota (maior para menor).
    """

    if df_local[coluna_ordenacao].notna().any():
        return df_local.sort_values(
            by=coluna_ordenacao,
            ascending=True,
            na_position="last"
        )

    return df_local.sort_values(
        by="Nota",
        ascending=False,
        na_position="last"
    )

# ==========================================================
# 6) RECLASSIFICA√á√ÉO ‚Äì SEGUINDO A L√ìGICA DA BANCA
# ==========================================================

# -------------------------
# GERAL ‚Äì TODOS
# -------------------------
df = ordenar(df, "Ordena√ß√£o Geral (Todos)").reset_index(drop=True)
df["Nova Ordena√ß√£o Geral (Todos)"] = df.index + 1

# -------------------------
# GERAL ‚Äì AMPLA (Masculino)
# -------------------------
df_m = df[
    (df["Sexo"] == "M") &
    (df["Segmento"].str.lower() == "ampla")
].copy()

df_m = ordenar(df_m, "Ordena√ß√£o Geral (Todos)").reset_index(drop=True)
df_m["Nova Ordena√ß√£o Geral (Masc)"] = df_m.index + 1

# -------------------------
# GERAL ‚Äì AMPLA (Feminino)
# -------------------------
df_f = df[
    (df["Sexo"] == "F") &
    (df["Segmento"].str.lower() == "ampla")
].copy()

df_f = ordenar(df_f, "Ordena√ß√£o Geral (Todos)").reset_index(drop=True)
df_f["Nova Ordena√ß√£o Geral (Fem)"] = df_f.index + 1

# Inserir no dataframe principal
df = df.merge(df_m[["Pedido", "Nova Ordena√ß√£o Geral (Masc)"]], on="Pedido", how="left")
df = df.merge(df_f[["Pedido", "Nova Ordena√ß√£o Geral (Fem)"]], on="Pedido", how="left")

# -------------------------
# ESPECIAL ‚Äì TODOS (cotistas)
# -------------------------
df_esp = df[df["Segmento"].str.lower() != "ampla"].copy()

df_esp = ordenar(df_esp, "Ordena√ß√£o Especial (Todos)").reset_index(drop=True)
df_esp["Nova Ordena√ß√£o Especial (Todos)"] = df_esp.index + 1

# Especial Masculino
df_esp_m = df_esp[df_esp["Sexo"] == "M"].copy()
df_esp_m = ordenar(df_esp_m, "Ordena√ß√£o Especial (Todos)").reset_index(drop=True)
df_esp_m["Nova Ordena√ß√£o Especial (Masc)"] = df_esp_m.index + 1

# Especial Feminino
df_esp_f = df_esp[df_esp["Sexo"] == "F"].copy()
df_esp_f = ordenar(df_esp_f, "Ordena√ß√£o Especial (Todos)").reset_index(drop=True)
df_esp_f["Nova Ordena√ß√£o Especial (Fem)"] = df_esp_f.index + 1

# Inserir no dataframe principal
df = df.merge(df_esp[["Pedido", "Nova Ordena√ß√£o Especial (Todos)"]], on="Pedido", how="left")
df = df.merge(df_esp_m[["Pedido", "Nova Ordena√ß√£o Especial (Masc)"]], on="Pedido", how="left")
df = df.merge(df_esp_f[["Pedido", "Nova Ordena√ß√£o Especial (Fem)"]], on="Pedido", how="left")

# ==========================================================
# 7) ORGANIZA√á√ÉO FINAL DA TABELA
# ==========================================================
colunas_saida = [
    "Pedido",
    "Nome",
    "Segmento",
    "Nota",
    "Sexo",
    "Nova Ordena√ß√£o Geral (Todos)",
    "Nova Ordena√ß√£o Geral (Masc)",
    "Nova Ordena√ß√£o Geral (Fem)",
    "Nova Ordena√ß√£o Especial (Todos)",
    "Nova Ordena√ß√£o Especial (Masc)",
    "Nova Ordena√ß√£o Especial (Fem)"
]

df_final = df[colunas_saida].sort_values(
    by="Nova Ordena√ß√£o Geral (Todos)"
)

# ==========================================================
# 8) RESUMO ESTAT√çSTICO
# ==========================================================
df_resumo = pd.DataFrame({
    "Indicador": [
        "Total de candidatos aptos",
        "Total Masculino",
        "Total Feminino",
        "Total Segmento Especial",
        "Total Ampla",
        "Total de pedidos capturados no PDF"
    ],
    "Valor": [
        len(df_final),
        (df_final["Sexo"] == "M").sum(),
        (df_final["Sexo"] == "F").sum(),
        (df_final["Segmento"].str.lower() != "ampla").sum(),
        (df_final["Segmento"].str.lower() == "ampla").sum(),
        len(pedidos_aptos)
    ]
})

# ==========================================================
# 9) EXPORTA√á√ÉO DO ARQUIVO FINAL
# ==========================================================
arquivo_saida = "classificacao_recalculada_taf.xlsx"

with pd.ExcelWriter(arquivo_saida, engine="openpyxl") as writer:
    df_final.to_excel(writer, sheet_name="Classifica√ß√£o", index=False)
    df_resumo.to_excel(writer, sheet_name="Resumo", index=False)

print(f"\nüíæ Arquivo gerado com sucesso: {arquivo_saida}")
files.download(arquivo_saida)