In [1]:
import cartolafc
import pandas as pd
from difflib import get_close_matches
import json, re
from pathlib import Path
from bs4 import BeautifulSoup

pd.set_option('display.max_columns', 50)            # permite a visualização de 50 colunas do dataframe
pd.options.display.float_format = '{:.2f}'.format   # pandas: para todos os números aparecerem com duas casas decimais

# Cria uma instância da API
api = cartolafc.Api(attempts=5)

2025-08-19 14:01:42,468 - numexpr.utils - INFO - NumExpr defaulting to 8 threads.


In [2]:
# Carregar o arquivo CSV
df_times = pd.read_excel("times.xlsx")

# Ver os dados carregados
display(df_times.head())

Unnamed: 0,Nome
0,A Lenda Super Vascão f.c
1,A Lenda Super Vasco F.c
2,Analove10 ITAQUI GRANDE!!
3,BordonFC
4,BORGES ITAQUI F.C.


In [3]:
# 👉 ajuste o caminho do HTML salvo
HTML_PATH = Path("pagina_liga_serie_B.html")

# carrega html
html = HTML_PATH.read_text(encoding="utf-8", errors="ignore")
soup = BeautifulSoup(html, "html.parser")

# 1) seletor principal dessa página
nomes = [el.get_text(strip=True) for el in soup.select("p.card-participantes-pontos-corridos__time")]

# 2) fallbacks (caso salve outra variante da página)
if not nomes:
    nomes = [el.get_text(strip=True) for el in soup.select("p.nome-time")]
if not nomes:
    nomes = [(a.get("title") or a.get_text(strip=True)).strip()
             for a in soup.select("a.link-perfil-time") if (a.get("title") or a.get_text(strip=True))]

# 3) fallback final via regex (se o HTML veio “achatado”)
if not nomes:
    for m in re.finditer(r'class="card-participantes-pontos-corridos__time"\s*>\s*([^<]+)<', html, re.I):
        nomes.append(m.group(1).strip())

# dedup + ordena alfabética
visto, times = set(), []
for n in nomes:
    n = re.sub(r"\s+", " ", n).strip()
    if n and n not in visto:
        visto.add(n); times.append(n)
times.sort(key=str.casefold)

print(f"{len(times)} times encontrados")
print(times)

# snippet JS ao lado do HTML (se quiser usar no site)
OUT_JS = HTML_PATH.with_name("participantesLiga_serie_B.js")
OUT_JS.write_text("window.participantesLiga = " + json.dumps(times, ensure_ascii=False, indent=2) + ";\n",
                  encoding="utf-8")
print(f"Snippet salvo em: {OUT_JS}")

20 times encontrados
['BORGES ITAQUI F.C.', 'cartola scheuer', 'Dom Camillo68', 'FBC Colorado', 'Fedato Futebol Clube', 'Gremiomaniasm', 'JV5 Tricolor Gaúcho', 'lsauer fc', 'MauHumor F.C.', 'Noah A 10', 'pura bucha /botafogo', 'PUXE FC', 'Real SCI', 'seralex', 'Sport Clube PAIM', 'Tabajara de Inhaua PB7', 'Tatols Beants F.C', 'Texas Club 2025', 'TIGRE LEON', 'TURNOLANDIA FC25']
Snippet salvo em: participantesLiga_serie_B.js


In [4]:
JS_PATH = Path("participantesLiga_serie_B.js")  # ajuste o caminho se estiver em outra pasta

# extrai o array do snippet: window.participantesLiga = [ ... ];
m = re.search(r'window\.participantesLiga\s*=\s*(\[[\s\S]*?\])\s*;', JS_PATH.read_text(encoding="utf-8"))
if not m:
    raise ValueError(f"Não consegui achar a lista dentro de {JS_PATH}")

nomes_times = json.loads(m.group(1))

# (opcional) dedup + ordena
nomes_times = sorted(dict.fromkeys(nomes_times), key=str.casefold)

print(len(nomes_times), "times")
nomes_times

20 times


['BORGES ITAQUI F.C.',
 'cartola scheuer',
 'Dom Camillo68',
 'FBC Colorado',
 'Fedato Futebol Clube',
 'Gremiomaniasm',
 'JV5 Tricolor Gaúcho',
 'lsauer fc',
 'MauHumor F.C.',
 'Noah A 10',
 'pura bucha /botafogo',
 'PUXE FC',
 'Real SCI',
 'seralex',
 'Sport Clube PAIM',
 'Tabajara de Inhaua PB7',
 'Tatols Beants F.C',
 'Texas Club 2025',
 'TIGRE LEON',
 'TURNOLANDIA FC25']

### Buscar IDs dos times no Cartola

In [5]:
# nomes_times = [ 'FBC Colorado', 'Gremiomaniasm', 'Sport Clube PAIM', 'Texas Club 2025', 'JV5 Tricolor Gaúcho', 
#                 'Real SCI', 'TIGRE LEON', 'PUXE FC', 'cartola scheuer', 'BORGES ITAQUI F.C.', 
#                 'Fedato Futebol Clube', 'Dom Camillo68', 'MauHumor F.C.', 'seralex', 'lsauer fc',
#                 'Tabajara de Inhaua PB7', 'TURNOLANDIA FC25', 'Noah A 10',  ]

# Dicionário para armazenar os IDs dos times
ids_times = {}

# Função robusta para buscar ID do time por nome
from difflib import get_close_matches

def buscar_id_time(nome_time):
    try:
        times = api.times(query=nome_time)

        # 🛡️ Proteção caso a resposta seja uma string (ex: erro HTML ou mensagem)
        if not isinstance(times, list):
            print(f"⚠️ Resposta inesperada para '{nome_time}':", times)
            return None

        nomes_api = [time.nome for time in times]

        # Comparação flexível (removendo acentos, pontos, etc)
        nome_base = nome_time.lower().replace(".", "").replace("fc", "").replace("f.c", "").strip()
        nomes_api_base = [n.lower().replace(".", "").replace("fc", "").replace("f.c", "").strip() for n in nomes_api]

        nome_proximo = get_close_matches(nome_base, nomes_api_base, n=1, cutoff=0.6)

        if nome_proximo:
            idx = nomes_api_base.index(nome_proximo[0])
            return times[idx].id

    except Exception as e:
        print(f"❌ Erro ao buscar ID para o time '{nome_time}': {e}")
    return None


# Buscar IDs automaticamente, sem sobrescrever os que já estiverem no dicionário
nao_encontrados = []

for nome in nomes_times:
    if nome not in ids_times:  # Protege os manuais
        time_id = buscar_id_time(nome)
        if time_id:
            ids_times[nome] = time_id
        else:
            nao_encontrados.append(nome)

# Mostrar resultado
print("IDs encontrados:", len(ids_times))
print("Times não encontrados automaticamente:", nao_encontrados)

IDs encontrados: 20
Times não encontrados automaticamente: []


### Gerar DataFrame com nome do time, ID e URL

In [6]:
# Gerar DataFrame com nome do time, ID e URL
df_urls = pd.DataFrame([
    {"Nome do Time": nome, "ID do Time": time_id, "Link do Time": f"https://cartola.globo.com/#!/time/{time_id}"}
    for nome, time_id in ids_times.items()
])

# Caminho e nome do arquivo Excel
caminho_excel = "links_times_cartola_liga_serie_B.xlsx"

# Salvar o DataFrame em Excel
df_urls.to_excel(caminho_excel, index=False)

print(f"✅ Arquivo salvo com sucesso: {caminho_excel}")


# Exibir como tabela
display(df_urls.head(30))

✅ Arquivo salvo com sucesso: links_times_cartola_liga_serie_B.xlsx


Unnamed: 0,Nome do Time,ID do Time,Link do Time
0,BORGES ITAQUI F.C.,3914981,https://cartola.globo.com/#!/time/3914981
1,cartola scheuer,3851966,https://cartola.globo.com/#!/time/3851966
2,Dom Camillo68,20696550,https://cartola.globo.com/#!/time/20696550
3,FBC Colorado,186283,https://cartola.globo.com/#!/time/186283
4,Fedato Futebol Clube,18642587,https://cartola.globo.com/#!/time/18642587
5,Gremiomaniasm,528730,https://cartola.globo.com/#!/time/528730
6,JV5 Tricolor Gaúcho,1747619,https://cartola.globo.com/#!/time/1747619
7,lsauer fc,44810918,https://cartola.globo.com/#!/time/44810918
8,MauHumor F.C.,25751748,https://cartola.globo.com/#!/time/25751748
9,Noah A 10,49960687,https://cartola.globo.com/#!/time/49960687


### Gerar o dicionário ID -> Nome do Time

In [7]:
# Gerar o dicionário ID -> Nome do Time
nomes_por_id = dict(zip(df_urls["ID do Time"], df_urls["Nome do Time"]))

# Mostrar parte do dicionário
dict(list(nomes_por_id.items())[:5])

{3914981: 'BORGES ITAQUI F.C.',
 3851966: 'cartola scheuer',
 20696550: 'Dom Camillo68',
 186283: 'FBC Colorado',
 18642587: 'Fedato Futebol Clube'}

In [8]:
# ===============================
#  LIGA (2º TURNO) COM PARCIAIS DA RODADA EM ANDAMENTO
# ===============================
import time, json, requests, pandas as pd

# -------- CONFIG --------
TURNO_INICIO   = 20      # início do 2º turno
TOTAL_RODADAS  = 19      # quantidade de rodadas no 2º turno (20..38)
TURNO_FIM      = TURNO_INICIO + TOTAL_RODADAS - 1  # = 38
CAP_MULT       = 1.5     # multiplicador do capitão nas parciais
SLEEP_REQ      = 0.9     # pausa anti-rate-limit
MAX_RETRIES    = 3

# -------- CartolaFCError (fallback) --------
try:
    from cartolafc import CartolaFCError as _CartolaErr
except Exception:
    _CartolaErr = Exception

# -------- Sessão HTTP (para endpoints públicos) --------
sess = requests.Session()
sess.headers.update({
    "User-Agent": "Mozilla/5.0",
    "Accept": "application/json, text/plain, */*",
})

def http_status_e_rodada():
    """Retorna (status_mercado, rodada_http) via endpoint público."""
    r = sess.get("https://api.cartola.globo.com/mercado/status", timeout=20)
    r.raise_for_status()
    d = r.json()
    return int(d.get("status_mercado", 0)), int(d.get("rodada_atual", 0))

def get_parciais():
    r = sess.get("https://api.cartola.globo.com/atletas/pontuados", timeout=30)
    r.raise_for_status()
    return r.json().get("atletas", {})

def get_escalacao_por_rodada_http_dbg(time_id: int, rodada: int, max_retries=MAX_RETRIES):
    """
    Busca a escalação travada na rodada; se não vier, cai para 'última escalação'.
    Retorna: (atletas:list, capitao_id:int|None, http_status:int|None, motivo:str|None)
    """
    urls = [
        f"https://api.cartola.globo.com/time/id/{time_id}/{rodada}",
        f"https://api.cartola.globo.com/time/id/{time_id}",
    ]
    last_err = None
    for url in urls:
        wait = 0.7
        for _ in range(max_retries):
            try:
                r = sess.get(url, timeout=30)
                st = r.status_code
                if st == 200:
                    d = r.json()
                    atletas = d.get("atletas") or []
                    return atletas, d.get("capitao_id"), st, (None if atletas else "sem_atletas")
                if st in (403, 429, 503):
                    time.sleep(wait); wait *= 1.8; continue
                last_err = f"status={st}"
                break
            except Exception as e:
                last_err = f"exc:{type(e).__name__}"
                time.sleep(wait); wait *= 1.8
    return [], None, None, last_err

# -------- Regras de começo --------
def campeonato_comecou(api, ids_times):
    """
    Considera que o 2º turno começou se:
      - mercado indica rodada_atual >= TURNO_INICIO, e
      - há pelo menos uma pontuação não-nula na rodada TURNO_INICIO para algum time.
    """
    try:
        rodada_atual = getattr(api.mercado(), "rodada_atual", None)
    except _CartolaErr:
        rodada_atual = None

    if rodada_atual is None or rodada_atual < TURNO_INICIO:
        return False

    for time_id in ids_times.values():
        try:
            p = api.time(time_id=time_id, rodada=TURNO_INICIO).ultima_pontuacao
            if p is not None:
                return True
        except _CartolaErr:
            continue
    return False

def obter_pontuacao_por_rodada(api, time_id, rodada_atual):
    """
    Busca apenas rodadas concluídas: [TURNO_INICIO, rodada_atual-1].
    """
    pontuacoes = {}
    # fim exclusivo (rodada_atual não encerrada)
    fim_exclusivo = min(max(rodada_atual, TURNO_INICIO), TURNO_FIM + 1)
    for rodada in range(TURNO_INICIO, fim_exclusivo):
        try:
            time_r = api.time(time_id=time_id, rodada=rodada)
            pontuacoes[rodada] = time_r.ultima_pontuacao
        except _CartolaErr as e:
            print(f"⚠️ Erro ao acessar rodada {rodada} (time {time_id}): {e}")
            pontuacoes[rodada] = None
    return pontuacoes

def gerar_df_pontuacoes(api, ids_times):
    # 1) Colunas do turno (20..38)
    colunas_turno = [f"Rodada {i}" for i in range(TURNO_INICIO, TURNO_FIM + 1)]

    # 2) Rodada atual via lib + status via HTTP
    try:
        rodada_atual_api = api.mercado().rodada_atual
    except _CartolaErr:
        rodada_atual_api = TURNO_INICIO
    status_http, rodada_http = http_status_e_rodada()
    rodada_ref = rodada_http if rodada_http else rodada_atual_api
    print(f"Status HTTP={status_http} | rodada_http={rodada_http} | rodada_api={rodada_atual_api} | usando rodada_ref={rodada_ref}")

    # 3) Se turno ainda não começou, placeholders 0
    if not campeonato_comecou(api, ids_times):
        print("📌 2º Turno ainda não começou. Criando estrutura com placeholders (0).")
        return pd.DataFrame(0, index=list(ids_times.keys()), columns=colunas_turno)

    # 4) Monta DF com rodadas ENCERRADAS
    dados = {}
    for nome, time_id in ids_times.items():
        pontuacoes = obter_pontuacao_por_rodada(api, int(time_id), rodada_atual_api)
        s = pd.Series({f"Rodada {k}": v for k, v in pontuacoes.items()})
        dados[nome] = s


    df = pd.DataFrame.from_dict(dados, orient="index")
    df = df.reindex(columns=colunas_turno)              # mantém ausentes como NaN
    df = df.apply(pd.to_numeric, errors="coerce")       # continua numérico, mas preserva NaN


    # --- SANITY CHECK: só 20..38 mesmo ---
    colunas_ok = [f"Rodada {i}" for i in range(TURNO_INICIO, TURNO_FIM + 1)]
    colunas_ruins = [c for c in df.columns if c.startswith("Rodada ") and int(c.split()[1]) < TURNO_INICIO]
    if colunas_ruins:
        df = df.drop(columns=colunas_ruins, errors="ignore")
    df = df.reindex(columns=colunas_ok)  # <- sem fill_value aqui também


    # 5) Injeta PARCIAIS na rodada em andamento (se status==2 e dentro do turno)
    if status_http == 2 and TURNO_INICIO <= rodada_ref <= TURNO_FIM:
        col_atual = f"Rodada {rodada_ref}"
        print(f"🟡 Rodada {rodada_ref} em andamento — aplicando parciais…")
        parciais_map = get_parciais()
        if not parciais_map:
            print("⚠️ Endpoint de parciais vazio no momento. Mantendo valores anteriores.")
        else:
            atualizados, rel = 0, []
            for nome_time, time_id in ids_times.items():
                try:
                    atletas, capitao_id, http_st, motivo = get_escalacao_por_rodada_http_dbg(int(time_id), rodada_ref)

                    # Fallback via lib se vier "sem atletas"
                    if not atletas and (motivo in ("sem_atletas", "sem_escalacao", None)):
                        try:
                            t = api.time(time_id=int(time_id), rodada=rodada_ref)
                            atletas = [{"atleta_id": a.atleta_id} for a in (getattr(t, "atletas", None) or [])]
                            if not capitao_id:
                                capitao_id = getattr(t, "capitao_id", None)
                            http_st = http_st or 200
                        except Exception:
                            pass

                    total, matched = 0.0, 0
                    for a in (atletas or []):
                        aid = str(a.get("atleta_id"))
                        if aid in parciais_map:
                            p = float(parciais_map[aid].get("pontuacao", 0) or 0)
                            if capitao_id and a.get("atleta_id") == capitao_id:
                                p *= CAP_MULT
                            total += p
                            matched += 1

                    # só escreve se houver pelo menos 1 parcial válida; senão, deixa NaN
                    df.loc[nome_time, col_atual] = round(total, 2) if matched > 0 else pd.NA

                    atualizados += 1
                    rel.append((nome_time, http_st or 200, len(atletas or []), matched, round(total, 2)))
                    time.sleep(SLEEP_REQ)
                except Exception as e:
                    rel.append((nome_time, None, 0, 0, 0.0))

            print(f"✅ Times atualizados com parciais: {atualizados}/{len(ids_times)} na coluna '{col_atual}'")
            for nm, st, n_atl, n_ok, tot in rel[:12]:
                print(f" • {nm:25} | HTTP={st} | atletas={n_atl:2d} | com_parcial={n_ok:2d} | total={tot:6.2f}")
    else:
        print("ℹ️ Rodada não está em andamento (status != 2) ou fora do intervalo do turno — sem parciais.")

    # 6) (Opcional) Linha 'Lider_Rodada' quando houver alguma coluna com dado > 0
    try:
        cols_com_dado = [c for c in colunas_turno if df[c].notna().any()]
        if cols_com_dado and df[cols_com_dado].sum(numeric_only=True).sum() != 0:
            df.loc['Lider_Rodada'] = df[cols_com_dado].idxmax(axis=0)
    except Exception as e:
        print("⚠️ Não foi possível recalcular 'Lider_Rodada':", e)

    return df

# === Exemplo de uso ===
# ids_times = {"Nome do Time": 12345, ...}
df_pontuacoes = gerar_df_pontuacoes(api, ids_times)

# Visualização
try:
    display(df_pontuacoes.T)
except Exception:
    print(df_pontuacoes.T.head(20))


Status HTTP=1 | rodada_http=21 | rodada_api=21 | usando rodada_ref=21
ℹ️ Rodada não está em andamento (status != 2) ou fora do intervalo do turno — sem parciais.


Unnamed: 0,BORGES ITAQUI F.C.,cartola scheuer,Dom Camillo68,FBC Colorado,Fedato Futebol Clube,Gremiomaniasm,JV5 Tricolor Gaúcho,lsauer fc,MauHumor F.C.,Noah A 10,pura bucha /botafogo,PUXE FC,Real SCI,seralex,Sport Clube PAIM,Tabajara de Inhaua PB7,Tatols Beants F.C,Texas Club 2025,TIGRE LEON,TURNOLANDIA FC25,Lider_Rodada
Rodada 20,76.06,73.96,64.91,59.66,74.41,53.26,81.46,62.56,70.36,69.39,75.61,76.51,63.96,70.81,73.36,66.33,85.86,84.46,62.06,78.93,Tatols Beants F.C
Rodada 21,,,,,,,,,,,,,,,,,,,,,
Rodada 22,,,,,,,,,,,,,,,,,,,,,
Rodada 23,,,,,,,,,,,,,,,,,,,,,
Rodada 24,,,,,,,,,,,,,,,,,,,,,
Rodada 25,,,,,,,,,,,,,,,,,,,,,
Rodada 26,,,,,,,,,,,,,,,,,,,,,
Rodada 27,,,,,,,,,,,,,,,,,,,,,
Rodada 28,,,,,,,,,,,,,,,,,,,,,
Rodada 29,,,,,,,,,,,,,,,,,,,,,


### Função para definir a classificação dos times

In [11]:
def classificacao_por_grupo(
    df_rodadas: pd.DataFrame,
    df_pontuacoes: pd.DataFrame,
    rodadas_encerradas: set[int] | None = None,
    rodada_parcial: int | None = None,
):
    """
    Gera classificação por grupo a partir de confrontos (df_rodadas) e pontuações (df_pontuacoes).

    - `rodadas_encerradas`: rodadas 100% fechadas (contam normalmente).
    - `rodada_parcial`: rodada em andamento; só conta confrontos se ambos tiverem número e
      pelo menos UM deles > 0 (evita empates 0x0 de placeholder).
    """

    # --- 0) Normalizações para casar chaves ---
    df_pontuacoes_times = df_pontuacoes.drop(index='Lider_Rodada', errors='ignore').copy()
    if df_pontuacoes_times.index.dtype != "object":
        df_pontuacoes_times.index = df_pontuacoes_times.index.astype(str)
    df_pontuacoes_times.index = df_pontuacoes_times.index.str.strip()
    df_pontuacoes_times.columns = [str(c).strip() for c in df_pontuacoes_times.columns]

    required_cols = {"Grupo", "Mandante_Nome", "Visitante_Nome", "Rodada"}
    faltando = required_cols - set(df_rodadas.columns)
    if faltando:
        raise ValueError(f"df_rodadas está sem as colunas: {sorted(faltando)}")

    # --- 1) Pré-inicializa times (zerados) por grupo, a partir dos confrontos ---
    estatisticas: dict[str, dict[str, dict]] = {}
    for _, r in df_rodadas.iterrows():
        grupo = str(r["Grupo"]).strip()
        mandante = str(r["Mandante_Nome"]).strip()
        visitante = str(r["Visitante_Nome"]).strip()
        if grupo not in estatisticas:
            estatisticas[grupo] = {}
        for time in (mandante, visitante):
            if time not in estatisticas[grupo]:
                estatisticas[grupo][time] = {
                    "Pontos": 0,
                    "Vitórias": 0,
                    "Empates": 0,
                    "Derrotas": 0,
                    "Total_Cartola": 0.0,
                    "Cartola_Sofrido": 0.0,
                }

    # helper seguro para ler pontuação do DF; None => não considerar
    def safe_pontuacao(nome_time: str, coluna_rodada: str):
        if (nome_time in df_pontuacoes_times.index) and (coluna_rodada in df_pontuacoes_times.columns):
            val = df_pontuacoes_times.at[nome_time, coluna_rodada]
            if pd.notnull(val):
                try:
                    return float(val)
                except Exception:
                    return None
        return None

    # --- 1.1) (NOVO) Se não for informado, inferir 'encerradas' pelo DF de pontuações ---
    if rodadas_encerradas is None:
        rodadas_encerradas = set()
        # usa as rodadas que aparecem no CSV de confrontos, convertidas p/ int
        candidatas = pd.to_numeric(df_rodadas["Rodada"], errors="coerce").dropna().astype(int).unique()
        for n in candidatas:
            if rodada_parcial is not None and n == rodada_parcial:
                continue  # nunca trate a parcial como encerrada

            col = f"Rodada {n}"
            if col not in df_pontuacoes_times.columns:
                continue

            serie = pd.to_numeric(df_pontuacoes_times[col], errors="coerce")
            num_validos = serie.notna().sum()
            tem_algum_ponto = (serie.fillna(0) > 0).any()

            # "Encerrada" = tem pelo menos 2 placares válidos e alguém > 0
            if num_validos >= 2 and tem_algum_ponto:
                rodadas_encerradas.add(n)

    # Sanity: se por engano passou a parcial dentro das encerradas, remove
    if rodada_parcial is not None and rodada_parcial in rodadas_encerradas:
        rodadas_encerradas.discard(rodada_parcial)

    # --- 2) Processa confrontos conforme status da rodada ---
    for _, confronto in df_rodadas.iterrows():
        try:
            rodada = int(confronto["Rodada"])
        except Exception:
            try:
                rodada = int(str(confronto["Rodada"]).strip())
            except Exception:
                continue

        mandante = str(confronto["Mandante_Nome"]).strip()
        visitante = str(confronto["Visitante_Nome"]).strip()
        grupo = str(confronto["Grupo"]).strip()
        coluna_rodada = f"Rodada {rodada}"

        # Rodada não elegível? (nem encerrada, nem a parcial atual) → ignora
        if (rodada not in rodadas_encerradas) and (rodada != rodada_parcial):
            continue

        pm = safe_pontuacao(mandante, coluna_rodada)
        pv = safe_pontuacao(visitante, coluna_rodada)

        # Regra para rodada PARCIAL: só conta se ambos têm número e pelo menos UM > 0
        if rodada == rodada_parcial:
            if pm is None or pv is None:
                continue
            if (pm == 0.0) and (pv == 0.0):
                continue

        # Regra para rodada ENCERRADA: exige números válidos para ambos
        if rodada in rodadas_encerradas:
            if pm is None or pv is None:
                continue

        # --- acumula totais ---
        estatisticas[grupo][mandante]["Total_Cartola"] += pm
        estatisticas[grupo][mandante]["Cartola_Sofrido"] += pv
        estatisticas[grupo][visitante]["Total_Cartola"] += pv
        estatisticas[grupo][visitante]["Cartola_Sofrido"] += pm

        # --- pontos/vit/emp/der ---
        if pm > pv:
            estatisticas[grupo][mandante]["Pontos"] += 3
            estatisticas[grupo][mandante]["Vitórias"] += 1
            estatisticas[grupo][visitante]["Derrotas"] += 1
        elif pm < pv:
            estatisticas[grupo][visitante]["Pontos"] += 3
            estatisticas[grupo][visitante]["Vitórias"] += 1
            estatisticas[grupo][mandante]["Derrotas"] += 1
        else:
            estatisticas[grupo][mandante]["Pontos"] += 1
            estatisticas[grupo][visitante]["Pontos"] += 1
            estatisticas[grupo][mandante]["Empates"] += 1
            estatisticas[grupo][visitante]["Empates"] += 1

    # --- 3) Monta DataFrame final ---
    frames = []
    for grupo, times in estatisticas.items():
        if not times:
            continue
        df_g = pd.DataFrame({
            "Grupo": grupo,
            "Nome do Time": list(times.keys()),
            "Pontos": [stats["Pontos"] for stats in times.values()],
            "Vitórias": [stats["Vitórias"] for stats in times.values()],
            "Empates": [stats["Empates"] for stats in times.values()],
            "Derrotas": [stats["Derrotas"] for stats in times.values()],
            "Total Cartola": [stats["Total_Cartola"] for stats in times.values()],
            "Cartola Sofrido": [stats["Cartola_Sofrido"] for stats in times.values()],
        })
        df_g["Saldo Cartola"] = df_g["Total Cartola"] - df_g["Cartola Sofrido"]
        frames.append(df_g)

    if not frames:
        cols = ["Grupo","Nome do Time","Pontos","Vitórias","Empates","Derrotas",
                "Total Cartola","Cartola Sofrido","Saldo Cartola","Posição"]
        return pd.DataFrame(columns=cols), {}

    df_resultado = pd.concat(frames, ignore_index=True).sort_values(
        by=["Grupo", "Pontos", "Total Cartola", "Saldo Cartola", "Nome do Time"],
        ascending=[True, False, False, False, True]
    ).reset_index(drop=True)

    df_resultado["Posição"] = df_resultado.groupby("Grupo").cumcount() + 1

    df_resultado_por_grupo = {
        g: df_resultado[df_resultado["Grupo"] == g].copy()
        for g in df_resultado["Grupo"].unique()
    }

    return df_resultado, df_resultado_por_grupo


In [13]:
# 1) Confrontos
df_confrontos = pd.read_csv("confrontos_serie_B.csv")

# 2) Renomeia colunas (se vierem como "Time A"/"Time B")
df_confrontos.rename(columns={
    "Time A": "Mandante_Nome",
    "Time B": "Visitante_Nome"
}, inplace=True)

# 3) Grupo fixo
df_confrontos["Grupo"] = "Série B"

# 4) Série B do 2º turno → converter Rodada 1..19 (UI) para 20..38 (Cartola)
TURNO_INICIO, TURNO_FIM = 20, 38
df_confrontos["Rodada"] = df_confrontos["Rodada"].astype(int)
if df_confrontos["Rodada"].max() <= 19:
    df_confrontos["Rodada"] = df_confrontos["Rodada"] + (TURNO_INICIO - 1)  # 1→20, 19→38

# 5) Status do mercado (para saber se a rodada corrente está em andamento)
import requests
def http_status_e_rodada():
    r = requests.get("https://api.cartola.globo.com/mercado/status", timeout=20)
    r.raise_for_status()
    d = r.json()
    return int(d.get("status_mercado", 0)), int(d.get("rodada_atual", 0))

status_http, rodada_http = http_status_e_rodada()   # status 2 = em andamento
rodada_http = int(rodada_http or TURNO_INICIO)

# 6) Parâmetros para a classificação
#    - rodada_parcial: somente se status==2 e dentro de 20..38
#    - rodadas_encerradas:
#         * com parcial → [20 .. rodada_parcial-1]
#         * sem parcial → [20 .. min(rodada_http, 38)] (inclusivo)
rodada_parcial = rodada_http if (status_http == 2 and TURNO_INICIO <= rodada_http <= TURNO_FIM) else None
if rodada_parcial:
    rodadas_encerradas = set(range(TURNO_INICIO, rodada_parcial))  # fim exclusivo
else:
    rodadas_encerradas = set(range(TURNO_INICIO, min(rodada_http, TURNO_FIM) + 1))  # fim inclusivo

print(f"[DEBUG] status={status_http} rodada_http={rodada_http} encerradas={sorted(rodadas_encerradas)} parcial={rodada_parcial}")

# 7) Alinha nomes do DF de pontuações
df_pontuacoes.index = df_pontuacoes.index.astype(str).str.strip()

# 8) Classificação (a função deve aceitar 'rodadas_encerradas' e 'rodada_parcial')
df_classificacao, _ = classificacao_por_grupo(
    df_rodadas=df_confrontos,
    df_pontuacoes=df_pontuacoes,
    rodadas_encerradas=rodadas_encerradas,
    rodada_parcial=rodada_parcial,
)

# 9) Visualiza
display(df_classificacao.head(30))


[DEBUG] status=1 rodada_http=21 encerradas=[20, 21] parcial=None


Unnamed: 0,Grupo,Nome do Time,Pontos,Vitórias,Empates,Derrotas,Total Cartola,Cartola Sofrido,Saldo Cartola,Posição
0,Série B,Tatols Beants F.C,3,1,0,0,85.86,84.46,1.4,1
1,Série B,JV5 Tricolor Gaúcho,3,1,0,0,81.46,66.33,15.13,2
2,Série B,TURNOLANDIA FC25,3,1,0,0,78.93,73.96,4.97,3
3,Série B,PUXE FC,3,1,0,0,76.51,75.61,0.9,4
4,Série B,BORGES ITAQUI F.C.,3,1,0,0,76.06,59.66,16.4,5
5,Série B,Fedato Futebol Clube,3,1,0,0,74.41,62.56,11.85,6
6,Série B,Sport Clube PAIM,3,1,0,0,73.36,62.06,11.3,7
7,Série B,seralex,3,1,0,0,70.81,64.91,5.9,8
8,Série B,MauHumor F.C.,3,1,0,0,70.36,53.26,17.1,9
9,Série B,Noah A 10,3,1,0,0,69.39,63.96,5.43,10


In [14]:
# 1. Times únicos nos confrontos
times_confrontos = pd.unique(df_confrontos[["Mandante_Nome", "Visitante_Nome"]].values.ravel())

# 2. Times únicos na classificação final
times_classificados = df_classificacao["Nome do Time"].unique()

# 3. Ver quem está nos confrontos mas não foi classificado
faltando = set(times_confrontos) - set(times_classificados)

print("❌ Times que estão nos confrontos, mas faltam na classificação:")
print(faltando)

# df_pontuacoes.loc[["Time do S.A.P.O", "BORGES ITAQUI F.C."]]


❌ Times que estão nos confrontos, mas faltam na classificação:
set()


In [15]:
# === Série B — Exportadores (com parciais do 2º turno) ===
import pandas as pd, json, math

# -------------------------------------------
# 1) CLASSIFICAÇÃO -> classificacao_serie_B.js
# -------------------------------------------
# df_classificacao já está no formato das suas colunas "originais"
df_classificacao.to_csv("classificacao_serie_b.csv", index=False)

df_classificacao = pd.read_csv("classificacao_serie_b.csv")
df_classificacao.rename(columns={
    "Grupo": "grupo",
    "Nome do Time": "nome",
    "Pontos": "pontos",
    "Vitórias": "vitorias",
    "Empates": "empates",
    "Derrotas": "derrotas",
    "Total Cartola": "totalCartola",
    "Cartola Sofrido": "cartolaSofrido",
    "Saldo Cartola": "saldoCartola",
    "Posição": "posicao",
}, inplace=True)

classificacao_por_grupo = {}
for grupo, dados in df_classificacao.groupby("grupo"):
    classificacao_por_grupo[grupo] = dados.drop(columns="grupo").to_dict(orient="records")

with open("classificacao_serie_B.js", "w", encoding="utf-8") as f:
    f.write("const classificacaoSerieB = ")
    json.dump(classificacao_por_grupo, f, ensure_ascii=False, indent=2)
    f.write(";")
print("✅ classificacao_serie_B.js")


✅ classificacao_serie_B.js


In [16]:
# -------------------------------------------
# 2) CONFRONTOS -> confrontos_serie_B.js
# -------------------------------------------
df_confrontos = pd.read_csv("confrontos_serie_B.csv")
df_confrontos.columns = df_confrontos.columns.str.strip()
df_confrontos.rename(columns={
    "Rodada": "rodada",
    "Confronto": "confronto",
    "Time A": "mandante_nome",
    "Time B": "visitante_nome",
    "ID A": "mandante_id",
    "ID B": "visitante_id",
}, inplace=True)
df_confrontos["grupo"] = "Série B"

confrontos_formatado = []
for _, row in df_confrontos.iterrows():
    confrontos_formatado.append({
        "rodada": int(row["rodada"]),
        "confronto": int(row["confronto"]),
        "grupo": row["grupo"],
        "mandante": {"id": row["mandante_id"], "nome": row["mandante_nome"]},
        "visitante": {"id": row["visitante_id"], "nome": row["visitante_nome"]},
    })

with open("confrontos_serie_B.js", "w", encoding="utf-8") as f:
    f.write("const confrontosFase1 = ")
    json.dump(confrontos_formatado, f, ensure_ascii=False, indent=2)
    f.write(";")
print("✅ confrontos_serie_B.js")


✅ confrontos_serie_B.js


In [17]:
# -------------------------------------------
# 3) RESULTADOS (com parciais) -> resultados_serie_B.js
# -------------------------------------------
# df_pontuacoes: index = nome do time, colunas = 'Rodada 20'..'Rodada 38' (ou 1..19)
TURNO_INICIO = 20
TURNO_OFFSET = TURNO_INICIO - 1  # 19  (UI 1 => Cartola 20)

# normaliza df_pontuacoes
dfp = df_pontuacoes.copy()
dfp.index = dfp.index.astype(str).str.strip()
dfp.columns = [str(c) for c in dfp.columns]
dfp = dfp.apply(pd.to_numeric, errors="coerce")

def _get_ponto(team: str, rodada_ui: int):
    """Busca ponto do 'team' em 'rodada_ui' aceitando:
       - coluna 'Rodada {rodada_ui+19}' (2º turno),
       - ou 'Rodada {rodada_ui}' (caso tenha sido salvo assim)."""
    col20 = f"Rodada {rodada_ui + TURNO_OFFSET}"
    col01 = f"Rodada {rodada_ui}"
    v = None
    if team in dfp.index and col20 in dfp.columns:
        v = dfp.at[team, col20]
    if (v is None or pd.isna(v)) and team in dfp.index and col01 in dfp.columns:
        v = dfp.at[team, col01]
    if v is None or pd.isna(v):
        return None
    return float(v)

def gerar_resultados_serie_b(df_confrontos_renamed: pd.DataFrame) -> pd.DataFrame:
    out = []
    for _, row in df_confrontos_renamed.iterrows():
        rodada = int(row["rodada"])
        mandante = str(row["mandante_nome"]).strip()
        visitante = str(row["visitante_nome"]).strip()
        pm = _get_ponto(mandante, rodada)
        pv = _get_ponto(visitante, rodada)
        out.append({
            "grupo": row.get("grupo", "Série B"),
            "rodada": rodada,
            "mandante": {"nome": mandante, "pontos": None if pm is None else round(pm, 2)},
            "visitante": {"nome": visitante, "pontos": None if pv is None else round(pv, 2)},
        })
    return pd.DataFrame(out)

df_resultados = gerar_resultados_serie_b(df_confrontos)

with open("resultados_serie_B.js", "w", encoding="utf-8") as f:
    f.write("const resultadosFase1 = ")
    json.dump(df_resultados.to_dict(orient="records"), f, ensure_ascii=False, indent=2)
    f.write(";")
print("✅ resultados_serie_B.js (com parciais quando houver)")

# -------------------------------------------
# 4) PONTUAÇÕES POR RODADA (opcional, pro front) -> pontuacoes_por_rodada_serie_B.js
#    Gera chaves 'Rodada 1..19' a partir do df_pontuacoes
# -------------------------------------------
def df_to_ui_rounds(dfp: pd.DataFrame):
    mapa = {}
    for team in dfp.index:
        inner = {}
        for ui in range(1, 20):
            col20 = f"Rodada {ui + TURNO_OFFSET}"
            col01 = f"Rodada {ui}"
            v = None
            if col20 in dfp.columns:
                vv = dfp.at[team, col20]
                if pd.notna(vv):
                    v = float(vv)
            if v is None and col01 in dfp.columns:
                vv = dfp.at[team, col01]
                if pd.notna(vv):
                    v = float(vv)
            if v is not None:
                inner[f"Rodada {ui}"] = v
        if inner:
            mapa[team] = inner
    return mapa

with open("pontuacoes_por_rodada_serie_B.js", "w", encoding="utf-8") as f:
    f.write("window.pontuacoesPorRodada = ")
    json.dump(df_to_ui_rounds(dfp), f, ensure_ascii=False, indent=2)
    f.write(";")
print("✅ pontuacoes_por_rodada_serie_B.js")

print("🎉 Pronto. Recarregue a página com os 4 arquivos gerados incluídos antes do 'scripts/serie_B.js'.")


✅ resultados_serie_B.js (com parciais quando houver)
✅ pontuacoes_por_rodada_serie_B.js
🎉 Pronto. Recarregue a página com os 4 arquivos gerados incluídos antes do 'scripts/serie_B.js'.


In [18]:
# Carregar o arquivo CSV enviado
df_confrontos = pd.read_csv("confrontos_serie_B.csv")

display(df_confrontos.head())

Unnamed: 0,Rodada,Confronto,Time A,Time B,ID A,ID B
0,1,1,BORGES ITAQUI F.C.,FBC Colorado,1,3
1,1,2,Tatols Beants F.C,Texas Club 2025,16,17
2,1,3,PUXE FC,pura bucha /botafogo,9,20
3,1,4,lsauer fc,Fedato Futebol Clube,19,4
4,1,5,TURNOLANDIA FC25,cartola scheuer,13,18


In [19]:
# TURNO_INICIO = 20
# TOTAL_RODADAS = 19

# # Tente usar a exceção específica; senão, caia para Exception
# try:
#     from cartolafc import CartolaFCError as _CartolaErr
# except Exception:
#     _CartolaErr = Exception

# def campeonato_comecou(api, ids_times):
#     """
#     Considera que o 2º turno começou se:
#       - o mercado indica rodada_atual >= 20 E
#       - há pelo menos uma pontuação não-nula na rodada 20 para algum time.
#     """
#     try:
#         rodada_atual = getattr(api.mercado(), "rodada_atual", None)
#     except _CartolaErr:
#         rodada_atual = None

#     if rodada_atual is None or rodada_atual < TURNO_INICIO:
#         return False

#     for time_id in ids_times.values():
#         try:
#             p = api.time(time_id=time_id, rodada=TURNO_INICIO).ultima_pontuacao
#             if p is not None:
#                 return True
#         except _CartolaErr:
#             continue
#     return False

# def obter_pontuacao_por_rodada(api, time_id, rodada_atual):
#     """
#     Busca apenas rodadas concluídas: [20, rodada_atual-1].
#     """
#     pontuacoes = {}
#     # fim exclusivo; para parar em rodada_atual-1 use range(..., rodada_atual)
#     fim = min(max(rodada_atual, TURNO_INICIO), TOTAL_RODADAS + 1)
#     for rodada in range(TURNO_INICIO, fim):
#         try:
#             time_r = api.time(time_id=time_id, rodada=rodada)
#             pontuacoes[rodada] = time_r.ultima_pontuacao
#         except _CartolaErr as e:
#             print(f"⚠️ Erro ao acessar rodada {rodada} (time {time_id}): {e}")
#             pontuacoes[rodada] = None
#     return pontuacoes

# def gerar_df_pontuacoes(api, ids_times):
#     try:
#         rodada_atual = api.mercado().rodada_atual
#     except _CartolaErr:
#         # fallback seguro se a API falhar
#         rodada_atual = TURNO_INICIO

#     colunas_turno = [f"Rodada {i}" for i in range(TURNO_INICIO, TOTAL_RODADAS + 1)]

#     # Caso o 2º turno ainda não tenha começado (sem pontuações na R20)
#     if not campeonato_comecou(api, ids_times):
#         print("📌 2º Turno ainda não começou. Criando estrutura com placeholders (0).")
#         df = pd.DataFrame(0, index=list(ids_times.keys()), columns=colunas_turno)
#         return df

#     # Há ao menos uma pontuação na R20 → montar com rodadas concluídas
#     dados = {}
#     for nome, time_id in ids_times.items():
#         pontuacoes = obter_pontuacao_por_rodada(api, time_id, rodada_atual)
#         # Converte para Series com índice "Rodada N"
#         s = pd.Series({f"Rodada {k}": v for k, v in pontuacoes.items()})
#         dados[nome] = s

#     # DataFrame com as rodadas já buscadas (pode estar vazio se rodada_atual==20)
#     df = pd.DataFrame.from_dict(dados, orient="index")

#     # Garante TODAS as colunas do 2º turno, preenchendo faltantes com 0
#     df = df.reindex(columns=colunas_turno, fill_value=0)

#     # Calcula "Lider_Rodada" somente se houver pelo menos uma rodada com algum valor não-nulo
#     colunas_com_dados = [c for c in colunas_turno if df[c].notna().any()]
#     if len(colunas_com_dados) > 0 and df[colunas_com_dados].astype(float).sum().sum() != 0:
#         df.loc['Lider_Rodada'] = df[colunas_com_dados].idxmax(axis=0)
#     # Caso contrário, não cria a linha de líder (evita líder "aleatório" com tudo 0)

#     return df

# # === Exemplo de uso ===
# # ids_times = {v: k for k, v in nomes_por_id.items()}  # índice = nome do time
# df_pontuacoes = gerar_df_pontuacoes(api, ids_times)

# # Visualização como você já faz
# display(df_pontuacoes.T)

In [20]:
# def campeonato_comecou(api, ids_times):
#     """Verifica se o campeonato já começou observando a pontuação na 1ª rodada."""
#     for time_id in ids_times.values():
#         try:
#             pontuacao = api.time(time_id=time_id, rodada=1).ultima_pontuacao
#             if pontuacao is not None:
#                 return True
#         except cartolafc.errors.CartolaFCError:
#             continue
#     return False

# def obter_pontuacao_por_rodada(api, time_id, rodada_atual):
#     """Obtém a pontuação do time em cada rodada até a rodada atual."""
#     pontuacoes = {}
#     for rodada in range(1, rodada_atual):
#         try:
#             time_rodada = api.time(time_id=time_id, rodada=rodada)
#             pontuacoes[rodada] = time_rodada.ultima_pontuacao
#         except cartolafc.errors.CartolaFCError as e:
#             print(f"Erro ao acessar pontuação da rodada {rodada} para o time {time_id}: {e}")
#             pontuacoes[rodada] = None
#     return pontuacoes

# def gerar_df_pontuacoes(api, ids_times):
#     rodada_atual = api.mercado().rodada_atual
#     total_rodadas = 38

#     if not campeonato_comecou(api, ids_times):
#         print("📌 O campeonato ainda não começou. Criando estrutura com placeholders.")
#         df = pd.DataFrame(index=ids_times.keys(), columns=[f'Rodada {i}' for i in range(1, total_rodadas + 1)])
#         df[:] = 0
#     else:
#         df = pd.DataFrame()
#         for nome, time_id in ids_times.items():
#             pontuacoes = obter_pontuacao_por_rodada(api, time_id, rodada_atual)
#             df[nome] = pd.Series(pontuacoes)
#         df = df.transpose()
#         df.columns = [f'Rodada {i}' for i in range(1, rodada_atual)]
#         df.loc['Lider_Rodada'] = df.idxmax()
    
#     return df

In [21]:
# ids_times = {v: k for k, v in nomes_por_id.items()}

# df_pontuacoes = gerar_df_pontuacoes(api, ids_times)

# display(df_pontuacoes.head(20))

### Função para definir a classificação dos times

In [22]:
# def classificacao_por_grupo(df_rodadas: pd.DataFrame, df_pontuacoes: pd.DataFrame):
#     """
#     Classificação dos grupos com base nos confrontos e nas pontuações do Cartola.

#     Mesmo sem pontuações (rodada não finalizada), retorna uma tabela
#     com todos os times dos confrontos zerados.
#     """
#     # tira marcador se existir
#     df_pontuacoes_times = df_pontuacoes.drop(index='Lider_Rodada', errors='ignore')

#     # 1) Pré-inicializa todos os times (zerados) por grupo, a partir dos confrontos
#     estatisticas = {}
#     for _, r in df_rodadas.iterrows():
#         grupo = r["Grupo"]
#         mandante = r["Mandante_Nome"]
#         visitante = r["Visitante_Nome"]
#         if grupo not in estatisticas:
#             estatisticas[grupo] = {}
#         for time in (mandante, visitante):
#             if time not in estatisticas[grupo]:
#                 estatisticas[grupo][time] = {
#                     "Pontos": 0,
#                     "Vitórias": 0,
#                     "Empates": 0,
#                     "Derrotas": 0,
#                     "Total_Cartola": 0.0,
#                     "Cartola_Sofrido": 0.0,
#                 }

#     # helper seguro para ler pontuação; None => não considerar o jogo
#     def safe_pontuacao(nome_time: str, coluna_rodada: str):
#         if (nome_time in df_pontuacoes_times.index) and (coluna_rodada in df_pontuacoes_times.columns):
#             val = df_pontuacoes_times.at[nome_time, coluna_rodada]
#             if pd.notnull(val):
#                 try:
#                     return float(val)
#                 except Exception:
#                     return None
#         return None

#     # 2) Processa os confrontos apenas quando existir pontuação válida pros 2 times
#     for _, confronto in df_rodadas.iterrows():
#         rodada = confronto["Rodada"]
#         mandante = confronto["Mandante_Nome"]
#         visitante = confronto["Visitante_Nome"]
#         grupo = confronto["Grupo"]
#         coluna_rodada = f"Rodada {rodada}"

#         pm = safe_pontuacao(mandante, coluna_rodada)
#         pv = safe_pontuacao(visitante, coluna_rodada)

#         # sem dados -> ignora (mantém tudo zerado, não conta jogo)
#         if pm is None or pv is None:
#             continue

#         # totais/cartola
#         estatisticas[grupo][mandante]["Total_Cartola"] += pm
#         estatisticas[grupo][mandante]["Cartola_Sofrido"] += pv
#         estatisticas[grupo][visitante]["Total_Cartola"] += pv
#         estatisticas[grupo][visitante]["Cartola_Sofrido"] += pm

#         # pontos
#         if pm > pv:
#             estatisticas[grupo][mandante]["Pontos"] += 3
#             estatisticas[grupo][mandante]["Vitórias"] += 1
#             estatisticas[grupo][visitante]["Derrotas"] += 1
#         elif pm < pv:
#             estatisticas[grupo][visitante]["Pontos"] += 3
#             estatisticas[grupo][visitante]["Vitórias"] += 1
#             estatisticas[grupo][mandante]["Derrotas"] += 1
#         else:
#             estatisticas[grupo][mandante]["Pontos"] += 1
#             estatisticas[grupo][visitante]["Pontos"] += 1
#             estatisticas[grupo][mandante]["Empates"] += 1
#             estatisticas[grupo][visitante]["Empates"] += 1

#     # 3) Monta o DataFrame final (mesmo que tudo esteja 0)
#     frames = []
#     for grupo, times in estatisticas.items():
#         if not times:
#             continue
#         df_g = pd.DataFrame({
#             "Grupo": grupo,
#             "Nome do Time": list(times.keys()),
#             "Pontos": [stats["Pontos"] for stats in times.values()],
#             "Vitórias": [stats["Vitórias"] for stats in times.values()],
#             "Empates": [stats["Empates"] for stats in times.values()],
#             "Derrotas": [stats["Derrotas"] for stats in times.values()],
#             "Total Cartola": [stats["Total_Cartola"] for stats in times.values()],
#             "Cartola Sofrido": [stats["Cartola_Sofrido"] for stats in times.values()],
#         })
#         df_g["Saldo Cartola"] = df_g["Total Cartola"] - df_g["Cartola Sofrido"]
#         frames.append(df_g)

#     if frames:
#         df_resultado = pd.concat(frames, ignore_index=True)
#     else:
#         # Sem confrontos? devolve estrutura vazia com colunas esperadas
#         cols = ["Grupo","Nome do Time","Pontos","Vitórias","Empates","Derrotas",
#                 "Total Cartola","Cartola Sofrido","Saldo Cartola","Posição"]
#         return pd.DataFrame(columns=cols), {}

#     # ordenação (desempate por Total/Saldo e depois Nome)
#     df_resultado = df_resultado.sort_values(
#         by=["Grupo", "Pontos", "Total Cartola", "Saldo Cartola", "Nome do Time"],
#         ascending=[True, False, False, False, True]
#     ).reset_index(drop=True)

#     df_resultado["Posição"] = df_resultado.groupby("Grupo").cumcount() + 1

#     df_resultado_por_grupo = {
#         g: df_resultado[df_resultado["Grupo"] == g].copy()
#         for g in df_resultado["Grupo"].unique()
#     }

#     return df_resultado, df_resultado_por_grupo

In [23]:
# def classificacao_por_grupo(df_rodadas, df_pontuacoes):
#     """
#     Classificação dos grupos com base nos confrontos e nas pontuações do Cartola.

#     Retorna:
#     - df_resultado: classificação geral
#     - df_resultado_por_grupo: dicionário com classificação separada por grupo
#     """
#     df_pontuacoes_times = df_pontuacoes.drop(index='Lider_Rodada', errors='ignore')
#     estatisticas = {}

#     for _, confronto in df_rodadas.iterrows():
#         rodada = confronto["Rodada"]
#         mandante = confronto["Mandante_Nome"]
#         visitante = confronto["Visitante_Nome"]
#         grupo = confronto["Grupo"]
#         coluna_rodada = f"Rodada {rodada}"

#         if mandante not in df_pontuacoes_times.index or visitante not in df_pontuacoes_times.index:
#             continue
#         if coluna_rodada not in df_pontuacoes_times.columns:
#             continue

#         pontos_mandante = df_pontuacoes_times.at[mandante, coluna_rodada]
#         pontos_visitante = df_pontuacoes_times.at[visitante, coluna_rodada]

#         if pd.isnull(pontos_mandante) or pd.isnull(pontos_visitante):
#             continue

#         for time in [mandante, visitante]:
#             if grupo not in estatisticas:
#                 estatisticas[grupo] = {}
#             if time not in estatisticas[grupo]:
#                 estatisticas[grupo][time] = {
#                     "Pontos": 0, "Vitórias": 0, "Empates": 0, "Derrotas": 0,
#                     "Total_Cartola": 0, "Cartola_Sofrido": 0
#                 }

#         # Atualizar estatísticas do jogo
#         estatisticas[grupo][mandante]["Total_Cartola"] += pontos_mandante
#         estatisticas[grupo][mandante]["Cartola_Sofrido"] += pontos_visitante

#         estatisticas[grupo][visitante]["Total_Cartola"] += pontos_visitante
#         estatisticas[grupo][visitante]["Cartola_Sofrido"] += pontos_mandante

#         if pontos_mandante > pontos_visitante:
#             estatisticas[grupo][mandante]["Pontos"] += 3
#             estatisticas[grupo][mandante]["Vitórias"] += 1
#             estatisticas[grupo][visitante]["Derrotas"] += 1
#         elif pontos_mandante < pontos_visitante:
#             estatisticas[grupo][visitante]["Pontos"] += 3
#             estatisticas[grupo][visitante]["Vitórias"] += 1
#             estatisticas[grupo][mandante]["Derrotas"] += 1
#         else:
#             estatisticas[grupo][mandante]["Pontos"] += 1
#             estatisticas[grupo][visitante]["Pontos"] += 1
#             estatisticas[grupo][mandante]["Empates"] += 1
#             estatisticas[grupo][visitante]["Empates"] += 1

#     # Montar DataFrame final
#     df_resultado = pd.concat([
#         pd.DataFrame({
#             "Grupo": grupo,
#             "Nome do Time": list(times.keys()),
#             "Pontos": [stats["Pontos"] for stats in times.values()],
#             "Vitórias": [stats["Vitórias"] for stats in times.values()],
#             "Empates": [stats["Empates"] for stats in times.values()],
#             "Derrotas": [stats["Derrotas"] for stats in times.values()],
#             "Total Cartola": [stats["Total_Cartola"] for stats in times.values()],
#             "Cartola Sofrido": [stats["Cartola_Sofrido"] for stats in times.values()],
#             "Saldo Cartola": [stats["Total_Cartola"] - stats["Cartola_Sofrido"] for stats in times.values()
#             ]
#         })
#         for grupo, times in estatisticas.items()
#     ], ignore_index=True)


#     df_resultado = df_resultado.sort_values(
#         by=["Grupo", "Pontos", "Total Cartola"],
#         ascending=[True, False, False]
#     )

#     df_resultado["Posição"] = df_resultado.groupby("Grupo")\
#     .cumcount() + 1

#     df_resultado_por_grupo = {
#         grupo: df_resultado[df_resultado["Grupo"] == grupo] for grupo in df_resultado["Grupo"].unique()
#     }

#     return df_resultado, df_resultado_por_grupo

In [24]:
# # 1. Carregar confrontos
# df_confrontos = pd.read_csv("confrontos_serie_B.csv")

# # 2. Renomear colunas se necessário
# df_confrontos.rename(columns={
#     "Time A": "Mandante_Nome",
#     "Time B": "Visitante_Nome"
# }, inplace=True)

# # 3. Adicionar coluna de grupo fixo
# df_confrontos["Grupo"] = "Série B"

# display(df_confrontos.head())

# # 4. Calcular classificação
# df_classificacao, _ = classificacao_por_grupo(df_confrontos, df_pontuacoes)

# # 5. Ver resultado
# display(df_classificacao.head(20))

In [25]:
# # 1. Times únicos nos confrontos
# times_confrontos = pd.unique(df_confrontos[["Mandante_Nome", "Visitante_Nome"]].values.ravel())

# # 2. Times únicos na classificação final
# times_classificados = df_classificacao["Nome do Time"].unique()

# # 3. Ver quem está nos confrontos mas não foi classificado
# faltando = set(times_confrontos) - set(times_classificados)

# print("❌ Times que estão nos confrontos, mas faltam na classificação:")
# print(faltando)

# # df_pontuacoes.loc[["Time do S.A.P.O", "BORGES ITAQUI F.C."]]


In [26]:
# # Exportar resultado em CSV
# df_classificacao.to_csv("classificacao_serie_B.csv", index=False)

# # Carregar o arquivo CSV enviado
# df_classificacao = pd.read_csv("classificacao_serie_B.csv")

# # Renomear colunas para os nomes usados no JavaScript
# df_classificacao.rename(columns={
#     "Grupo": "grupo",
#     "Nome do Time": "nome",
#     "Pontos": "pontos",
#     "Vitórias": "vitorias",
#     "Empates": "empates",
#     "Derrotas": "derrotas",
#     "Total Cartola": "totalCartola",
#     "Cartola Sofrido": "cartolaSofrido",
#     "Saldo Cartola": "saldoCartola",
#     "Posição": "posicao"
# }, inplace=True)

# # Agrupar por grupo (apenas Série A nesse caso)
# classificacao_por_grupo = {}
# for grupo, dados in df_classificacao.groupby("grupo"):
#     classificacao_por_grupo[grupo] = dados.drop(columns="grupo").to_dict(orient="records")

# # Salvar como arquivo JavaScript
# caminho_saida = "classificacao_serie_B.js"
# with open(caminho_saida, "w", encoding="utf-8") as f:
#     f.write(f"const classificacaoSerieA = {json.dumps(classificacao_por_grupo, indent=2, ensure_ascii=False)};")

# caminho_saida

In [27]:
# import pandas as pd
# import json

# # Carregar CSV
# df_confrontos = pd.read_csv("confrontos_serie_B.csv")

# # Limpar espaços nas colunas
# df_confrontos.columns = df_confrontos.columns.str.strip()

# # Renomear colunas
# df_confrontos.rename(columns={
#     "Rodada": "rodada",
#     "Confronto": "confronto",
#     "Time A": "mandante_nome",
#     "Time B": "visitante_nome",
#     "ID A": "mandante_id",
#     "ID B": "visitante_id"
# }, inplace=True)

# # Adicionar grupo fixo
# df_confrontos["grupo"] = "Série B"

# # Gerar estrutura para JS
# confrontos_formatado = []
# for _, row in df_confrontos.iterrows():
#     confronto = {
#         "rodada": int(row["rodada"]),
#         "confronto": int(row["confronto"]),
#         "grupo": row["grupo"],
#         "mandante": {"id": row["mandante_id"], "nome": row["mandante_nome"]},
#         "visitante": {"id": row["visitante_id"], "nome": row["visitante_nome"]}
#     }
#     confrontos_formatado.append(confronto)

# # Salvar como arquivo JS
# js_output = f"const confrontosFase1 = {json.dumps(confrontos_formatado, indent=2, ensure_ascii=False)};"
# with open("confrontos_serie_B.js", "w", encoding="utf-8") as f:
#     f.write(js_output)

# print("✅ Arquivo confrontos_serie_B.js gerado com sucesso!")


In [28]:
# # Carregar o arquivo CSV enviado
# df_confrontos = pd.read_csv("confrontos_serie_B.csv")

# display(df_confrontos.head())

In [29]:
# def gerar_resultados_serie_a(df_confrontos, df_pontuacoes, grupo="Série B"):
#     """
#     Gera um DataFrame com os resultados dos confrontos da Série A por rodada.
#     """
#     resultados = []

#     for _, row in df_confrontos.iterrows():
#         rodada = row["Rodada"]
#         mandante = row["Time A"]
#         visitante = row["Time B"]

#         pontos_mandante = df_pontuacoes.get(f"Rodada {rodada}", {}).get(mandante, None)
#         pontos_visitante = df_pontuacoes.get(f"Rodada {rodada}", {}).get(visitante, None)

#         resultados.append({
#             "grupo": grupo,
#             "rodada": rodada,
#             "mandante": {
#                 "nome": mandante,
#                 "pontos": pontos_mandante
#             },
#             "visitante": {
#                 "nome": visitante,
#                 "pontos": pontos_visitante
#             }
#         })

#     return pd.DataFrame(resultados)


In [30]:
# df_resultados = gerar_resultados_serie_a(df_confrontos, df_pontuacoes)

# # Exportar para .js
# import json

# with open("resultados_serie_B.js", "w", encoding="utf-8") as f:
#     f.write("const resultadosFase1 = ")
#     f.write(json.dumps(df_resultados.to_dict(orient="records"), indent=2, ensure_ascii=False))
#     f.write(";")

# print("✅ Arquivo resultados_serie_B.js gerado com sucesso.")
