In [1]:
import pandas as pd

# Configuração para mostrar todas as colunas, se necessário
pd.set_option('display.max_columns', None)

print("Pandas importado com sucesso!")

Pandas importado com sucesso!


In [2]:
# O caminho para o arquivo CSV dentro da pasta 'data'
print("Insira o arquivo (data) da base de dados no diretório 'data':")
data_file=input()
file_path = f"data/historico{data_file}_data.csv"
print(f"Arquivo a ser lido: {file_path}")

Insira o arquivo (data) da base de dados no diretório 'data':
Arquivo a ser lido: data/historico14-07_data.csv


In [3]:
# pd.read_csv() lê o arquivo e o transforma em um DataFrame
df = pd.read_csv(file_path)

print(f"Lendo {file_path}...")

Lendo data/historico14-07_data.csv...


In [4]:
print(df)

    SEMESTER UNIT  YEAR ANUAL SEMESTER  \
0        NaN  760  2025          Anual   
1        1.0  760  2022    1º Semestre   
2        1.0  760  2022    1º Semestre   
3        1.0  760  2022    1º Semestre   
4        1.0  760  2022    1º Semestre   
5        1.0  SMA  2022    1º Semestre   
6        1.0  SMA  2022    1º Semestre   
7        2.0  750  2022    2º Semestre   
8        2.0  750  2022    2º Semestre   
9        2.0  760  2022    2º Semestre   
10       2.0  760  2022    2º Semestre   
11       2.0  760  2022    2º Semestre   
12       2.0  760  2022    2º Semestre   
13       2.0  SMA  2022    2º Semestre   
14       2.0  SME  2022    2º Semestre   
15       3.0  760  2023    1º Semestre   
16       3.0  760  2023    1º Semestre   
17       3.0  760  2023    1º Semestre   
18       3.0  760  2023    1º Semestre   
19       3.0  760  2023    1º Semestre   
20       3.0  SMA  2023    1º Semestre   
21       4.0  760  2023    2º Semestre   
22       4.0  760  2023    2º Seme

In [5]:
def media_ponderada_geral(df, precision):
    """
    Calcula e imprime a média ponderada geral de um DataFrame de histórico escolar
    com um número personalizável de casas decimais.
    ESTA VERSÃO NÃO MODIFICA O DATAFRAME ORIGINAL.
    """
    # FIX: Trabalha em uma cópia para não alterar o DataFrame original
    df = df.copy()

    # Garante que as colunas necessárias são numéricas, tratando erros
    df['GRADE'] = pd.to_numeric(df['GRADE'], errors='coerce')
    df['TOTAL CREDITS'] = pd.to_numeric(df['TOTAL CREDITS'], errors='coerce')

    # Filtra apenas as linhas com notas válidas para o cálculo
    df_com_notas = df.dropna(subset=['GRADE'])

    # Evita divisão por zero se não houver créditos válidos
    if df_com_notas['TOTAL CREDITS'].sum() == 0:
        print("Não há créditos válidos para calcular a média.")
        return

    # Calcula os componentes da média ponderada
    soma_ponderada_notas = (df_com_notas['GRADE'] * df_com_notas['TOTAL CREDITS']).sum()
    total_creditos_validos = df_com_notas['TOTAL CREDITS'].sum()

    # Calcula a média final
    media = soma_ponderada_notas / total_creditos_validos

    # Usa a variável 'precision' para formatar a string de saída
    print(f"Sua Média Ponderada Geral é: {media:.{precision}f}")

In [6]:
media_ponderada_geral(df,4)

Sua Média Ponderada Geral é: 7.9313


In [7]:
modified_df = df.copy()

# Coloque aqui a sua nota de Sistemas Operacionais
sua_nova_nota = 8.0

# Usa .loc para encontrar a linha e atualizar a coluna 'GRADE'
modified_df.loc[modified_df['COURSE NAME'] == 'Sistemas Operacionais', 'GRADE'] = sua_nova_nota

print("--- Nota de Sistemas Operacionais atualizada! ---")

# Vamos verificar a linha modificada para confirmar a alteração
print(modified_df[modified_df['COURSE NAME'] == 'Sistemas Operacionais'])

--- Nota de Sistemas Operacionais atualizada! ---
Empty DataFrame
Columns: [SEMESTER, UNIT, YEAR, ANUAL SEMESTER, COURSE NAME, TOTAL CREDITS, LECTURE CREDITS, WORK CREDITS, GRADE]
Index: []


In [8]:
media_ponderada_geral(modified_df,4)

Sua Média Ponderada Geral é: 7.9313


In [9]:
# --- FLUXO DE VERIFICAÇÃO COMPLETO (AGORA COM A FUNÇÃO CORRIGIDA) ---

# 1. Crie uma cópia limpa do DataFrame original para a simulação
modified_df = df.copy()

# 2. Defina a nova nota e atualize-a no DataFrame modificado
sua_nova_nota = 8.0
modified_df.loc[modified_df['COURSE NAME'] == 'Sistemas Operacionais', 'GRADE'] = sua_nova_nota

print(f"Nota de 'Sistemas Operacionais' foi atualizada para {sua_nova_nota} no DataFrame 'modified_df'.")
print("-----------------------------------------------------------------")


# 3. Calcule e exiba a média Ponderada ANTES da mudança (usando o 'df' original)
print("\n--- Média Ponderada Original (sem a nota de SO) ---")
media_ponderada_geral(df, 4)


# 4. Calcule e exiba a média Ponderada DEPOIS da mudança (usando o 'modified_df')
print("\n--- Média Ponderada Nova (com a nota de SO = 8.0) ---")
media_ponderada_geral(modified_df, 4)

Nota de 'Sistemas Operacionais' foi atualizada para 8.0 no DataFrame 'modified_df'.
-----------------------------------------------------------------

--- Média Ponderada Original (sem a nota de SO) ---
Sua Média Ponderada Geral é: 7.9313

--- Média Ponderada Nova (com a nota de SO = 8.0) ---
Sua Média Ponderada Geral é: 7.9313


In [16]:
# --- TENTATIVA FINAL E DEFINITIVA ---
import pandas as pd

# Recarregue os dados para garantir que estamos começando do zero
# Verifique se o caminho do arquivo está correto
csv_path = 'data/historico14-07_data.csv'
try:
    df = pd.read_csv(csv_path)
    print(f"DataFrame recarregado com sucesso de '{csv_path}'.")
except Exception as e:
    print(f"Erro ao ler o arquivo: {e}")
    # Interrompe a execução se o arquivo não puder ser lido
    df = None

# Função final e corrigida
def media_ponderada_geral(df_input, precision):
    df = df_input.copy()
    df['GRADE'] = pd.to_numeric(df['GRADE'], errors='coerce')
    df['TOTAL CREDITS'] = pd.to_numeric(df['TOTAL CREDITS'], errors='coerce')
    df_com_notas = df.dropna(subset=['GRADE'])
    if df_com_notas['TOTAL CREDITS'].sum() == 0:
        print("Não há créditos válidos para calcular a média.")
        return
    soma_ponderada_notas = (df_com_notas['GRADE'] * df_com_notas['TOTAL CREDITS']).sum()
    total_creditos_validos = df_com_notas['TOTAL CREDITS'].sum()
    media = soma_ponderada_notas / total_creditos_validos
    print(f"Sua Média Ponderada Geral é: {media:.{precision}f}")


if df is not None:
    # --- SIMULAÇÃO ---
    # Crie a cópia
    modified_df = df.copy()

    # Defina a nova nota
    sua_nova_nota = 8.0

    # ---- A MUDANÇA MAIS IMPORTANTE ESTÁ AQUI ----
    # Em vez de '==', usamos '.str.contains()' que é mais robusto a espaços e outros caracteres
    condicao = modified_df['COURSE NAME'].str.contains('Sistemas Operacionais', case=False, na=False)
    
    # Verifique se a condição encontrou a disciplina
    if condicao.sum() == 0:
        print("\nERRO CRÍTICO: A disciplina 'Sistemas Operacionais' não foi encontrada no DataFrame. Verifique o nome no CSV.")
    else:
        # Aplique a modificação
        modified_df.loc[condicao, 'GRADE'] = sua_nova_nota
        print(f"\nNota de 'Sistemas Operacionais' ATUALIZADA para {sua_nova_nota}.")
        # Mostre a linha alterada para provar que a modificação funcionou
        print("Verificação da linha modificada:")
        print(modified_df[condicao])

    # --- COMPARAÇÃO FINAL ---
    print("\n--- Média Ponderada Original ---")
    media_ponderada_geral(df, 4)

    print("\n--- Média Ponderada Modificada ---")
    media_ponderada_geral(modified_df, 4)

DataFrame recarregado com sucesso de 'data/historico14-07_data.csv'.

Nota de 'Sistemas Operacionais' ATUALIZADA para 8.0.
Verificação da linha modificada:
    SEMESTER UNIT  YEAR ANUAL SEMESTER            COURSE NAME  TOTAL CREDITS  \
35       7.0  760  2025    1º Semestre  Sistemas Operacionais              4   

    LECTURE CREDITS  WORK CREDITS GRADE  
35                3             1   8.0  

--- Média Ponderada Original ---
Sua Média Ponderada Geral é: 7.6247

--- Média Ponderada Modificada ---
Sua Média Ponderada Geral é: 7.6260


In [13]:
# --- CÉLULA DE DIAGNÓSTICO DEFINITIVA ---
import pandas as pd
print(f"Usando a versão do Pandas: {pd.__version__}")

def media_ponderada_geral_debug(df_input, precision, label):
    """
    Função de depuração que calcula a média ponderada e mostra cada passo.
    """
    print(f"\n--- EXECUTANDO FUNÇÃO PARA: '{label}' ---")
    
    # Trabalha em uma cópia para não ter efeitos colaterais
    df = df_input.copy()
    print(f"'{label}': Cópia interna do DataFrame criada.")

    # Converte os tipos de dados
    df['GRADE'] = pd.to_numeric(df['GRADE'], errors='coerce')
    df['TOTAL CREDITS'] = pd.to_numeric(df['TOTAL CREDITS'], errors='coerce')

    # Mostra o estado da disciplina específica APÓS a conversão de tipo
    so_row = df[df['COURSE NAME'] == 'Sistemas Operacionais']
    print(f"'{label}': Estado da disciplina 'SO' nesta cópia: \n{so_row[['COURSE NAME', 'GRADE', 'TOTAL CREDITS']]}\n")

    # Filtra as linhas que de fato têm notas numéricas
    df_com_notas = df.dropna(subset=['GRADE'])
    
    total_creditos_calculado = df_com_notas['TOTAL CREDITS'].sum()
    print(f"'{label}': Total de créditos que entrarão no cálculo: {total_creditos_calculado}")
    
    if total_creditos_calculado == 0:
        print("Não há créditos válidos para calcular a média.")
        return

    # Calcula os componentes da média
    soma_ponderada_notas = (df_com_notas['GRADE'] * df_com_notas['TOTAL CREDITS']).sum()
    media = soma_ponderada_notas / total_creditos_calculado
    
    print(f"'{label}': Média calculada final: {media:.{precision}f}")
    print("-" * 35)
    return media

# --- FLUXO DE VERIFICAÇÃO ---

# 1. Carregue os dados do CSV novamente para garantir um estado limpo
# !!! IMPORTANTE: CONFIRME SE O NOME DO ARQUIVO CSV ABAIXO ESTÁ CORRETO !!!
csv_path = 'data/historico14-07_data.csv' 
try:
    df_original = pd.read_csv(csv_path)
    print(f"DataFrame original recarregado com sucesso de '{csv_path}'.")
except FileNotFoundError:
    print(f"ERRO: Arquivo não encontrado em '{csv_path}'. Por favor, verifique o nome e o caminho do arquivo.")
    df_original = None

if df_original is not None:
    # 2. Crie a cópia modificada
    modified_df = df_original.copy()
    modified_df.loc[modified_df['COURSE NAME'] == 'Sistemas Operacionais', 'GRADE'] = 8.0

    # 3. Execute a função de debug para ambos os DataFrames
    media_original = media_ponderada_geral_debug(df_original, 4, "DataFrame Original")
    media_modificada = media_ponderada_geral_debug(modified_df, 4, "DataFrame Modificado")

    print("\n================== RESULTADO FINAL ==================")
    print(f"Média Original Calculada:   {media_original}")
    print(f"Média Modificada Calculada: {media_modificada}")
    
    if media_original and media_modificada and media_original != media_modificada:
        print("\nSUCESSO! As médias são diferentes como esperado.")
    else:
        print("\nFALHA. As médias ainda são idênticas, o que indica um problema muito incomum com os dados ou o ambiente.")

Usando a versão do Pandas: 2.2.3
DataFrame original recarregado com sucesso de 'data/historico14-07_data.csv'.

--- EXECUTANDO FUNÇÃO PARA: 'DataFrame Original' ---
'DataFrame Original': Cópia interna do DataFrame criada.
'DataFrame Original': Estado da disciplina 'SO' nesta cópia: 
Empty DataFrame
Columns: [COURSE NAME, GRADE, TOTAL CREDITS]
Index: []

'DataFrame Original': Total de créditos que entrarão no cálculo: 131
'DataFrame Original': Média calculada final: 7.9313
-----------------------------------

--- EXECUTANDO FUNÇÃO PARA: 'DataFrame Modificado' ---
'DataFrame Modificado': Cópia interna do DataFrame criada.
'DataFrame Modificado': Estado da disciplina 'SO' nesta cópia: 
Empty DataFrame
Columns: [COURSE NAME, GRADE, TOTAL CREDITS]
Index: []

'DataFrame Modificado': Total de créditos que entrarão no cálculo: 131
'DataFrame Modificado': Média calculada final: 7.9313
-----------------------------------

Média Original Calculada:   7.931297709923665
Média Modificada Calculada: 