In [1]:
import pandas as pd
import glob

# Ordnerpfad, in dem sich die .weight-Dateien befinden
folder_path = "./"  # Passe den Pfad an

# Alle .weight-Dateien im Ordner sammeln
weight_files = glob.glob(folder_path + "*.weights")

# Dictionary, um Ergebnisse zu sammeln
data = {}

# Dateien einlesen und Daten sammeln
for file in weight_files:
    print(f"Verarbeite Datei: {file}")
    try:
        # Lies die Datei ein und überspringe Kommentarzeilen
        df = pd.read_csv(file, delim_whitespace=True, comment='#', names=["POSNUM", "RESIDUETYPE", "WEIGHT"])
        
        for _, row in df.iterrows():
            key = (row["POSNUM"], row["RESIDUETYPE"])  # Kombination aus POSNUM und RESIDUETYPE
            weight = float(row["WEIGHT"])  # Gewicht extrahieren
            
            if key not in data:
                data[key] = []
            data[key].append(weight)
    except Exception as e:
        print(f"Fehler beim Verarbeiten der Datei {file}: {e}")

# Durchschnitt der Weights berechnen
result = []
for key, weights in data.items():
    avg_weight = sum(weights) / len(weights)
    result.append({
        "POSNUM": key[0],
        "RESIDUETYPE": key[1],
        "WEIGHT": avg_weight
    })

# Ergebnisse in ein DataFrame umwandeln
result_df = pd.DataFrame(result)

# Ergebnisse in eine neue Datei speichern
output_path = "./mpnn_probs.weights"  # Passe den Speicherpfad an
with open(output_path, "w") as f:
    f.write("#POSNUM RESIDUETYPE WEIGHT\n")  # Header hinzufügen
    result_df.to_csv(f, sep=' ', index=False, header=False)

print(f"Die durchschnittlichen Gewichte wurden in '{output_path}' gespeichert.")

Verarbeite Datei: ./20_763_mpnn_probs.weights
Verarbeite Datei: ./0_313_mpnn_probs.weights
Verarbeite Datei: ./20_853_mpnn_probs.weights
Verarbeite Datei: ./20_140_mpnn_probs.weights
Verarbeite Datei: ./10_30_mpnn_probs.weights
Verarbeite Datei: ./9_655_mpnn_probs.weights
Verarbeite Datei: ./13_905_mpnn_probs.weights
Verarbeite Datei: ./22_83_mpnn_probs.weights
Verarbeite Datei: ./20_25_mpnn_probs.weights
Verarbeite Datei: ./16_786_mpnn_probs.weights
Verarbeite Datei: ./20_104_mpnn_probs.weights
Verarbeite Datei: ./14_589_mpnn_probs.weights
Verarbeite Datei: ./15_150_mpnn_probs.weights
Verarbeite Datei: ./10_846_mpnn_probs.weights
Verarbeite Datei: ./14_478_mpnn_probs.weights
Verarbeite Datei: ./22_6_mpnn_probs.weights
Verarbeite Datei: ./9_435_mpnn_probs.weights
Verarbeite Datei: ./9_608_mpnn_probs.weights
Verarbeite Datei: ./15_627_mpnn_probs.weights
Verarbeite Datei: ./16_287_mpnn_probs.weights
Verarbeite Datei: ./0_156_mpnn_probs.weights
Verarbeite Datei: ./10_64_mpnn_probs.weights