In [14]:
import pandas as pd

# Funkcija za računanje procenta uredjenih i neurednih za dati fajl
def izracunaj_procenta(df):
    total_aminokiseline = len(df)  # Ukupno aminokiselina
    if total_aminokiseline == 0:
        return "0%", "0%"  # Ako nema podataka, vrati 0% za oba
    
    df['Klasifikacija'] = df['Klasifikacija'].str.lower()  # Pretvaranje u mala slova 
    uredjeno = len(df[df['Klasifikacija'] == 'uređena'])  # Uređeni proteini
    neuredjeno = len(df[df['Klasifikacija'] == 'neuređena'])  # Neuređeni proteini

    procenat_uredjeno = (uredjeno / total_aminokiseline) * 100  # Procenat uredjenih
    procenat_neuredjeno = (neuredjeno / total_aminokiseline) * 100  # Procenat neurednih
    
    return f"{procenat_uredjeno:.2f}%", f"{procenat_neuredjeno:.2f}%"

# Putanje do fajlova
fajlovi = {
    'IUPRED3': {
        'matrix': '/home/pc/Desktop/Istrazivanje-podataka-2/Molske frakcije i frakcijske razlike/Filtriranje i molske frakcije IUPRED3/proteini_matrix_membrane.csv',
        'nucleoprotein': '/home/pc/Desktop/Istrazivanje-podataka-2/Molske frakcije i frakcijske razlike/Filtriranje i molske frakcije IUPRED3/proteini_nucleoprotein.csv',
        'spike': '/home/pc/Desktop/Istrazivanje-podataka-2/Molske frakcije i frakcijske razlike/Filtriranje i molske frakcije IUPRED3/proteini_spike_glykoprotein.csv'
    },
    'ISUNSTRUCT': {
        'matrix': '/home/pc/Desktop/Istrazivanje-podataka-2/Molske frakcije i frakcijske razlike/Filtriranje i molske frakcije ISUNSTRUCT/proteini_matrix_membrane.csv',
        'nucleoprotein': '/home/pc/Desktop/Istrazivanje-podataka-2/Molske frakcije i frakcijske razlike/Filtriranje i molske frakcije ISUNSTRUCT/proteini_nucleoprotein.csv',
        'spike': '/home/pc/Desktop/Istrazivanje-podataka-2/Molske frakcije i frakcijske razlike/Filtriranje i molske frakcije ISUNSTRUCT/proteini_spike_glykoprotein.csv'
    },
    'VSL2': {
        'matrix': '/home/pc/Desktop/Istrazivanje-podataka-2/Molske frakcije i frakcijske razlike/Filtriranje i molske frakcije VSL2/proteini_matrix_membrane.csv',
        'nucleoprotein': '/home/pc/Desktop/Istrazivanje-podataka-2/Molske frakcije i frakcijske razlike/Filtriranje i molske frakcije VSL2/proteini_nucleoprotein.csv',
        'spike': '/home/pc/Desktop/Istrazivanje-podataka-2/Molske frakcije i frakcijske razlike/Filtriranje i molske frakcije VSL2/proteini_spike_glykoprotein.csv'
    }
}

# Definisanje strukture izlazne tabele
izlazna_tabela = {
    'Naziv proteina': ['Membranski proteini', 'Nucleoproteini', 'Spike i Glycoproteini'],
    'IUPRED3 uređeno': [],
    'IUPRED3 neuređeno': [],
    'ISUNSTRUCT uređeno': [],
    'ISUNSTRUCT neuređeno': [],
    'VSL2 uređeno': [],
    'VSL2 neuređeno': []
}

# Obrada fajlova i dodavanje rezultata u izlaznu tabelu
for protein, proteini in fajlovi.items():
    for protein_tip, fajl in proteini.items():
        df = pd.read_csv(fajl)

        procenat_uredjeno, procenat_neuredjeno = izracunaj_procenta(df)
        
        # Dodajemo podatke u izlaznu tabelu
        if protein_tip == 'matrix':
            naziv_proteina = 'Membranski proteini'
        elif protein_tip == 'nucleoprotein':
            naziv_proteina = 'Nucleoproteini'
        elif protein_tip == 'spike':
            naziv_proteina = 'Spike i Glycoproteini'
        
        if protein == 'IUPRED3':
            izlazna_tabela['IUPRED3 uređeno'].append(procenat_uredjeno)
            izlazna_tabela['IUPRED3 neuređeno'].append(procenat_neuredjeno)
        elif protein == 'ISUNSTRUCT':
            izlazna_tabela['ISUNSTRUCT uređeno'].append(procenat_uredjeno)
            izlazna_tabela['ISUNSTRUCT neuređeno'].append(procenat_neuredjeno)
        elif protein == 'VSL2':
            izlazna_tabela['VSL2 uređeno'].append(procenat_uredjeno)
            izlazna_tabela['VSL2 neuređeno'].append(procenat_neuredjeno)

# Konvertovanje rezultata u DataFrame
final_df = pd.DataFrame(izlazna_tabela)

# Sačuvaj direktno u CSV fajl, bez ispisivanja tabele u terminalu
final_df.to_csv('/home/pc/Desktop/Istrazivanje-podataka-2/Procenti za uredjene i neuredjene delove/izlazna_tabela.csv', index=False)
