In [1]:
import pandas as pd
import os

In [22]:
DERS_LISTESI_PATH = r'Ders Listesi.xlsx'
OGRENCI_LISTESI_PATH = r'ogrenci_listesi.xlsx'

In [15]:
def oku_ders_listesi(path: str, sheet_name: str = "Ders Listesi") -> pd.DataFrame:
    df = pd.read_excel(path, sheet_name=sheet_name, header=None)

    sinif_rows = df[df[0].astype(str).str.contains("Sınıf", case=False, na=False)].reset_index()

    rows = []
    for i in range(len(sinif_rows)):
        start = sinif_rows.loc[i, "index"] + 2 
        end = sinif_rows.loc[i+1, "index"] if i+1 < len(sinif_rows) else len(df)
        sinif = df.loc[sinif_rows.loc[i, "index"], 0]

        block = df.iloc[start:end, :3].copy()
        block.columns = ["DERS KODU", "DERSİN ADI", "DERSİ VEREN ÖĞR. ELEMANI"]
        secmeli_mask = block["DERS KODU"].astype(str).str.contains("Seçimlik|Seçmeli", case=False, na=False)

        if secmeli_mask.any():
            secmeli_index = secmeli_mask.idxmax()
            block = block.drop(secmeli_index)
            
            block["Seçmeli mi?"] = False
            block.loc[secmeli_index+1:, "Seçmeli mi?"] = True
        else:
            block["Seçmeli mi?"] = False

        block["SINIF"] = sinif
        rows.append(block)

    final_df = pd.concat(rows, ignore_index=True)
    
    final_df = final_df[~final_df["DERS KODU"].isin(['DERS KODU', 'DERSİN ADI', 'DERSİ VEREN ÖĞR. ELEMANI'])]
    
    final_df.to_excel("processed_ders_listesi.xlsx", index=False)
    
    return final_df

In [None]:
ders_list_df = oku_ders_listesi(DERS_LISTESI_PATH)
print(ders_list_df)

   DERS KODU                                     DERSİN ADI  \
0     AIT109           Atatürk İlkeleri ve İnkılap Tarihi I   
1     TDB107                                    Türk Dili I   
2     YDB117                                    İngilizce I   
3     FEF111                                        Fizik I   
4     FEF113                                   Lineer Cebir   
5     FEF115                                    Matematik I   
6     BLM101                      Bilgisayar Laboratuvarı I   
7     BLM103                Bilgisayar Mühendisliğine Giriş   
8     BLM105                                 Programlama I    
9     FEF203                        Diferansiyel Denklemler   
10    MUH201                    Nesneye Yönelik Programlama   
11    BLM207                 Veri Yapıları ve Algoritmaları   
12    BLM209                  Programlama Laboratuvarı - I    
13    BLM211               Mantıksal Tasarım ve Uygulamalar   
14    BLM205                                Ayrık Matem

In [18]:
def read_data(DATA_PATH):
    if DATA_PATH.endswith('.csv'):
        return pd.read_csv(DATA_PATH)
    elif DATA_PATH.endswith('.xlsx'):
        return pd.read_excel(DATA_PATH)
    else:
        raise ValueError("Unsupported file format")

In [26]:
ögrenci_list_df = read_data(OGRENCI_LISTESI_PATH)
print(ögrenci_list_df)

      Öğrenci No       Ad Soyad     Sınıf    Ders
0      210059017  Cansu Bozkurt  5. Sınıf  BLM401
1      210059017  Cansu Bozkurt  5. Sınıf  BLM405
2      210059017  Cansu Bozkurt  5. Sınıf  BLM411
3      210059017  Cansu Bozkurt  5. Sınıf  BLM417
4      210059017  Cansu Bozkurt  5. Sınıf  BLM421
...          ...            ...       ...     ...
3895   259757258     Nil Öztürk  1. Sınıf  FEF111
3896   259757258     Nil Öztürk  1. Sınıf  FEF113
3897   259757258     Nil Öztürk  1. Sınıf  FEF115
3898   259757258     Nil Öztürk  1. Sınıf  TDB107
3899   259757258     Nil Öztürk  1. Sınıf  YDB117

[3900 rows x 4 columns]


In [27]:
ögrenci_list_df

Unnamed: 0,Öğrenci No,Ad Soyad,Sınıf,Ders
0,210059017,Cansu Bozkurt,5. Sınıf,BLM401
1,210059017,Cansu Bozkurt,5. Sınıf,BLM405
2,210059017,Cansu Bozkurt,5. Sınıf,BLM411
3,210059017,Cansu Bozkurt,5. Sınıf,BLM417
4,210059017,Cansu Bozkurt,5. Sınıf,BLM421
...,...,...,...,...
3895,259757258,Nil Öztürk,1. Sınıf,FEF111
3896,259757258,Nil Öztürk,1. Sınıf,FEF113
3897,259757258,Nil Öztürk,1. Sınıf,FEF115
3898,259757258,Nil Öztürk,1. Sınıf,TDB107
