# Analytic Hafalan Tahun 2025

## 1. Business Understanding

### Tujuan

Menyajikan visualisasi hafalan dari mahasiswa

### Pertanyaan 

1. Bagaimana perbandingan antar program studi?
2. Bagaimana distribusi berdasarkan jenis kelamin?
3. Bagaimana jumlah juz yang dihafal mahasiswa tersebar per fakultas/prodi/kelamin



### Indikator Utama

- Fakultas
- Prodi
- Kelamin
- Jumlah juz yang dihafal

## 2. Data Understanding

- NIM : Nomor identitas dari mahasiswa
- Nama : Nama mahasiswa
- Jenis Kelamin : Jenis Kelamin dari mahasiswa
- Hafalan : Berapa banyak hafalan dari mahasiswa

In [1]:
import pandas as pd
import plotly.express as px

In [2]:
file_path = "../dataset/Kategori_Hafalan_2025.xlsx"
xls = pd.ExcelFile(file_path, engine="openpyxl")
print("Sheet tersedia :", xls.sheet_names)

Sheet tersedia : ['Mentee Spesial 5-10 Juz', 'Mentee Spesial 11-20 Juz', 'Mentee Spesial 21-30 Juz']


In [3]:
all_data = []
for sheet in xls.sheet_names:
    df = pd.read_excel(xls, sheet_name=sheet)
    all_data.append(df)

df_all = pd.concat(all_data, ignore_index=True)

print("Jumlah data:", len(df_all))

Jumlah data: 308


In [4]:
df = df_all[["NIM", "Nama", "Keterangan", "Hafalan"]].copy()
df.head()

Unnamed: 0,NIM,Nama,Keterangan,Hafalan
0,A210250004,NISRINA HASNA MUFIDAH,Akhwat,9 juz
1,A210250029,ANISA FITRI RAHMADANI,Akhwat,Ziyadah 5 Juz
2,A310250010,ALYA PUTRI NAFISAH,Akhwat,6 Juz
3,A310250011,NELSHA AZALIA ILAFFI,Akhwat,6 Juz
4,A410250016,DIAN FADILA HESRINDRA,Akhwat,8 Juz


In [5]:
df.isna().sum()

NIM           0
Nama          0
Keterangan    0
Hafalan       0
dtype: int64

In [6]:
df.duplicated().sum()

np.int64(2)

## 3. Data Preparation

In [7]:
df = df.drop_duplicates()

In [8]:
df['Nama'] = df['Nama'].str.title()
df['Keterangan'] = df['Keterangan'].str.title()
df['Keterangan'] = df['Keterangan'].str.strip()
df['Hafalan'] = df['Hafalan'].str.title()

In [9]:
df.loc[df['Nama'] == "Sabrina Zahra Rahadyana", "NIM"] = "F100250033"
df.loc[df['Nama'] == "Anisa Fitri Rahmadani", "Hafalan"] = "5 Juz"

In [10]:
df['Hafalan'] = df['Hafalan'].astype(str).str.replace("Juz","",case=False).str.strip().astype(int)

In [11]:
nim_prodi = {
    'A2' : 'Pendidikan Akuntansi',
    'A31' : 'Pendidikan Bahasa dan Sastra Indonesia',
    'A32' : 'Pendidikan Bahasa Inggris',
    'A41' : 'Pendidikan Matematika',
    'A42' : 'Pendidikan Biologi',
    'A51' : 'Pendidikan Guru Sekolah Dasar',
    'A71' : 'Pendidikan Teknik Informatika',
    'A81' : 'Pendidikan Jasmani',
    'B1' : 'Manajemen',
    'B2' : 'Akuntansi',
    'B3' : 'Ekonomi Pembangunan',
    'B4' : 'Bisnis Digital',
    'C1' : 'Ilmu Hukum',
    'C2' : 'Hubungan Internasional',
    'D1' : 'Teknik Sipil',
    'D2' : 'Teknik Mesin',
    'D3' : 'Arsitektur',
    'D4' : 'Teknik Elektro',
    'D6' : 'Teknik Industri',
    'E2' : 'Sains Informasi Geografi',
    'F1' : 'Psikologi',
    'G0' : 'Pendidikan Agama Islam',
    'G1' : 'Ilmu Al Quran dan Tafsir',
    'I0' : 'Hukum Ekonomi Syari`ah',
    'J1' : 'Fisioterapi',
    'J2' : 'Ilmu Keperawatan',
    'J3' : 'Ilmu Gizi',
    'J4' : 'Kesehatan Masyarakat',
    'J52' : 'Pendidikan Dokter Gigi',
    'J5' : 'Kedokteran',
    'K1' : 'Farmasi',
    'L1' : 'Ilmu Komunikasi',
    'L2' : 'Teknik Informatika',
    'L3' : 'Sistem Informasi',
}
nim_fakultas = {
    'I0' : 'Fakultas Agama Islam',
    'G0' : 'Fakultas Agama Islam',
    'G1' : 'Fakultas Agama Islam',
    'B1' : 'Fakultas Ekonomi & Bisnis', 
    'B2' : 'Fakultas Ekonomi & Bisnis',
    'B3' : 'Fakultas Ekonomi & Bisnis',
    'B4' : 'Fakultas Ekonomi & Bisnis',
    'K1' : 'Fakultas Farmasi',
    'E2' : 'Fakultas Geografi',
    'C1' : 'Fakultas Hukum & Ilmu Politik',
    'C2' : 'Fakultas Hukum & Ilmu Politik',
    'J1' : 'Fakultas Ilmu Keperawatan',
    'J2' : 'Fakultas Ilmu Keperawatan',
    'J3' : 'Fakultas Ilmu Keperawatan',
    'J4' : 'Fakultas Ilmu Keperawatan',
    'J52' : 'Fakultas Kedokteran Gigi',
    'J5' : 'Fakultas Kedokteran',
    'A2' : 'Fakultas Keguruan & Ilmu Pendidikan', 
    'A31' : 'Fakultas Keguruan & Ilmu Pendidikan', 
    'A32' : 'Fakultas Keguruan & Ilmu Pendidikan', 
    'A41' : 'Fakultas Keguruan & Ilmu Pendidikan', 
    'A42' : 'Fakultas Keguruan & Ilmu Pendidikan', 
    'A51' : 'Fakultas Keguruan & Ilmu Pendidikan', 
    'A71' : 'Fakultas Keguruan & Ilmu Pendidikan', 
    'A81' : 'Fakultas Keguruan & Ilmu Pendidikan',
    'L1' : 'Fakultas Komunikasi & Informatika',
    'L2' : 'Fakultas Komunikasi & Informatika',
    'L3' : 'Fakultas Komunikasi & Informatika',
    'F1' : 'Fakultas Psikologi',
    'D1' : 'Fakultas Teknik',
    'D2' : 'Fakultas Teknik',
    'D3' : 'Fakultas Teknik',
    'D4' : 'Fakultas Teknik',
    'D6' : 'Fakultas Teknik' ,
}

def find_prodi(nim):
    nim = str(nim).strip()
    for kode, prodi in nim_prodi.items():
        if nim.startswith(kode):
            return prodi
        

def find_fakultas(nim):
    nim = str(nim).strip()
    for kode, fakultas in nim_fakultas.items():
        if nim.startswith(kode):
            return fakultas
        
df['Fakultas'] = df['NIM'].apply(find_fakultas)
df['Program Studi'] = df['NIM'].apply(find_prodi)
organize = ['NIM', 'Nama', "Keterangan", "Fakultas", "Program Studi", "Hafalan"]
df = df[organize]

In [12]:
df.head()

Unnamed: 0,NIM,Nama,Keterangan,Fakultas,Program Studi,Hafalan
0,A210250004,Nisrina Hasna Mufidah,Akhwat,Fakultas Keguruan & Ilmu Pendidikan,Pendidikan Akuntansi,9
1,A210250029,Anisa Fitri Rahmadani,Akhwat,Fakultas Keguruan & Ilmu Pendidikan,Pendidikan Akuntansi,5
2,A310250010,Alya Putri Nafisah,Akhwat,Fakultas Keguruan & Ilmu Pendidikan,Pendidikan Bahasa dan Sastra Indonesia,6
3,A310250011,Nelsha Azalia Ilaffi,Akhwat,Fakultas Keguruan & Ilmu Pendidikan,Pendidikan Bahasa dan Sastra Indonesia,6
4,A410250016,Dian Fadila Hesrindra,Akhwat,Fakultas Keguruan & Ilmu Pendidikan,Pendidikan Matematika,8


## 4. Visualisasi

In [13]:
fig = px.bar(df, x="Fakultas", color="Fakultas",
             title = "Jumlah Mahasiswa per Fakultas",)
fig.update_layout(xaxis_title='', yaxis_title='Jumlah Mahasiswa')
fig.show()

In [14]:
fig = px.pie(df, names='Keterangan', title='Perbandingan Gender Keseluruhan')
fig.show()

In [15]:
fig = px.bar(df, x='Fakultas', color='Keterangan',
             title='Distribusi Gender per Fakultas',
             barmode='group')
fig.update_layout(xaxis_title='', yaxis_title='Jumlah Mahasiswa')
fig.show()


In [16]:
df_avg = df.groupby('Fakultas', as_index=False)['Hafalan'].mean()

fig = px.bar(df_avg, x='Fakultas', y='Hafalan',
             title='Rata-rata Jumlah Juz yang Dihafal per Fakultas',
             text_auto=True, color='Fakultas')
fig.update_layout(xaxis_title='', yaxis_title='Rata-rata Juz')
fig.show()


In [17]:
df.to_csv("../dataset/Kategori_Hafalan_2025_Cleaned.csv", index=False)

In [18]:
df.to_parquet("../dataset/Kategori_Hafalan_2025.parquet", index=False)