Proyek ini berisi skrip Python untuk melakukan analisis sederhana terhadap data nilai siswa berdasarkan mata pelajaran. Data dibaca dari file nilai_siswa.csv dan dianalisis menggunakan library pandas, matplotlib, dan seaborn.
Skrip ini melakukan beberapa analisis, antara lain:
- Menampilkan 5 baris pertama (
head()). - Menampilkan informasi struktur data (
info()). - Menampilkan statistik deskriptif (
describe()).
- Rata-rata nilai (mean)
- Median nilai
- Modus nilai (nilai yang paling sering muncul)
Skrip memisahkan nilai untuk masing-masing mata pelajaran:
- Matematika
- Bahasa Inggris
- Bahasa Indonesia
- Menghitung nilai maksimum dan minimum tiap mata pelajaran (
groupby()). - Menghitung nilai rata-rata per mata pelajaran.
Skrip menghasilkan dua grafik:
Menggunakan matplotlib untuk menampilkan rata-rata nilai.
Menggunakan seaborn untuk menunjukkan penyebaran nilai tiap mata pelajaran.
project-folder/
│
├── nilai_siswa.csv # Dataset nilai siswa
├── analysis.py # Skrip Python (berisi kode analisis)
└── README.md # Dokumentasi proyek
pip install pandas matplotlib seabornpython analysis.pyPastikan file nilai_siswa.csv berada pada direktori yang sama dengan skrip Python.
Skrip menghasilkan:
- Grafik batang rata-rata nilai per mata pelajaran
- Boxplot distribusi nilai per mata pelajaran
Kedua grafik tersebut ditampilkan otomatis menggunakan matplotlib.
- Pastikan nama kolom pada dataset sesuai dengan skrip (
nilai,Nilai,Matpel). - Jika ada perbedaan penamaan (misalnya huruf besar/kecil), sesuaikan pada kode.
Proyek ini menggunakan Python untuk melakukan analisis statistik dasar pada dataset nilai siswa yang disimpan dalam file nilai_siswa.csv. Analisis mencakup penampilan data awal, informasi struktur data, statistik deskriptif, serta perhitungan nilai mean, median, dan modus.
Skrip Python ini melakukan beberapa hal berikut:
Membaca file CSV menggunakan pandas:
data = pd.read_csv('nilai_siswa.csv')Menampilkan 5 baris pertama:
print(data.head())Untuk melihat tipe data, jumlah baris, dan memori:
data.info()Menampilkan statistik seperti mean, std, min, max, dan quartile:
print(data.describe())Analisis menggunakan kolom nilai:
data['nilai'].mean() # Rata-rata
data['nilai'].median() # Median
data['nilai'].mode()[0]# ModusOutput berupa:
- Rata-rata nilai siswa
- Nilai median
- Nilai modus
project-folder/
│
├── nilai_siswa.csv # Dataset nilai siswa
├── analysis.py # Skrip analisis data
└── README.md # Dokumentasi proyek
Pastikan library berikut sudah terpasang:
pip install pandas seaborn matplotlibpython analysis.pyPastikan file nilai_siswa.csv berada dalam direktori yang sama.
- Dataset wajib memiliki kolom bernama
nilaiagar perhitungan statistik berjalan. - Jika nama kolom berbeda, sesuaikan pada script.
Kalau kamu ingin versi README yang lebih panjang, lebih ringkas, atau pakai bahasa Indonesia versi formal / akademik, tinggal bilang saja!