<a href="https://colab.research.google.com/github/galanghanaf/matkul-pda/blob/main/catatan_keuangan.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/MAROON-LABKOM/script-praktikum/blob/master/pemrograman-data-analisis/catatan-keuangan.ipynb)

# **Memuat Data**

In [1]:
import pandas as pd
import plotly.express as px

In [2]:
url = "https://github.com/MAROON-LABKOM/script-praktikum/blob/master/pemrograman-data-analisis/catatan_keuangan.xlsx?raw=true"
df = pd.read_excel(url, sheet_name="Sheet1", parse_dates=["Tanggal"])
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 14 entries, 0 to 13
Data columns (total 4 columns):
 #   Column      Non-Null Count  Dtype         
---  ------      --------------  -----         
 0   Tanggal     14 non-null     datetime64[ns]
 1   Jenis       14 non-null     object        
 2   Keterangan  14 non-null     object        
 3   Total       14 non-null     float64       
dtypes: datetime64[ns](1), float64(1), object(2)
memory usage: 576.0+ bytes


# **Menampilkan Data**

In [3]:
df.head()

Unnamed: 0,Tanggal,Jenis,Keterangan,Total
0,2021-09-18,Makanan,Kin Yoghurt Blueberry,7500.0
1,2021-09-18,Transportasi,Angkot 08,10000.0
2,2021-09-18,Transportasi,Angkot 03,5000.0
3,2021-09-18,Makanan,Aqua,5000.0
4,2021-09-18,Makanan,BreadTalk,71000.0


# **Filter Data Berdasarkan Tanggal dan Jenis Pengeluaran**

In [4]:
# mendeklarasikan variabel untuk memfilter data berdasarkan tanggal dan jenis pengeluaran.

tanggal_awal = pd.to_datetime("2021-09-01")
tanggal_akhir = pd.to_datetime("2021-09-30")
jenis = ["Makanan", "Transportasi", "Utilitas"]

# mengambil subset data berdasarkan tanggal.
subset_df = df[(df["Tanggal"] >= tanggal_awal) & (df["Tanggal"] <= tanggal_akhir)]

In [5]:
# menghitung jumlah dan rata-rata total pengeluaran.
total_pengeluaran = subset_df["Total"].sum()
rata_rata_pengeluaran = subset_df["Total"].mean()

# menampilkan jumlah dan rata-rata pengeluaran.
print(f"Total pengeluaran: {total_pengeluaran:,}")
print(f"Rata-rata pengeluaran: {rata_rata_pengeluaran:,}")

Total pengeluaran: 1,330,700.0
Rata-rata pengeluaran: 95,050.0


# **Mengelompokkan Data Berdasarkan Tanggal dan Menghitung Jumlanya**

In [6]:
subset_df

Unnamed: 0,Tanggal,Jenis,Keterangan,Total
0,2021-09-18,Makanan,Kin Yoghurt Blueberry,7500.0
1,2021-09-18,Transportasi,Angkot 08,10000.0
2,2021-09-18,Transportasi,Angkot 03,5000.0
3,2021-09-18,Makanan,Aqua,5000.0
4,2021-09-18,Makanan,BreadTalk,71000.0
5,2021-09-18,Makanan,Ichiban Sushi,78500.0
6,2021-09-18,Transportasi,Angkot 03,5000.0
7,2021-09-18,Transportasi,Angkot 08,8000.0
8,2021-09-18,Utilitas,Kuota 5 GB,12500.0
9,2021-09-14,Makanan,Belanja Mingguan,300000.0


In [7]:
subset_df.groupby("Tanggal").sum().sort_values("Total", ascending=False)

Unnamed: 0_level_0,Total
Tanggal,Unnamed: 1_level_1
2021-09-05,668800.0
2021-09-14,300000.0
2021-09-18,202500.0
2021-09-04,145000.0
2021-09-17,14400.0


# **Menampilkan Diagram Garis Berdasarkan Tanggal**

In [8]:
# mengelompokkan data berdasarkan tanggal.
line_df = subset_df.groupby("Tanggal").sum()

#  melakukan reindexing yaitu proses untuk membuat ulang indeks pada DataFrame agar 
#jarak antar indeks menjadi sama rata. Hal ini perlu dilakukan karena tanggal catatan 
#yang ada pada dataset tidak selalu ada setiap hari, sehingga untuk mengisi hari-hari 
#yang tidak ada dalam catatan perlu dilakukan reindex.
line_df = line_df.reindex(pd.date_range(start=tanggal_awal, end=tanggal_akhir, freq="1D"))

# mengisi baris yang kosong dengan angka 0
line_df = line_df.fillna(0)

# reset indeks yang awalnya tanggal menjadi kolom biasa.
line_df = line_df.reset_index()

# menampilkan diagram garis dari data.
fig = px.line(line_df, x="index", y="Total")
fig.show()

# **Menampilkan Diagram Pie Berdasarkan Jenis Pengeluaran**

In [9]:
# mengelompokkan data berdasarkan jenis pengeluaran, 
# kemudian menjumlahkan data berdasarkan grupnya, dan mereset indeks.
pie_df = subset_df.groupby("Jenis").sum().reset_index()

# menampilkan diagram lingkaran dari data.
fig = px.pie(pie_df, names="Jenis", values="Total")
fig.show()

In [10]:
# membuat tabel pivot dengan kolom tanggal sebagai indeks dan 
# jenis-jenis pengeluaran sebagai kolom. Nilai yang diagregasi adalah total 
# pengeluaran berdasarkan tanggal dan jenis pengeluaran. Selain itu parameter 
# margins digunakan untuk menambahkan grand total pada baris dan kolom.
subset_df.pivot_table(index="Tanggal", columns="Jenis", values="Total", fill_value="-", margins=True, margins_name="Grand Total")

Jenis,Makanan,Transportasi,Utilitas,Grand Total
Tanggal,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2021-09-04 00:00:00,145000.0,-,-,145000.0
2021-09-05 00:00:00,-,-,334400.0,334400.0
2021-09-14 00:00:00,300000.0,-,-,300000.0
2021-09-17 00:00:00,-,-,14400.0,14400.0
2021-09-18 00:00:00,40500.0,7000.0,12500.0,22500.0
Grand Total,101166.666667,7000.0,173925.0,95050.0
