Data Analysis

In [1]:
import pandas as pd

# Read the CSV file
df = pd.read_csv("data_penjualan.csv")

# Calculate total revenue per product
df["Total_Pendapatan"] = df["Harga_Satuan"] * df["Jumlah_Terjual"]

# Revenue total product
total_revenue = df["Total_Pendapatan"].sum()
print("Total Pendapatan Keseluruhan:", total_revenue)
print()

# Most sold product
produk_terlaris = df.loc[df["Jumlah_Terjual"].idxmax()]
print("Produk Terlaris:", produk_terlaris["Nama_Produk"])
print()

# Revenue per product
revenue_per_produk = df.groupby("Nama_Produk")["Total_Pendapatan"].sum().reset_index()
revenue_per_produk = revenue_per_produk.sort_values(by="Total_Pendapatan", ascending=False)
print("Pendapatan per Produk:")
print(revenue_per_produk)
print()

# Products with more than 20 sold
produk_laris = df.loc[df["Jumlah_Terjual"]> 20]
print("Produk dengan Jumlah Terjual Lebih dari 20:")
print(produk_laris[["Nama_Produk", "Jumlah_Terjual"]])
print()

# Summary of product categories
df.to_csv("category_summary.csv", index=False)
summary_df = pd.read_csv("category_summary.csv")
print("Ringkasan Kategori Produk:")
print(summary_df)



Total Pendapatan Keseluruhan: 738000

Produk Terlaris: Air Mineral

Pendapatan per Produk:
       Nama_Produk  Total_Pendapatan
5  Keripik Kentang            150000
9        Teh Botol            110000
0      Air Mineral             90000
1          Biskuit             81000
4        Jus Jeruk             72000
2   Buku Gambar A4             60000
8      Roti Coklat             52500
3       Buku Tulis             50000
7        Pensil 2B             50000
6        Penghapus             22500

Produk dengan Jumlah Terjual Lebih dari 20:
   Nama_Produk  Jumlah_Terjual
1    Pensil 2B              25
3  Air Mineral              30
9    Teh Botol              22

Ringkasan Kategori Produk:
   ID_Transaksi      Nama_Produk    Kategori  Harga_Satuan  Jumlah_Terjual  \
0             1       Buku Tulis  Alat Tulis          5000              10   
1             2        Pensil 2B  Alat Tulis          2000              25   
2             3      Roti Coklat     Makanan          3500             

Data Visualization

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import os

#Read the CSV file
df = pd.read_csv("data_penjualan.csv")

# Calculate total revenue for each product
df["Total_Pendapatan"] = df["Harga_Satuan"] * df["Jumlah_Terjual"]

# Revenue per product
revenue_per_produk = df.groupby("Nama_Produk")["Total_Pendapatan"].sum().reset_index()
revenue_per_produk = revenue_per_produk.sort_values(by="Total_Pendapatan", ascending=False)

# Most sold products > 20 units
produk_terlaris = df[df["Jumlah_Terjual"] > 20]

# 1. Total Revenue per Product
plt.figure(figsize=(10, 6))
plt.bar(revenue_per_produk["Nama_Produk"], revenue_per_produk["Total_Pendapatan"])
plt.title("Total Pendapatan per Produk")
plt.xlabel("Nama Produk")
plt.ylabel("Total Pendapatan")
plt.xticks(rotation=45)
plt.tight_layout()
save_path1 = os.path.join(os.getcwd(), "total_revenue_per_product.png")
plt.savefig(save_path1)
print(f"Gambar berhasil disimpan di: {save_path1}")
plt.close()

# 2. Products with More than 20 Sold
plt.figure(figsize=(8, 5))
plt.bar(produk_terlaris["Nama_Produk"], produk_terlaris["Jumlah_Terjual"])
plt.title("Produk dengan Jumlah Terjual Lebih dari 20")
plt.xlabel("Nama Produk")
plt.ylabel("Jumlah Terjual")
plt.xticks(rotation=45)
plt.tight_layout()
save_path2 = os.path.join(os.getcwd(), "produk_terlaris_lebih_20.png")
plt.savefig(save_path2)
print(f"Gambar berhasil disimpan di: {save_path2}")
plt.close()

# 3. How Many Products Sold
plt.figure(figsize=(10, 6))
plt.bar(df["Nama_Produk"], df["Jumlah_Terjual"])
plt.title("Jumlah Terjual Semua Produk")
plt.xlabel("Nama Produk")
plt.ylabel("Jumlah Terjual")
plt.xticks(rotation=45)
plt.tight_layout()
save_path3 = os.path.join(os.getcwd(), "jumlah_terjual_semua_produk.png")
plt.savefig(save_path3)
print(f"Gambar berhasil disimpan di: {save_path3}")
plt.close()


Gambar berhasil disimpan di: c:\Users\USER\OneDrive\Desktop\GDGOC\total_revenue_per_product.png
Gambar berhasil disimpan di: c:\Users\USER\OneDrive\Desktop\GDGOC\produk_terlaris_lebih_20.png
Gambar berhasil disimpan di: c:\Users\USER\OneDrive\Desktop\GDGOC\jumlah_terjual_semua_produk.png
