# Analisis Interaktif Volume Sampah Sungai DKI Jakarta

Proyek ini menganalisis data volume sampah sungai di DKI Jakarta dari Januari hingga Mei 2025 menggunakan dataset `RataRataVolumeSampahSungaiDKIJakarta.csv`. Dengan **Pandas** untuk pengolahan data dan **Plotly** untuk visualisasi interaktif, notebook ini menyediakan wawasan tentang pola sampah di berbagai kecamatan dan wilayah administratif.

## Dataset
- **periode_data**: Periode (YYYYMM, e.g., 202401)
- **wilayah**: Wilayah administratif (e.g., KOTA ADM. JAKARTA PUSAT)
- **kecamatan**: Nama kecamatan
- **volume_sampah**: Total volume sampah (ton)
- **total_sampah_residu**: Total sampah residu (ton)
- **rata_rata**: Rata-rata volume sampah per hari (ton)

## Analisis
1. Tren Volume Sampah per Wilayah
2. Top 5 Kecamatan dengan Volume Tertinggi
3. Perbandingan Volume Sampah Antar Wilayah
4. Korelasi Volume Sampah dan Residu
5. Pola Musiman di Kecamatan Jagakarsa

## Fitur Interaktif
- 🖱️ Hover untuk detail data
- 🔍 Zoom dan pan plot
- 🎚️ Toggle legenda untuk filter
- 📥 Ekspor plot ke PNG/HTML

In [1]:
# Import library
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

# Memuat dataset
df = pd.read_csv('RataRataVolumeSampahSungaiDKIJakarta.csv')

# Pembersihan data
df['periode_data'] = pd.to_datetime(df['periode_data'], format='%Y%m')
df = df.dropna()

# Standardisasi nama wilayah (menghapus variasi penulisan)
df['wilayah'] = df['wilayah'].str.replace('Kota Adm.', 'KOTA ADM.', case=False)
df['wilayah'] = df['wilayah'].str.strip()

ModuleNotFoundError: No module named 'plotly'

## 1. Tren Volume Sampah per Wilayah
Visualisasi tren rata-rata volume sampah per wilayah administratif menggunakan line plot interaktif.

In [None]:
# Mengelompokkan data
trend_data = df.groupby(['periode_data', 'wilayah'])['rata_rata'].mean().reset_index()

# Membuat line plot
fig1 = px.line(trend_data, x='periode_data', y='rata_rata', color='wilayah',
               title='Tren Rata-rata Volume Sampah per Wilayah (Jan-Mei 2025)',
               labels={'periode_data': 'Periode', 'rata_rata': 'Rata-rata Volume Sampah (ton)', 'wilayah': 'Wilayah'})
fig1.update_layout(legend=dict(orientation='h', yanchor='bottom', y=1.02, xanchor='right', x=1),
                   xaxis_title='Periode', yaxis_title='Rata-rata Volume Sampah (ton)')
fig1.show()

# Opsional: Simpan ke HTML
# fig1.write_html('tren_volume_sampah.html')

## 2. Top 5 Kecamatan dengan Volume Sampah Tertinggi
Mengidentifikasi 5 kecamatan dengan rata-rata volume sampah tertinggi per periode menggunakan bar plot interaktif.

In [None]:
# Mengelompokkan data
top_kecamatan = df.groupby(['periode_data', 'kecamatan'])['rata_rata'].mean().reset_index()
top_5 = top_kecamatan.groupby('periode_data').apply(lambda x: x.nlargest(5, 'rata_rata')).reset_index(drop=True)

# Membuat bar plot
fig2 = px.bar(top_5, x='periode_data', y='rata_rata', color='kecamatan', text='kecamatan',
              title='5 Kecamatan dengan Rata-rata Volume Sampah Tertinggi per Periode',
              labels={'periode_data': 'Periode', 'rata_rata': 'Rata-rata Volume Sampah (ton)', 'kecamatan': 'Kecamatan'})
fig2.update_traces(textposition='auto')
fig2.update_layout(legend=dict(orientation='h', yanchor='bottom', y=1.02, xanchor='right', x=1),
                   xaxis_title='Periode', yaxis_title='Rata-rata Volume Sampah (ton)')
fig2.show()

# Opsional: Simpan ke HTML
# fig2.write_html('top_kecamatan_sampah.html')

## 3. Perbandingan Volume Sampah Antar Wilayah
Membandingkan distribusi rata-rata volume sampah antar wilayah menggunakan box plot interaktif.

In [None]:
# Membuat box plot
fig3 = px.box(df, x='wilayah', y='rata_rata', color='wilayah',
              title='Distribusi Rata-rata Volume Sampah per Wilayah (Jan-Mei 2025)',
              labels={'wilayah': 'Wilayah', 'rata_rata': 'Rata-rata Volume Sampah (ton)'})
fig3.update_layout(xaxis_title='Wilayah', yaxis_title='Rata-rata Volume Sampah (ton)',
                   showlegend=False)
fig3.show()

# Opsional: Simpan ke HTML
# fig3.write_html('perbandingan_wilayah.html')

## 4. Korelasi Volume Sampah dan Total Sampah Residu
Menganalisis hubungan antara volume sampah dan total sampah residu menggunakan scatter plot interaktif.

In [None]:
# Menghitung korelasi
correlation = df[['volume_sampah', 'total_sampah_residu']].corr().loc['volume_sampah', 'total_sampah_residu']

# Membuat scatter plot
fig4 = px.scatter(df, x='volume_sampah', y='total_sampah_residu', trendline='ols',
                  title=f'Korelasi Volume Sampah vs Total Sampah Residu (Korelasi: {correlation:.2f})',
                  labels={'volume_sampah': 'Volume Sampah (ton)', 'total_sampah_residu': 'Total Sampah Residu (ton)'})
fig4.show()

# Opsional: Simpan ke HTML
# fig4.write_html('korelasi_sampah.html')

## 5. Pola Musiman di Kecamatan Jagakarsa
Menganalisis fluktuasi rata-rata volume sampah di kecamatan Jagakarsa menggunakan line plot interaktif.

In [None]:
# Memfilter data untuk Jagakarsa
jagakarsa_data = df[df['kecamatan'] == 'Jagakarsa']

# Membuat line plot
fig5 = px.line(jagakarsa_data, x='periode_data', y='rata_rata', markers=True,
               title='Pola Rata-rata Volume Sampah di Kecamatan Jagakarsa (Jan-Mei 2025)',
               labels={'periode_data': 'Periode', 'rata_rata': 'Rata-rata Volume Sampah (ton)'})
fig5.update_traces(line=dict(width=2), marker=dict(size=8))
fig5.update_layout(xaxis_title='Periode', yaxis_title='Rata-rata Volume Sampah (ton)')
fig5.show()

# Opsional: Simpan ke HTML
# fig5.write_html('pola_musiman_jagakarsa.html')