# Proyek Analisis Data: Bike Sharing Dataset
- **Nama:** Rayhan Ahmad Rizalullah
- **Email:** ray.ahmdr@gmail.com
- **ID Dicoding:** rayhanahmadr

## Menentukan Pertanyaan Bisnis

1. Apa hari dengan penyewa casual terbanyak?
2. Apa musim dengan penyewa sepeda paling sedikit?
3. Bagaimana tren peminjaman sepeda berubah sepanjang hari dari pagi hingga malam?

## Import Semua Packages/Library yang Digunakan

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import streamlit as st

sns.set_theme(style='dark')

## Data Wrangling

### Gathering Data

Mambaca day.csv dan hour.csv

In [None]:
day_df = pd.read_csv("./data/day.csv")
day_df.head()

In [None]:
hour_df = pd.read_csv("./data/hour.csv")
hour_df.head()

### Assessing Data

#### Menilai Data day_df

In [None]:
day_df.info()

Periksa apakah ada value yang null

In [None]:
day_df.isna().sum()

Periksa jumlah data yang duplikat

In [None]:
print("Jumlah duplikasi data: ", day_df.duplicated().sum())

In [None]:
day_df.describe()

#### Menilai Data hour_df

In [None]:
hour_df.info()

Periksa apakah ada value yang null

In [None]:
hour_df.isna().sum()

Periksa jumlah data yang duplikat

In [None]:
print("Jumlah duplikasi data: ", hour_df.duplicated().sum())

In [None]:
hour_df.describe()

### Cleaning Data

Mengubah Dtype kolom "dteday" dari object menjadi datetime pada dataframe day_df dan hour_df

In [None]:
day_df['dteday'] = pd.to_datetime(day_df['dteday'])
hour_df['dteday'] = pd.to_datetime(hour_df['dteday'])

## Exploratory Data Analysis (EDA)

### Eksplorasi DataFrame day_df dan hour_df

In [None]:
day_df.describe(include="all")

#### Berdasarkan hari:

In [None]:
day_df.groupby(by=["weekday"]).agg({
    "casual":"mean",
    "registered":"mean",
})

#### Berdasarkan musim:

In [None]:
# Membuat kamus untuk memetakan angka musim ke label yang sesuai
nama_musim = {
    1: 'Musim Semi',
    2: 'Musim Panas',
    3: 'Musim Gugur',
    4: 'Musim Dingin'
}

# Menghitung rata-rata jumlah peminjaman sepeda berdasarkan musim
mean_cnt_per_season = day_df.groupby(by="season").cnt.mean()

# Mengganti indeks angka musim dengan label musim yang sesuai
mean_cnt_per_season.index = mean_cnt_per_season.index.map(nama_musim)

# Menampilkan hasil
print(mean_cnt_per_season)

#### Berdasarkan periode waktu:

In [None]:
# Membuat fungsi untuk mengkategorikan waktu
def categorize_time(hour):
    if hour >= 5 and hour < 11:
        return "Pagi"
    elif hour >= 11 and hour < 15:
        return "Siang"
    elif hour >= 15 and hour < 18:
        return "Sore"
    else:
        return "Malam"

# Menambahkan kolom "time_category" yang berisi kategori waktu
hour_df['time_category'] = hour_df['hr'].apply(categorize_time)

# Melakukan groupby berdasarkan kategori waktu dan menghitung jumlah peminjaman sepeda
time_category_counts = hour_df.groupby('time_category')['cnt'].mean()

# Menampilkan hasil
time_category_counts


## Visualization & Explanatory Analysis

### Pertanyaan 1: Apa hari dengan penyewa casual terbanyak?

Untuk menjawab pertanyaan ini, akan dibuat stacked bar chart antara penyewa registered dengan casual.

In [None]:
nama_hari = {
    0: 'Minggu',
    1: 'Senin',
    2: 'Selasa',
    3: 'Rabu',
    4: 'Kamis',
    5: 'Jumat',
    6: 'Sabtu'
}

group_weekday = day_df.groupby(by="weekday")
days = group_weekday.weekday.first().tolist()

registered_counts = group_weekday.registered.sum().tolist()
casual_counts = group_weekday.casual.sum().tolist()

# Membuat stacked bar chart
plt.bar([nama_hari[day] for day in days], casual_counts, label='Casual', color='r')
plt.bar([nama_hari[day] for day in days], registered_counts, bottom=casual_counts, label='Registered', color='b')

plt.xlabel('Hari')
plt.ylabel('Jumlah')
plt.title('Stacked Bar Chart Peminjaman Sepeda per Hari dan Jenis Pengguna')
plt.legend(loc='lower right')

plt.show()


Dibandingkan hari-hari lainnya, hari Sabtu dan Minggu memiliki penyewa casual lebih banyak dan penyewa registered lebih sedikit.

### Pertanyaan 2: Apa musim dengan penyewa sepeda paling sedikit?

Untuk menjawab pertanyaan ini, akan dibuat pie chart untuk masing-masing musim

In [None]:
# Data yang akan diplot
labels = mean_cnt_per_season.index
sizes = mean_cnt_per_season.values
colors = ['lightsalmon', 'lightcoral', 'lightgreen','lightblue']

# Membuat pie chart
plt.pie(sizes, labels=labels, colors=colors, autopct='%1.2f%%', startangle=140)

# Menambahkan judul
plt.title('Persentase Peminjaman Sepeda berdasarkan Musim')

# Menampilkan pie chart
plt.show()

- Musim gugur menjadi musim dengan penyewa sepeda paling banyak,
- Sedangkan, musim semi menjadi musim penyewa dengan sepeda paling sedikit.

### Pertanyaan 3: Bagaimana tren peminjaman sepeda berubah sepanjang hari dari pagi hingga malam?

Untuk menjawab pertanyaan ini, akan dibuat line chart untuk masing-masing musim

In [None]:
plt.plot(time_category_counts.index, time_category_counts.values, marker='o')

# Menambahkan label dan judul
plt.xlabel('Waktu')
plt.ylabel('Rata-rata Peminjaman Sepeda')
plt.title('Tren Peminjaman Sepeda per Waktu')

# Menampilkan grid
plt.grid(True)

# Menampilkan line chart
plt.show()


Tren penyewa sepeda sepanjang hari meningkat, dengan puncaknya pada sore hari.

## Conclusion

1.  Apa hari dengan penyewa casual terbanyak?

    Berdasarkan stacked bar chart di atas, hari Sabtu dan Minggu memiliki jumlah penyewa casual yang paling tinggi dibandingkan dengan hari-hari lainnya. Oleh karena itu, strategi pemasaran dan promosi yang tepat dapat diimplementasikan untuk meningkatkan jumlah penyewa terdaftar pada hari-hari ini. Misalnya, dengan memberikan diskon khusus bagi penyewa terdaftar pada akhir pekan, mengadakan acara khusus atau tur bagi anggota terdaftar pada hari Sabtu atau Minggu, atau menyediakan penawaran paket langganan yang menarik untuk mendorong lebih banyak orang untuk mendaftar sebagai anggota tetap.

2.  Apa musim dengan penyewa sepeda paling sedikit?

    Berdasarkan pie chart di atas, musim semi adalah musim yang mempunyai jumlah penyewa sepeda yang paling sedikit dibandingkan musim lain. Oleh karena itu, kampanye promosi dan pemasaran dapat dilakukan pada musim ini dengan fokus pada memperkenalkan penawaran khusus, diskon, atau paket promosi untuk menarik lebih banyak pelanggan. Misalnya, penawaran diskon spesial atau program referensi teman (referral) kepada pelanggan yang menyewa sepeda selama musim semi, atau mengadakan acara-acara promosi khusus yang berorientasi pada musim semi seperti tur bersepeda atau festival sepeda.

3.  Bagaimana tren peminjaman sepeda berubah sepanjang hari dari pagi hingga malam?

    Tren peminjaman sepeda cenderung meningkat sepanjang hari dengan puncaknya terjadi pada sore hari, seperti yang terlihat pada line chart di atas. Hal ini menunjukkan bahwa seiring berjalannya waktu dari pagi hingga malam, jumlah peminjaman sepeda secara umum mengalami peningkatan. Pada pagi hari, jumlah peminjaman sepeda masih relatif rendah, kemudian mulai meningkat secara signifikan saat siang dan mencapai puncaknya pada sore hari. Setelah sore hari, jumlah peminjaman sepeda cenderung mulai menurun menjelang malam hari. Hal ini mungkin disebabkan oleh perubahan aktivitas dan pola perjalanan pengguna, seperti perjalanan pulang kerja atau kegiatan rekreasi sore hari.