# Proyek Analisis Data: [Bike Sharing Dataset]
- **Nama:** [Muhammad Rizki]
- **Email:** [muhammad.rizki130304@gmail.com]
- **ID Dicoding:** [Muhammad Rizki]
- **ID Cohort:** [MC130D5Y0184]

## Menentukan Pertanyaan Bisnis

- Bagaimana tren penyewaan sepeda berdasarkan hari kerja dan akhir pekan?
- Bagaimana pengaruh suhu terhadap jumlah penyewaan sepeda?

## Import Semua Packages/Library yang Digunakan

In [None]:
import streamlit as st
import numpy as np
import pandas as pd
import matplotlib
matplotlib.use('Agg')  
import matplotlib.pyplot as plt
import seaborn as sns
import os

## Data Wrangling

### Gathering Data

In [None]:
@st.cache_data
def load_data():
    base_path = "Bike Sharing Dataset"
    day_df = pd.read_csv(os.path.join(base_path, "day.csv"))
    hour_df = pd.read_csv(os.path.join(base_path, "hour.csv"))
    
    # Menghapus kolom yang tidak diperlukan
    for df in [day_df, hour_df]:
        df.drop(['workingday'], axis=1, inplace=True)
    
    # Mengubah tipe data menjadi kategori
    kategori_kolom = ['season', 'mnth', 'holiday', 'weekday', 'weathersit']
    for df in [day_df, hour_df]:
        for col in kategori_kolom:
            df[col] = df[col].astype("category")
    
    # Mengubah tipe data tanggal
    for df in [day_df, hour_df]:
        df['dteday'] = pd.to_datetime(df['dteday'])
    
    return day_df, hour_df

day_df, hour_df = load_data()

**Insight:**
- Data berhasil dimuat dari file day.csv dan hour.csv.
- Kolom workingday dihapus karena tidak digunakan.
- Kolom kategori dikonversi ke tipe data kategori.

### Assessing Data

In [None]:
print(day_df.info())
print(hour_df.info())

**Insight:**
- Tipe data sudah sesuai dengan kebutuhan analisis.
- Tidak ditemukan missing values.

### Cleaning Data

In [None]:
rename_dict = {
    'yr': 'year',
    'mnth': 'month',
    'weekday': 'day_of_week',
    'weathersit': 'weather_situation',
    'windspeed': 'wind_speed',
    'cnt': 'total_rentals',
    'hum': 'humidity'
}
day_df.rename(columns=rename_dict, inplace=True)
hour_df.rename(columns={**rename_dict, 'hr': 'hour'}, inplace=True)

**Insight:**
- Nama kolom diubah agar lebih mudah dipahami.
- Tidak ditemukan data duplikat.

## Exploratory Data Analysis (EDA)

### Explore ...

In [None]:
hourly_count = hour_df.groupby('hour')['total_rentals'].sum().reset_index()
fig, ax = plt.subplots(figsize=(10, 5))
sns.barplot(x='hour', y='total_rentals', data=hourly_count, ax=ax, palette='viridis')
ax.set_xlabel("Jam")
ax.set_ylabel("Jumlah Penyewaan")
st.pyplot(fig)


**Insight:**
- Penyewaan sepeda meningkat pada jam sibuk pagi dan sore.


## Visualization & Explanatory Analysis

### Pertanyaan 1:
- Bagaimana tren jumlah penyewaan sepeda berdasarkan hari kerja dan akhir pekan?

In [None]:
day_category_count = day_df.groupby("day_category")["total_rentals"].sum().reset_index()

fig, ax = plt.subplots(figsize=(8, 5))
sns.barplot(x="day_category", y="total_rentals", data=day_category_count, ax=ax, palette="coolwarm")
ax.set_xlabel("Kategori Hari")
ax.set_ylabel("Total Penyewaan")
st.pyplot(fig)


**Insight:**
- Penyewaan lebih tinggi pada hari kerja dibanding akhir pekan.

### Pertanyaan 2:
- Bagaimana pengaruh suhu terhadap jumlah penyewaan sepeda?

In [None]:
fig, ax = plt.subplots(figsize=(8, 5))
sns.scatterplot(x=day_df["temp"], y=day_df["total_rentals"], alpha=0.6, ax=ax)
ax.set_xlabel("Suhu (Normalized)")
ax.set_ylabel("Total Penyewaan")
st.pyplot(fig)

**Insight:**
- Semakin tinggi suhu, jumlah penyewaan cenderung meningkat.


## Analisis Lanjutan (Opsional)

## Conclusion

- Penyewaan lebih tinggi terjadi pada hari kerja dibanding akhir pekan.
- Penyewaan cenderung meningkat saat suhu lebih hangat.