
# 📊 Bike Sharing Data Analysis

**Nama:** Mochammad Ikhsan  
**Email:** muhamadicun20@gmail.com  
**ID Dicoding:** icun20

---



## 1. Menentukan Pertanyaan Bisnis

1. Bagaimana pengaruh musim terhadap total jumlah penyewaan sepeda harian selama periode 2011-2012?
2. Bagaimana perbandingan tren penggunaan sepeda oleh pengguna casual dan registered sepanjang tahun 2011-2012?
3. (Analisis Lanjutan) Bagaimana pola hari dengan tingkat penyewaan rendah, sedang, dan tinggi?


In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

sns.set(style='whitegrid')

## 2. Data Wrangling
### Gathering Data

In [None]:
df = pd.read_csv('data/day.csv')
df.head()

### Assessing Data

In [None]:
print(df.info())
print(df.describe())
print(df.isnull().sum())

### Cleaning Data

In [None]:
season_map = {1: 'Spring', 2: 'Summer', 3: 'Fall', 4: 'Winter'}
df['season_name'] = df['season'].map(season_map)
df['date'] = pd.to_datetime(df['dteday'])
df['year'] = df['date'].dt.year

## 3. Exploratory Data Analysis (EDA)
### Explore Seasonal Trends

In [None]:
season_summary = df.groupby('season_name')['cnt'].sum().reset_index()
print(season_summary)

In [None]:
plt.figure(figsize=(8,5))
sns.barplot(data=season_summary, x='season_name', y='cnt', palette='viridis')
plt.title('Total Penyewaan Sepeda per Musim (2011-2012)')
plt.xlabel('Musim')
plt.ylabel('Total Penyewaan Sepeda')
plt.tight_layout()
plt.show()

### Explore User Type Trends

In [None]:
year_month = df.groupby(['year', 'mnth'])[['casual', 'registered']].sum().reset_index()
year_month['month'] = pd.to_datetime(year_month['year'].astype(str) + '-' + year_month['mnth'].astype(str))

In [None]:
plt.figure(figsize=(10,6))
sns.lineplot(data=year_month, x='month', y='casual', label='Casual', marker='o')
sns.lineplot(data=year_month, x='month', y='registered', label='Registered', marker='o')
plt.title('Tren Pengguna Casual vs Registered (2011-2012)')
plt.xlabel('Bulan')
plt.ylabel('Jumlah Pengguna')
plt.legend()
plt.tight_layout()
plt.show()

## 4. Analisis Lanjutan (Clustering Manual)

In [None]:
bins = [0, df['cnt'].quantile(0.33), df['cnt'].quantile(0.66), df['cnt'].max()]
labels = ['Low', 'Medium', 'High']
df['usage_level'] = pd.cut(df['cnt'], bins=bins, labels=labels, include_lowest=True)

In [None]:
plt.figure(figsize=(7,4))
sns.countplot(data=df, x='usage_level', palette='pastel', order=labels)
plt.title('Distribusi Tingkat Penggunaan Sepeda per Hari')
plt.xlabel('Tingkat Penggunaan')
plt.ylabel('Jumlah Hari')
plt.tight_layout()
plt.show()

## 5. Conclusion

- **Pertanyaan 1:** Musim gugur memiliki tingkat penyewaan sepeda tertinggi.
- **Pertanyaan 2:** Pengguna registered mendominasi sepanjang tahun, pengguna casual memuncak di musim panas.
- **Analisis Lanjutan:** Mayoritas hari berada pada tingkat penggunaan sepeda menengah.
