# Proyek Analisis Data: Bike Sharing Dataset
- **Nama:** Joseph Putra Chrisyanto
- **Email:** C14220330@john.petra.ac.id
- **ID Dicoding:** JOSEPH PUTRA C

## Menentukan Pertanyaan Bisnis

- Seberapa besar perbedaan presentase antara penyewaan akhir pekan dan hari kerja?

- Bagaimana perubahan persewaan tiap musim gugur selama dua tahun terakhir?

## Import Semua Packages/Library yang Digunakan

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

## Data Wrangling

### Gathering Data

In [None]:
day_df = pd.read_csv("day.csv")
day_df.head()

**Insight:**
- Import data dari file "day.csv" dan menunjukan 5 row awal
- Data yang diimport mempunyai 16 kolom

### Assessing Data

In [None]:
day_df.isna().sum()

In [None]:
day_df.duplicated().sum()

**Insight:**
- Data yang diberikan sudah tidak ada null dan duplikat

### Cleaning Data

In [None]:
##

**Insight:**
- Data yang diberikan sudah bersih jadi tidak diperlukan cleaning data


## Exploratory Data Analysis (EDA)

### Explore ...

In [None]:
day_df.describe(include="all")

In [None]:
day_df['is_weekend'] = day_df['weekday'].apply(lambda x: 1 if x in [0, 6] else 0)

In [None]:
day_df.groupby(by="weekday").agg({
    "registered": "mean",
    "is_weekend": "first"
})

**Insight:**
- Menjelajahi pertanyaan 1 "Seberapa besar perbedaan presentase antara penyewaan akhir pekan dan hari kerja?"
- Membuat kolom baru is_weekend, kemudian didapat tabel rata rata penyewa tiapharinya dengan tag is_weekend

In [None]:
day_df[day_df['season'] == 2].groupby(by="yr").agg({
    "season" : "mean",
    "registered": "mean"
})

**Insight:**
- Menjelajahi petanyaan 2 "Bagaimana perubahan persewaan tiap musim gugur selama dua tahun terakhir?"
- Mendapatkan visualisasi tabel untuk mengetahui jumlah antara 2 musim.

## Visualization & Explanatory Analysis

### Pertanyaan 1:

In [None]:
grouped_df = day_df.groupby('is_weekend').agg({
    'registered': 'sum'
}).reset_index()

total_rentals = grouped_df['registered'].sum()

grouped_df['percentage'] = (grouped_df['registered'] / total_rentals) * 100

grouped_df['is_weekend'] = grouped_df['is_weekend'].apply(lambda x: 'Weekend' if x == 1 else 'Workday')

plt.figure(figsize=(8, 5))
plt.bar(grouped_df['is_weekend'], grouped_df['percentage'], color=['lightblue', 'lightgreen'])

plt.xlabel('Kategori')
plt.ylabel('Persentase dari sepeda rental (%)')
plt.title('Persentase Penyewaan Sepeda Selama Akhir Pekan vs Hari Kerja')

plt.show()

In [None]:
grouped_df.head()

**Insight:**
- Menggunakan is_weekend yang dibuat saat EDA, kemudian membuat tabel baru untuk menyimpan presentase.
- Untuk tabel baru membuat kolom baru untuk persentase, dengan membagi registered pada setiap kategori dan total registered dan merubahnya menjadi presentase.

### Pertanyaan 2:

In [None]:
seasonYr_df = day_df[day_df['season'] == 2].groupby(by="yr").agg({
    "season" : "nunique",
    "registered": "mean"
})

plt.figure(figsize=(5, 5))
plt.bar(seasonYr_df.index, seasonYr_df['registered'], color='blue')

plt.xlabel('Year (0: 2011, 1: 2012)')
plt.ylabel('Rata rata Sepeda disewa')
plt.title('Rata rata persewaan tiap musim gugur selama dua tahun terakhir')

plt.show()

**Insight:**
- Mendapat tabel bar yang membandingkan antara 2 musim tersebut

## Analisis Lanjutan (Opsional)

## Conclusion

- Terdapat perbedaan persentase yang lumayan besar dalam penyewaan sepeda pada akhir pekan dan hari kerja. Pada akhir pekan terjadi penurunan penyewaan.
- Ada perubahan persewaan sepeda yang signifikan dari musim gugur 2011 dan 2012. Jadi ada trend naik yang positif dalam dua tahun terakhir.