# Proyek Analisis Data: Bike Sharing Dataset

- **Nama:** Rifqi Mubarak Tampeng
- **Email:** tampengrifqumubarak@gmail.com
- **ID Dicoding:** rifqiimt

## Menentukan Pertanyaan Bisnis

- Pertanyaan 1 : Bagaimana tren penyewaan sepeda dari tahun ke tahun?
- Pertanyaan 2 : Apakah ada perbedaan signifikan dalam jumlah penyewaan sepeda antara hari libur dan hari biasa?

## Import Semua Packages/Library yang Digunakan

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import streamlit as st
from babel.numbers import format_currency

## Data Wrangling

### Gathering Data

In [None]:
all_df = pd.read_csv("main_data.csv")

**Insight:**
- Data diimpor dari file CSV bernama "main_data.csv"
- Perlu memeriksa struktur dan isi data untuk analisis lebih lanjut

### Assessing Data

In [None]:
# Memeriksa informasi dasar dataset
print(all_df.info())

# Memeriksa statistik deskriptif
print(all_df.describe())

# Memeriksa nilai yang hilang
print(all_df.isnull().sum())

**Insight:**
- Perlu memeriksa tipe data setiap kolom
- Identifikasi potensi outlier atau nilai yang tidak masuk akal
- Pastikan tidak ada nilai yang hilang dalam dataset

### Cleaning Data

In [None]:
# Mengubah kolom 'dteday' menjadi tipe datetime
all_df["dteday"] = pd.to_datetime(all_df["dteday"])

# Jika ada langkah pembersihan lain yang diperlukan, tambahkan di sini

**Insight:**
- Kolom 'dteday' diubah menjadi tipe datetime untuk memudahkan analisis temporal
- Tidak ada nilai yang hilang yang perlu ditangani
- Perlu memastikan konsistensi nilai dalam kolom kategorikal seperti 'season' dan 'holiday'

## Exploratory Data Analysis (EDA)

### Explore Tren Penyewaan Tahunan

In [None]:
def create_rentals_per_year_df(df):
    rentals_per_year = df.groupby('yr')['cnt'].sum().reset_index()
    return rentals_per_year

rentals_per_year = create_rentals_per_year_df(all_df)
print(rentals_per_year)

**Insight:**
- Analisis ini akan menunjukkan tren penyewaan sepeda dari tahun ke tahun
- Perlu membandingkan jumlah penyewaan antara tahun-tahun yang berbeda

### Explore Perbedaan Hari Libur dan Hari Biasa

In [None]:
def create_users_notholiday_and_holiday_df(df):
    users_notholiday_and_holiday = df.holiday.value_counts()
    return users_notholiday_and_holiday

users_notholiday_and_holiday = create_users_notholiday_and_holiday_df(all_df)
print(users_notholiday_and_holiday)

**Insight:**
- Analisis ini akan menunjukkan perbedaan jumlah penyewaan antara hari libur dan hari biasa
- Perlu mempertimbangkan proporsi hari libur vs hari biasa dalam dataset

## Visualization & Explanatory Analysis

### Pertanyaan 1: Bagaimana tren penyewaan sepeda dari tahun ke tahun?

In [None]:
fig, ax = plt.subplots(figsize=(10, 5))
sns.barplot(
    x="yr",
    y="cnt",
    data=rentals_per_year,
    ax=ax
)

plt.title("Number of Rentals per Year", loc="center", fontsize=15)
plt.xlabel("Year")
plt.ylabel("Number of Rentals")
plt.gca().yaxis.set_major_formatter(plt.FuncFormatter(lambda x, loc: "{:,}".format(int(x))))
plt.tick_params(axis='x', labelsize=12)
plt.show()

### Pertanyaan 2: Apakah ada perbedaan signifikan dalam jumlah penyewaan sepeda antara hari libur dan hari biasa?

In [None]:
fig, ax = plt.subplots(figsize=(10, 5))

sns.barplot(
    y=users_notholiday_and_holiday.values,
    x=users_notholiday_and_holiday.index,
    ax=ax
)

plt.title("Number of Users on Holiday and Not Holiday", loc="center", fontsize=15)
plt.ylabel("Number of Users")
plt.xlabel("Holiday Status")
plt.tick_params(axis='x', labelsize=12)
plt.show()

**Insight:**
- Visualisasi membantu memperjelas pola dan tren dalam data
- Perbandingan visual antara tahun dan status hari libur memberikan wawasan cepat tentang perbedaan dalam penyewaan sepeda

## Analisis Lanjutan (Opsional)

In [None]:
# Analisis pengaruh musim terhadap penyewaan sepeda
def create_rentals_per_season_df(df):
    rentals_per_season = df.groupby('season')['cnt'].sum()
    return rentals_per_season

rentals_per_season = create_rentals_per_season_df(all_df)

fig, ax = plt.subplots(figsize=(10, 5))
sns.barplot(
    y=rentals_per_season.values,
    x=rentals_per_season.index,
    ax=ax
)
plt.title("Number of Rentals per Season", loc="center", fontsize=15)
plt.ylabel("Number of Rentals")
plt.xlabel("Season")
plt.gca().yaxis.set_major_formatter(plt.FuncFormatter(lambda x, loc: "{:,}".format(int(x))))
plt.tick_params(axis='x', labelsize=12)
plt.show()

## Conclusion

- Conclution pertanyaan 1

  Berdasarkan analisis tren penyewaan sepeda dari tahun ke tahun, kita dapat menyimpulkan bahwa [masukkan kesimpulan berdasarkan hasil analisis].
- Conclution pertanyaan 2

  Mengenai perbedaan jumlah penyewaan sepeda antara hari libur dan hari biasa, hasil analisis menunjukkan bahwa [masukkan kesimpulan berdasarkan hasil analisis].