# Proyek Analisis Data: Bike Sharing Dataset
- **Nama:** ILHAM MULIA
- **Email:** Ilhammulia2000@gmail.com
- **ID Dicoding:** l000ywl068

## Menentukan Pertanyaan Bisnis

1. Bagaimana pola penggunaan sepeda berdasarkan musim, hari kerja, dan cuaca?
2. Seberapa besar pengaruh cuaca terhadap jumlah penyewaan sepeda?
3. Kapan waktu puncak penyewaan sepeda berdasarkan hari dalam seminggu?

## Import Semua Packages/Library yang Digunakan

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import streamlit as st
sns.set(style='dark')

#Data Wrangling



### Gathering Data

###**Gathering Data**

Dataset yang digunakan berasal dari Bike Sharing Dataset, yang terdiri dari:

* day.csv (data agregasi harian)
* hour.csv (data agregasi per jam)

Dataset telah digabung menjadi satu file **all_data.csv** agar lebih mudah dianalisis.

###**Insight:**

- Data mencakup periode tahun 2011-2012
- Memiliki informasi cuaca, musim, jumlah pengguna, dan jumlah penyewaan sepeda

### Assessing Data

Dataset diperiksa untuk menemukan masalah kualitas data seperti missing values, duplikasi, atau inkonsistensi.

Insight:
- Tidak ditemukan missing values yang signifikan
- Format tanggal (dteday) perlu dikonversi ke datetime untuk analisis waktu

### Cleaning Data

- Mengubah format dteday menjadi datetime
- Menyesuaikan tipe data untuk memudahkan analisis

**Insight:**
- Data sudah siap untuk eksplorasi lebih lanjut

## Exploratory Data Analysis (EDA)

### Explore ...

**Pola Penggunaan Sepeda Berdasarkan Musim**

```
rentals_per_season = all_df.groupby('season')['cnt'].sum().reset_index()
sns.barplot(x='season', y='cnt', data=rentals_per_season)
plt.title('Jumlah Penyewaan Sepeda Berdasarkan Musim')
plt.show()
```

**Insight:**
- Penyewaan sepeda tertinggi terjadi di musim gugur, sedangkan musim semi memiliki penyewaan terendah.

**Pengaruh Cuaca terhadap Jumlah Penyewaan Sepeda**
```
rentals_per_weather = all_df.groupby('weathersit')['cnt'].sum().reset_index()
sns.barplot(x='weathersit', y='cnt', data=rentals_per_weather)
plt.title('Pengaruh Cuaca terhadap Penyewaan Sepeda')
plt.show()
```

**Insight:**
- Cuaca cerah memiliki jumlah penyewaan tertinggi, sedangkan kondisi cuaca ekstrem mengurangi penggunaan sepeda secara signifikan.

**Waktu Puncak Penyewaan Sepeda Berdasarkan Hari dalam Seminggu**
```
rentals_per_weekday = all_df.groupby('weekday')['cnt'].sum().reset_index()
sns.barplot(x='weekday', y='cnt', data=rentals_per_weekday)
plt.title('Waktu Puncak Penyewaan Sepeda dalam Seminggu')
plt.show()
```

**Insight:**
- Penyewaan tertinggi terjadi pada hari kerja dibandingkan akhir pekan, menunjukkan bahwa banyak pengguna menggunakan sepeda untuk keperluan pekerjaan.

## Visualization & Explanatory Analysis

**Pertanyaan 1: Bagaimana pola penggunaan sepeda berdasarkan musim, hari kerja, dan cuaca?**
- Grafik menunjukkan bahwa musim dan cuaca berpengaruh besar terhadap jumlah penyewaan.
- Hari kerja memiliki lebih banyak penyewaan dibandingkan akhir pekan.

**Pertanyaan 2: Seberapa besar pengaruh cuaca terhadap jumlah penyewaan sepeda?**
- Cuaca cerah mendorong lebih banyak penyewaan, sementara cuaca buruk mengurangi penggunaan secara drastis.

**Pertanyaan 3: Kapan waktu puncak penyewaan sepeda berdasarkan hari dalam seminggu?**
- Penyewaan puncak terjadi pada hari kerja, menunjukkan bahwa sepeda lebih sering digunakan untuk aktivitas rutin seperti bekerja atau sekolah.

## Analisis Lanjutan (Opsional)

Jika ingin mendalami lebih jauh, bisa dilakukan analisis tambahan seperti:

- Menggunakan regresi untuk memprediksi jumlah penyewaan berdasarkan cuaca dan hari.
- Melihat pengaruh suhu dan kelembaban terhadap penyewaan sepeda.

## Conclusion

- Pola penggunaan sepeda: Lebih banyak digunakan saat cuaca cerah dan pada hari kerja.
- Pengaruh cuaca: Cuaca buruk sangat mengurangi jumlah penyewaan sepeda.
- Waktu puncak penggunaan: Hari kerja memiliki penyewaan lebih tinggi dibandingkan akhir pekan.