# Proyek Analisis Data: Bike Sharing
- **Nama:** Muhamad Ikbal Irawan
- **Email:** iqbalirawan238@gmail.com
- **ID Dicoding:** ikbal05

## Menentukan Pertanyaan Bisnis

1. Bagaimana pengaruh cuaca terhadap jumlah peminjaman sepeda?
Analisis:
- Gunakan data suhu (temp), kelembaban (hum), dan kecepatan angin (windspeed) terhadap jumlah sepeda yang dipinjam (cnt).
- Lihat apakah ada pola tertentu, misalnya apakah peminjaman menurun saat kelembaban tinggi atau angin kencang.
- Ini bisa membantu perencanaan operasional dalam menyesuaikan jumlah sepeda yang tersedia berdasarkan prediksi cuaca.

2. Kapan waktu paling sibuk dalam sehari untuk penyewaan sepeda?
Analisis:
- Gunakan data per jam (hr) untuk melihat tren penggunaan sepeda sepanjang hari.
- Identifikasi jam-jam sibuk dan bandingkan antara hari kerja (workingday) dan akhir pekan.
- Bisa digunakan untuk menentukan strategi pemeliharaan sepeda atau promosi pada jam sepi.

## Import Semua Packages/Library yang Digunakan

In [9]:
import streamlit as st
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt

## Data Wrangling

## Load Data

In [3]:
day_df = pd.read_csv("https://raw.githubusercontent.com/ikbalirawan/Analisis-Data/main/data/day.csv")
hour_df = pd.read_csv("https://raw.githubusercontent.com/ikbalirawan/Analisis-Data/main/data/hour.csv")

### Gathering Data

In [4]:
print("Preview Data Harian:")
print(day_df.head())
print("\nPreview Data Per Jam:")
print(hour_df.head())

Preview Data Harian:
   instant      dteday  season  yr  mnth  holiday  weekday  workingday  \
0        1  2011-01-01       1   0     1        0        6           0   
1        2  2011-01-02       1   0     1        0        0           0   
2        3  2011-01-03       1   0     1        0        1           1   
3        4  2011-01-04       1   0     1        0        2           1   
4        5  2011-01-05       1   0     1        0        3           1   

   weathersit      temp     atemp       hum  windspeed  casual  registered  \
0           2  0.344167  0.363625  0.805833   0.160446     331         654   
1           2  0.363478  0.353739  0.696087   0.248539     131         670   
2           1  0.196364  0.189405  0.437273   0.248309     120        1229   
3           1  0.200000  0.212122  0.590435   0.160296     108        1454   
4           1  0.226957  0.229270  0.436957   0.186900      82        1518   

    cnt  
0   985  
1   801  
2  1349  
3  1562  
4  1600  

Prev

**Insight:**
- Data harian mencakup jumlah total peminjaman sepeda per hari.
- Terdapat variabel cuaca, musim, hari libur, dan jumlah pengguna.

### Assessing Data

In [5]:
print("Informasi Data Harian:")
print(day_df.info())
print("\nInformasi Data Per Jam:")
print(hour_df.info())

Informasi Data Harian:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 731 entries, 0 to 730
Data columns (total 16 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   instant     731 non-null    int64  
 1   dteday      731 non-null    object 
 2   season      731 non-null    int64  
 3   yr          731 non-null    int64  
 4   mnth        731 non-null    int64  
 5   holiday     731 non-null    int64  
 6   weekday     731 non-null    int64  
 7   workingday  731 non-null    int64  
 8   weathersit  731 non-null    int64  
 9   temp        731 non-null    float64
 10  atemp       731 non-null    float64
 11  hum         731 non-null    float64
 12  windspeed   731 non-null    float64
 13  casual      731 non-null    int64  
 14  registered  731 non-null    int64  
 15  cnt         731 non-null    int64  
dtypes: float64(4), int64(11), object(1)
memory usage: 91.5+ KB
None

Informasi Data Per Jam:
<class 'pandas.core.frame.DataFrame'>
Ra

**Insight:**
- Tidak ada nilai yang hilang dalam dataset.
- Beberapa variabel seperti 'temp' dan 'atemp' memiliki korelasi tinggi, sehingga salah satu bisa diabaikan.

### Cleaning Data

In [6]:
print("Mengecek Nilai Hilang:")
print(day_df.isnull().sum())
print(hour_df.isnull().sum())

Mengecek Nilai Hilang:
instant       0
dteday        0
season        0
yr            0
mnth          0
holiday       0
weekday       0
workingday    0
weathersit    0
temp          0
atemp         0
hum           0
windspeed     0
casual        0
registered    0
cnt           0
dtype: int64
instant       0
dteday        0
season        0
yr            0
mnth          0
hr            0
holiday       0
weekday       0
workingday    0
weathersit    0
temp          0
atemp         0
hum           0
windspeed     0
casual        0
registered    0
cnt           0
dtype: int64


**Insight:**
- Dataset bersih, tidak ada nilai kosong atau null.
- Tidak diperlukan imputasi atau penghapusan data.

## Exploratory Data Analysis (EDA)

### Explore ...

In [11]:
plt.figure(figsize=(10, 5))
sns.histplot(day_df['cnt'], bins=30, kde=True)
plt.title("Distribusi Total Peminjaman Sepeda Harian")
plt.xlabel("Jumlah Peminjaman")
plt.ylabel("Frekuensi")
plt.show()

  plt.show()


**Insight:**
- Distribusi jumlah peminjaman menunjukkan pola tertentu.
- Bisa digunakan untuk mengidentifikasi apakah ada hari dengan jumlah peminjaman ekstrem.

## Visualization & Explanatory Analysis

### Pertanyaan 1:

In [12]:
plt.figure(figsize=(10, 5))
sns.boxplot(data=day_df, x='weathersit', y='cnt')
plt.title("Pengaruh Cuaca terhadap Jumlah Peminjaman Sepeda")
plt.xlabel("Kategori Cuaca")
plt.ylabel("Jumlah Peminjaman")
plt.show()

  plt.show()


### Pertanyaan 2:

In [13]:
plt.figure(figsize=(12, 6))
sns.lineplot(data=hour_df, x='hr', y='cnt', hue='workingday', ci=None)
plt.title("Tren Penyewaan Sepeda Berdasarkan Jam")
plt.xlabel("Jam")
plt.ylabel("Jumlah Penyewaan")
plt.show()


The `ci` parameter is deprecated. Use `errorbar=None` for the same effect.

  sns.lineplot(data=hour_df, x='hr', y='cnt', hue='workingday', ci=None)
  plt.show()


**Insight:**
- Tren menunjukkan lonjakan pada jam kerja (pagi dan sore).
- Hari kerja memiliki pola peminjaman yang lebih teratur dibandingkan akhir pekan.

## Analisis Lanjutan (Opsional)

## Conclusion

- Cuaca memiliki dampak signifikan terhadap jumlah peminjaman sepeda. Pada cuaca cerah, jumlah peminjaman lebih tinggi dibandingkan saat hujan atau salju. Strategi bisnis dapat difokuskan pada promosi saat cuaca cerah dan penyediaan fasilitas tambahan saat cuaca buruk.
- Jam sibuk peminjaman sepeda terjadi pada pukul 07:00 - 09:00 dan 17:00 - 19:00, yang bertepatan dengan jam berangkat dan pulang kerja. Untuk meningkatkan layanan, bisa disediakan lebih banyak sepeda pada jam-jam tersebut atau menerapkan tarif dinamis berdasarkan permintaan.