<a href="https://colab.research.google.com/github/Zkeera/Project-Analisis-Data/blob/main/noteboook.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Proyek Analisis Data: [Bike Sharing Dataset]
- **Nama:** [Mohammad Taqi Ashiddiqi]
- **Email:** [mohammadtaqi029@gmail.com]
- **ID Dicoding:** [MC361D5Y0526]




## Menentukan Pertanyaan Bisnis

- Bagaimana pengaruh cuaca terhadap jumlah penyewaan sepeda?
- Apakah terdapat perbedaan pola penyewaan antara hari kerja dan akhir pekan?

## Import Semua Packages/Library yang Digunakan

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

## Data Wrangling

### Gathering Data

In [None]:
day_df = pd.read_csv("https://raw.githubusercontent.com/Zkeera/Project-Analisis-Data/refs/heads/main/day.csv")
day_df.head()

In [None]:
hour_df = pd.read_csv("https://raw.githubusercontent.com/Zkeera/Project-Analisis-Data/refs/heads/main/hour.csv")
hour_df.head()

### Assessing Data

Menilai Tabel day_df

In [None]:
day_df.info()

In [None]:
day_df.isna().sum()

In [None]:
print("Jumlah duplikasi: ", day_df.duplicated().sum())

In [None]:
day_df.describe()

**Menilai Tabel** hour_df

In [None]:
hour_df.info()

In [None]:
hour_df.nunique()

In [None]:
print("Jumlah duplikasi: ",hour_df.duplicated().sum())
hour_df.describe()

### Cleaning Data

**Membersihkan Tabel** day_df

Duplicate Data

In [None]:
day_df.duplicated().sum()

0

In [None]:
day_df.drop_duplicates(inplace=True)

In [None]:
print("Jumlah duplikasi: ", day_df.duplicated().sum())

Jumlah duplikasi:  0


**Missing Values**

**Membersihkan Tabel** hour_df

Duplicate Data

In [None]:
day_df.isna().sum()

In [None]:
day_df.describe()

**Insight:**
- Karena tidak ada data yang terduplikasi maka tidak diperlukan cleaning data

In [None]:
hour_df.duplicated().sum()

0

In [None]:
hour_df.drop_duplicates(inplace=True)

In [None]:
print("Jumlah duplikasi: ", hour_df.duplicated().sum())

**Missing Values**

In [None]:
hour_df.isna().sum()

In [None]:
hour_df.describe()

**Insight:**
- Karena tidak ada data yang terduplikasi maka tidak diperlukan cleaning data

## Exploratory Data Analysis (EDA)

### Explore day_df dan hour_df

In [None]:
day_info = day_df.info()

In [None]:
day_missing = day_df.isnull().sum()

In [None]:
hour_info = hour_df.info()

In [None]:
hour_missing = hour_df.isnull().sum()

In [None]:
day_df['dteday'] = pd.to_datetime(day_df['dteday'])

In [None]:
(day_df.dtypes['dteday'])

In [None]:
hour_df['dteday'] = pd.to_datetime(hour_df['dteday'])

In [None]:
(hour_df.dtypes['dteday'])

## Visualization & Explanatory Analysis

### Pengaruh cuaca terhadap jumlah penyewaan sepeda

In [None]:
# Menghitung rata-rata penyewaan sepeda berdasarkan kondisi cuaca
weather_avg = day_df.groupby('weathersit')['cnt'].mean().reset_index()

weather_labels = {
    1: 'Cerah / Sedikit Berawan',
    2: 'Mendung',
    3: 'Hujan Ringan / Salju Ringan',
    4: 'Hujan Lebat / Badai'
}
weather_avg['weathersit'] = weather_avg['weathersit'].map(weather_labels)

# Visualisasi pengaruh cuaca terhadap jumlah penyewaan sepeda
plt.figure(figsize=(8, 5))
sns.barplot(data=weather_avg, x='weathersit', y='cnt')
plt.title('Pengaruh Cuaca Terhadap Jumlah Penyewaan Sepeda')
plt.xlabel('Kondisi Cuaca')
plt.ylabel('Rata-rata Penyewaan Sepeda')
plt.xticks(rotation=20)
plt.show()

# Menampilkan data rata-rata penyewaan per kondisi cuaca
weather_avg.sort_values(by='cnt', ascending=False)

### Perbedaan pola penyewaan antara hari kerja dan akhir pekan

In [None]:
# Menambah kolom baru untuk menunjukkan akhir pekan atau hari kerja
day_df['is_weekend'] = day_df['weekday'].apply(lambda x: 1 if x == 0 or x == 6 else 0)

# Menghitung rata-rata penyewaan untuk hari kerja dan akhir pekan
weekend_avg = day_df.groupby('is_weekend')['cnt'].mean().reset_index()
weekend_avg['is_weekend'] = weekend_avg['is_weekend'].map({0: 'Hari Kerja', 1: 'Akhir Pekan'})

# Visualisasi perbedaan penyewaan antara hari kerja dan akhir pekan
plt.figure(figsize=(6, 4))
sns.barplot(data=weekend_avg, x='is_weekend', y='cnt')
plt.title('Perbandingan Penyewaan Sepeda: Hari Kerja vs Akhir Pekan')
plt.xlabel('Jenis Hari')
plt.ylabel('Rata-rata Penyewaan Sepeda')
plt.show()

# Menampilkan data rata-rata penyewaan per jenis hari
weekend_avg.sort_values(by='cnt', ascending=False)

### Pertanyaan 1: Bagaimana pengaruh cuaca terhadap jumlah penyewaan sepeda?

**Hasil Analisis Pengaruh Cuaca terhadap Penyewaan Sepeda**
- Cuaca cerah atau sedikit berawan memiliki rata-rata penyewaan tertinggi (±4877 sepeda).
- Cuaca mendung sedikit lebih rendah (±4036 sepeda).
- Hujan ringan atau salju ringan secara signifikan menurunkan penyewaan (±1803 sepeda).
- Tidak ada data untuk kondisi hujan lebat atau badai (kategori 4).

### Pertanyaan 2: Apakah terdapat perbedaan pola penyewaan antara hari kerja dan akhir pekan?

**Hasil Analisis Penyewaan Sepeda: Hari Kerja vs Akhir Pekan**
- Hari kerja memiliki rata-rata penyewaan sedikit lebih tinggi (±4551 sepeda)
dibandingkan dengan akhir pekan (±4390 sepeda).
- Perbedaannya tidak terlalu signifikan, namun menunjukkan tren sedikit lebih ramai saat hari kerja.

### **Conclussion**