# Proyek Analisis Data: [Bike Sharing Data Set]
- **Nama:** [Farhan Bayu Maulana]

## Menentukan Pertanyaan Bisnis


 Pertanyaan 1: Bagaimana tren performa penyewaan sepeda dalam rentang waktu data yang tersedia?
 Pertanyaan 2: Bagaimana pengaruh musim terhadap rata-rata jumlah penyewaan sepeda?

## Import Semua Packages/Library yang Digunakan

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

## Data Wrangling

### Gathering Data

In [None]:
df = pd.read_csv('day.csv')
df.head()

**Insight:**
- Dataset berhasil dimuat dari file `day.csv` menggunakan library Pandas.
- Data ini berisi rekapitulasi harian penyewaan sepeda beserta variabel pendukung seperti cuaca, musim, dan suhu.

### Assessing Data

In [None]:
print("Info Dataset:")
df.info()
print("\nJumlah Missing Value:")
print(df.isna().sum())
print("\nJumlah Duplikasi:", df.duplicated().sum())

**Insight:**
- Tidak terdapat missing value pada dataset.
- Tipe data pada kolom 'dteday' masih berupa object (string), perlu diubah ke datetime.
- Tidak ditemukan data duplikat.

### Cleaning Data

In [None]:
df['dteday'] = pd.to_datetime(df['dteday'])
df['season_label'] = df['season'].map({1: 'Spring', 2: 'Summer', 3: 'Fall', 4: 'Winter'})
df.head()

**Insight:**
- Kolom 'dteday' berhasil diubah menjadi tipe datetime.
- Menambahkan kolom baru 'season_label' untuk memudahkan analisis visualisasi nanti.

## Exploratory Data Analysis (EDA)

### Explore ...

In [None]:
print(df.describe())

plt.figure(figsize=(10, 8))
correlation_matrix = df[['temp', 'atemp', 'hum', 'windspeed', 'cnt']].corr()
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f")
plt.title("Correlation Matrix")
plt.show()

print(df.groupby('season_label')['cnt'].mean().sort_values(ascending=False))

**Insight:**
- Suhu (temp) memiliki korelasi positif yang cukup kuat (0.63) dengan jumlah penyewaan (cnt).
- Kecepatan angin (windspeed) memiliki korelasi negatif lemah.
- Rata-rata penyewaan tertinggi terjadi pada musim Fall (Gugur)

## Visualization & Explanatory Analysis

### Pertanyaan 1:

In [None]:
plt.figure(figsize=(12, 6))
plt.plot(df['dteday'], df['cnt'], color='tab:blue', linewidth=1)
plt.title('Tren Penyewaan Sepeda Harian (2011-2012)')
plt.xlabel('Tanggal')
plt.ylabel('Jumlah Sewa')
plt.grid(True, linestyle='--', alpha=0.6)
plt.show()

### Pertanyaan 2:

In [None]:
plt.figure(figsize=(8, 6))
sns.barplot(x='season_label', y='cnt', data=df, palette='viridis', estimator=np.mean)
plt.title('Rata-rata Penyewaan Sepeda per Musim')
plt.xlabel('Musim')
plt.ylabel('Rata-rata Jumlah Sewa')
plt.show()

**Insight:**
- Pertanyaan 1: Tren penyewaan sepeda menunjukkan peningkatan dari tahun 2011 ke 2012. Terdapat pola musiman di mana penyewaan naik di pertengahan tahun dan turun di akhir/awal tahun.
- Pertanyaan 2: Musim Fall (Gugur) menjadi musim dengan rata-rata penyewaan tertinggi, diikuti oleh Summer dan Winter. Spring (Semi) memiliki rata-rata terendah.

## Analisis Lanjutan (Opsional,)

In [None]:
X = df[['temp', 'hum', 'windspeed']]
y = df['cnt']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = LinearRegression()
model.fit(X_train, y_train)

score = model.score(X_test, y_test)
print(f"Model R^2 Score: {score:.2f}")

## Conclusion


- Conclusion pertanyaan 1:
  Tren penyewaan sepeda menunjukkan pertumbuhan positif dari tahun ke tahun. Pola fluktuasi harian sangat dipengaruhi oleh waktu dalam setahun, dengan puncak aktivitas terjadi pada pertengahan tahun. Hal ini mengindikasikan bahwa bisnis berkembang baik namun perlu strategi khusus untuk mempertahankan angka penyewaan di awal/akhir tahun.

- Conclusion pertanyaan 2:
  Musim memiliki dampak signifikan terhadap jumlah penyewaan. Musim Gugur (Fall) dan Panas (Summer) adalah periode paling favorit bagi pengguna, sedangkan Musim Semi (Spring) memiliki angka terendah. Faktor cuaca seperti suhu yang lebih hangat berkorelasi positif dengan peningkatan jumlah penyewaan.