# Proyek Analisis Data: [Input Nama Dataset]
- **Nama:** Mugi Mabruri
- **Email:** mugimabruri@gmail.com
- **ID Dicoding:** mugi_mabruri

## Menentukan Pertanyaan Bisnis

- Pertanyaan 1 : Bagaimana pola penggunaan sepeda berdasarkan musim (season) dan cuaca (weathersit)?

- Pertanyaan 2 : Apakah ada hubungan antara suhu (temp) dan jumlah penyewaan sepeda (cnt)?


## Import Semua Packages/Library yang Digunakan

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import streamlit as st

## Data Wrangling

### Gathering Data

In [None]:
# Load dataset
df = pd.read_csv('day.csv')

**Insight:**

- Dataset berisi informasi tentang penyewaan sepeda harian.

- Terdapat kolom seperti season, weathersit, temp, dan cnt yang relevan untuk analisis.

### Assessing Data

In [None]:
# Cek informasi dataset
df.info()

# Cek statistik deskriptif
df.describe()

# Cek missing values
df.isnull().sum()

**Insight:**
- Tidak ada missing values dalam dataset.

- Dataset memiliki 731 baris dan 16 kolom.

- Kolom dteday adalah tanggal, sedangkan kolom lainnya adalah fitur numerik atau kategorikal.

### Cleaning Data

In [None]:
# Ubah tipe data 'dteday' ke datetime
df['dteday'] = pd.to_datetime(df['dteday'])

# Mapping nilai musim dan cuaca untuk interpretasi yang lebih mudah
season_map = {1: 'Spring', 2: 'Summer', 3: 'Fall', 4: 'Winter'}
weather_map = {1: 'Clear', 2: 'Mist', 3: 'Light Snow/Rain', 4: 'Heavy Rain/Snow'}

df['season'] = df['season'].map(season_map)
df['weathersit'] = df['weathersit'].map(weather_map)

**Insight:**
- Kolom dteday diubah ke tipe datetime untuk memudahkan analisis waktu.

- Nilai musim dan cuaca di-mapping ke string untuk interpretasi yang lebih mudah.

## Exploratory Data Analysis (EDA)

### Explore Pola Penggunaan Sepeda Berdasarkan Musim dan Cuaca

In [None]:
# Group by season dan weathersit
season_weather_count = df.groupby(['season', 'weathersit'])['cnt'].sum().reset_index()

# Visualisasi
plt.figure(figsize=(10, 6))
sns.barplot(x='season', y='cnt', hue='weathersit', data=season_weather_count)
plt.title('Pola Penggunaan Sepeda Berdasarkan Musim dan Cuaca')
plt.xlabel('Musim')
plt.ylabel('Jumlah Penyewaan Sepeda')
plt.legend(title='Cuaca')
plt.show()

**Insight:**
- Musim gugur (Fall) memiliki jumlah penyewaan sepeda tertinggi.

- Cuaca cerah (Clear) mendominasi jumlah penyewaan sepeda di semua musim.

### Explore Hubungan Antara Suhu dan Jumlah Penyewaan Sepeda

In [None]:
# Scatter plot suhu vs jumlah penyewaan
plt.figure(figsize=(10, 6))
sns.scatterplot(x='temp', y='cnt', data=df)
plt.title('Hubungan Antara Suhu dan Jumlah Penyewaan Sepeda')
plt.xlabel('Suhu (Normalized)')
plt.ylabel('Jumlah Penyewaan Sepeda')
plt.show()

**Insight:**
- Terdapat korelasi positif antara suhu dan jumlah penyewaan sepeda.

- Semakin tinggi suhu, semakin tinggi jumlah penyewaan sepeda.

## Visualization & Explanatory Analysis

### Pertanyaan 1: Bagaimana pola penggunaan sepeda berdasarkan musim (season) dan cuaca (weathersit)?

In [None]:
# Visualisasi menggunakan Streamlit
st.title('Pola Penggunaan Sepeda Berdasarkan Musim dan Cuaca')
st.write('Berikut adalah visualisasi pola penggunaan sepeda berdasarkan musim dan cuaca:')
st.bar_chart(season_weather_count.pivot(index='season', columns='weathersit', values='cnt'))

### Pertanyaan 2: Apakah ada hubungan antara suhu (temp) dan jumlah penyewaan sepeda (cnt)?

In [None]:
# Visualisasi menggunakan Streamlit
st.title('Hubungan Antara Suhu dan Jumlah Penyewaan Sepeda')
st.write('Berikut adalah scatter plot yang menunjukkan hubungan antara suhu dan jumlah penyewaan sepeda:')
st.scatter_chart(df[['temp', 'cnt']])

**Insight:**
- Musim gugur (Fall) adalah musim dengan jumlah penyewaan sepeda tertinggi.

- Cuaca cerah (Clear) mendominasi jumlah penyewaan sepeda di semua musim.

- Terdapat korelasi positif antara suhu dan jumlah penyewaan sepeda.

## Analisis Lanjutan (Opsional)

## Conclusion



```
# This is formatted as code
```

- Conclution pertanyaan 1: Musim gugur (Fall) dan cuaca cerah (Clear) adalah faktor yang paling berpengaruh terhadap tingginya jumlah penyewaan sepeda.

- Conclution pertanyaan 2: Terdapat korelasi positif antara suhu dan jumlah penyewaan sepeda, di mana semakin tinggi suhu, semakin tinggi pula jumlah penyewaan sepeda.