# Proyek Analisis Data: Bike Sharing Dataset
- **Nama:** Muhammad Surya Putra
- **Email:** muhammadsuryaputra3@gmail.com
- **ID Dicoding:** Muhammad Surya Putra

## Menentukan Pertanyaan Bisnis

- Pertanyaan 1: Bagaimana distribusi peminjaman untuk masing-masing musim dan kondisi cuaca?
- Pertanyaan 2: Pengaruh hari kerja/ akhir pekan terhadap peminjaman untuk setiap musim?

## Import library yang diperlukan

In [80]:
# Import library yang diperlukan
import streamlit as st
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

## Data Wrangling

### Gathering Data

In [82]:
# Fungsi untuk mengimpor data
@st.cache_data
def load_data():
    data_df = pd.read_csv('day.csv')
    return data_df

# Fungsi untuk melakukan pembersihan data
def clean_data(data_df):
    data_df['season'] = data_df['season'].map({1: 'Spring', 2: 'Summer', 3: 'Fall', 4: 'Winter'})
    return data_df

# Fungsi untuk menampilkan gathering data
def gather_data(data_df):
    st.subheader("Gathering Data")
    st.write("Berikut merupakan dataset dari Bike Sharing pada skala hari")
    st.write(data_df)

2024-03-12 10:38:54.110 No runtime found, using MemoryCacheStorageManager


### Assesing Data

In [83]:
# Fungsi untuk menampilkan assessing data
def assess_data(data_df):
    st.subheader("Assessing Data")
    st.write("Melakukan pemeriksaan parameter statistik menggunakan metode describe()")
    st.write(data_df.describe())

### Cleaning Data

In [84]:
# Fungsi untuk menampilkan cleaning data
def clean_data_display(data_df):
    st.subheader("Cleaning Data")
    st.write("Mengubah nilai dari parameter 'season' menjadi nama musim")
    cleaned_data_df = clean_data(data_df.copy())
    st.write(cleaned_data_df)

## Exploratory Data Analysis (EDA)

### Exploratory

In [85]:
# Fungsi untuk menjawab pertanyaan EDA
def eda_questions(data_df):
    st.subheader('Exploratory Data Analysis (EDA)')
    
    # Pertanyaan 1
    st.markdown("### Pertanyaan 1: Distribusi Peminjaman untuk Masing-masing Musim dan Kondisi Cuaca")
    st.write("Bagaimana distribusi peminjaman untuk masing-masing musim dan kondisi cuaca?")
    st.write("Melakukan pemetaan tabel menggunakan pivot table")
    data_df['season'] = data_df['season'].map({1: 'Spring', 2: 'Summer', 3: 'Fall', 4: 'Winter'})
    data_musim = data_df.groupby(by=["season", "weathersit"]).agg({
        "casual": "nunique",
        "registered": "nunique"
    })
    st.write(data_musim)
    st.write('Grafik')
    data_musim['total'] = data_musim['casual'] + data_musim['registered']
    fig, ax = plt.subplots()
    sns.barplot(data=data_musim, x="season", y="total", hue="weathersit", errorbar=None, ax=ax)
    st.pyplot(fig)

    # Pertanyaan 2
    st.markdown("### Pertanyaan 2: Pengaruh Hari Kerja/Akhir Pekan terhadap Peminjaman untuk Setiap Musim")
    st.write("Pengaruh hari kerja/ akhir pekan terhadap peminjaman untuk setiap musim?")
    st.write("Melakukan pemetaan tabel menggunakan pivot table")
    data_holiday = data_df.groupby(by="season").agg({
        "casual": "nunique",
        "registered": "nunique",
    })
    st.write(data_holiday)
    st.write('Grafik')
    data_holiday['total'] = data_holiday['casual'] + data_holiday['registered']
    fig, ax = plt.subplots()
    sns.scatterplot(data=data_holiday, x='season', y='casual', ax=ax)
    sns.scatterplot(data=data_holiday, x='season', y='registered', ax=ax)
    ax.set_ylim(150, 190)
    st.pyplot(fig)

## Visualization & Explanatory Analysis

### Pertanyaan 1: 

In [87]:

    st.write(data_holiday)
    st.write('Grafik')
    data_holiday['total'] = data_holiday['casual'] + data_holiday['registered']
    fig, ax = plt.subplots()
    sns.scatterplot(data=data_holiday, x='season', y='casual', ax=ax)
    sns.scatterplot(data=data_holiday, x='season', y='registered', ax=ax)
    ax.set_ylim(150, 190)
    st.pyplot(fig)
    
    # Kesimpulan Pertanyaan 1
    st.subheader('Kesimpulan Pertanyaan 1:')
    total_rental_per_season = data_df.groupby('season')[['casual', 'registered']].sum()  # Menggunakan sum untuk mendapatkan jumlah total peminjaman
    st.write("Berdasarkan analisis, terlihat bahwa distribusi peminjaman berbeda-beda untuk setiap musim dan kondisi cuaca.")
    st.write("Total peminjaman untuk masing-masing musim:")
    st.write(total_rental_per_season)
    
    max_season = total_rental_per_season.sum(axis=1).idxmax()  # Menggunakan sum(axis=1) untuk mendapatkan total peminjaman
    min_season = total_rental_per_season.sum(axis=1).idxmin()  # Menggunakan sum(axis=1) untuk mendapatkan total peminjaman
    
    seasons_map = {'Spring': 'Spring (Musim Semi)', 'Summer': 'Summer (Musim Panas)', 'Fall': 'Fall (Musim Gugur)', 'Winter': 'Winter (Musim Dingin)'}
    
    st.write(f"Peminjam terbanyak berada pada {seasons_map[max_season]} dan peminjam paling sedikit berada pada {seasons_map[min_season]}.")
    
    # Kesimpulan Pertanyaan 2
    st.subheader('Kesimpulan Pertanyaan 2:')
    weekday_vs_weekend = data_df.groupby('weekday')['cnt'].sum()
    st.write("Berdasarkan analisis, terdapat hubungan antara hari kerja/akhir pekan dengan jumlah peminjaman untuk setiap musim.")
    st.write("Total peminjaman pada hari kerja vs akhir pekan:")
    st.write(weekday_vs_weekend)
    
    max_day = weekday_vs_weekend.idxmax()
    min_day = weekday_vs_weekend.idxmin()
    
    days_map = {0: 'Minggu', 1: 'Senin', 2: 'Selasa', 3: 'Rabu', 4: 'Kamis', 5: 'Jumat', 6: 'Sabtu'}
    
    st.write(f"Peminjam terbanyak berada pada hari {days_map[max_day]} dan peminjam paling sedikit berada pada hari {days_map[min_day]}.")
    
def main():
    st.title('Analisis Data Bike Sharing')
    data_df = load_data()
    
    menu = ["Data Wrangling", "Exploratory Data Analysis (EDA)"]
    choice = st.sidebar.selectbox("Pilihan Menu", menu)

    if choice == "Data Wrangling":
        data_wrangling(data_df)
    elif choice == "Exploratory Data Analysis (EDA)":
        eda_questions(data_df)
        
    if __name__ == "__main__":
        main() 

IndentationError: expected an indented block after function definition on line 38 (4122450151.py, line 39)

### Pertanyaan 2:

In [86]:

    # Kesimpulan Pertanyaan 2
    st.subheader('Kesimpulan Pertanyaan 2:')
    weekday_vs_weekend = data_df.groupby('weekday')['cnt'].sum()
    st.write("Berdasarkan analisis, terdapat hubungan antara hari kerja/akhir pekan dengan jumlah peminjaman untuk setiap musim.")
    st.write("Total peminjaman pada hari kerja vs akhir pekan:")
    st.write(weekday_vs_weekend)
    
    max_day = weekday_vs_weekend.idxmax()
    min_day = weekday_vs_weekend.idxmin()
    
    days_map = {0: 'Minggu', 1: 'Senin', 2: 'Selasa', 3: 'Rabu', 4: 'Kamis', 5: 'Jumat', 6: 'Sabtu'}
    
    st.write(f"Peminjam terbanyak berada pada hari {days_map[max_day]} dan peminjam paling sedikit berada pada hari {days_map[min_day]}.")


NameError: name 'data_df' is not defined

## Conclusion

- Conclution pertanyaan 1

In [None]:

st.write(f"Peminjam terbanyak berada pada {seasons_map[max_season]} dan peminjam paling sedikit berada pada {seasons_map[min_season]}.")
   

- Conclution pertanyaan 2

In [None]:
st.write(f"Peminjam terbanyak berada pada hari {days_map[max_day]} dan peminjam paling sedikit berada pada hari {days_map[min_day]}.")
    
def main():
    st.title('Analisis Data Bike Sharing')
    data_df = load_data()
    
    menu = ["Data Wrangling", "Exploratory Data Analysis (EDA)"]
    choice = st.sidebar.selectbox("Pilihan Menu", menu)

    if choice == "Data Wrangling":
        data_wrangling(data_df)
    elif choice == "Exploratory Data Analysis (EDA)":
        eda_questions(data_df)

if __name__ == "__main__":
    main() 