# Proyek Analisis Data: Bike-sharing-dataset
- **Nama  : Nurul Itsnaini**
- **Email : nurul.itsnaini1711@gmail.com**
- **ID Dicoding : MC229D5X0883**

## Menentukan Pertanyaan Bisnis
- Pertanyaan 1: Bagaimana performa penyewaan sepeda dalam dua tahun terakhir ini?
- Pertanyaan 2: Pada musim apa yang memiliki tingkat penyewaan sepeda paling tinggi dan paling rendah?
- Pertanyaan 3: Bagaimana perbandingan jumlah penyewaan sepeda pada hari libur dan hari kerja?
- Pertanyaan 4: Bagaimana perbandingan jumlah pengguna sepeda biasa dan pengguna terdaftar?
- Pertanyaan 5: Bagaimana tren jumlah penyewaan sepeda berdasarkan jam?

## Import semua packages/library yang digunakan

In [3]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

## Data Wrangling
### Gathering Data

- **Memuat Data day**

In [4]:
day_df = pd.read_csv ("day.csv")
day_df.head()

FileNotFoundError: [Errno 2] No such file or directory: 'day.csv'

- **Memuat Data hour**

In [5]:
hour_df = pd.read_csv("hour.csv")
hour_df.head()

FileNotFoundError: [Errno 2] No such file or directory: 'hour.csv'

**Insight:**
- Pada Bike-sharing-dataset, terdapat dua data berformat .csv yaitu:
1. day.csv
2. hour.csv

### Assessing Data

- **Menilai Data day_df**

In [None]:
day_df.info()

- **Mengecek jumlah duplikasi dan ringkasan parameter statistik yang terdapat dalam day_df**

In [None]:
print("Jumlah duplikasi: ", day_df.duplicated().sum())
day_df.describe()

- **Mengecek missing value yang terdapat dalam day_df**

In [None]:
day_df.isna().sum()

- **Menilai Data hour_df**

In [None]:
hour_df.info()

- **Mengecek jumlah duplikasi dan ringkasan parameter statistik yang terdapat dalam hour_df**

In [None]:
print("Jumlah duplikasi: ", hour_df.duplicated().sum())
hour_df.describe()

- **Mengecek missing value yang terdapat dalam hour_df**

In [None]:
hour_df.isna().sum()

**Insight:**
  
Menurut informasi diatas :
- Jumlah data pada day_df dan hour_df sudah lengkap, artinya kedua data tidak ada missing value didalamnya, dan masing-masing data tidak ada duplikasi serta tidak ada keanehan dalam ringkasan parameter statistik dari kedua data;
- Terdapat ketidaksesuaian/kesalahan tipe data dari dua data diatas, Seharusnya kolom dteday direpresentasikan sebagai tipe data **datetime**, bukan **object**;
- Kolom **season, yr, mnth, holiday, weekday, workingday dan weathershit** bisa direpresentasikan dalam tipe data category, karena bernilai kelompok/kategori dengan jumlah terbatas;
- Sebaiknya mengganti nama kolom dan mengkonversi nilai dalam kolom agar mudah dipahami.

### Cleaning Data

**Membersihkan Data day_df dan hour_df**

- **Mengganti tipe data object menjadi datetime pada day_df dan hour_df**

In [None]:
datetime_columns = ["dteday"]

for column in datetime_columns:
    day_df[column] = pd.to_datetime(day_df[column])
    hour_df[column] = pd.to_datetime(hour_df[column])

- **Mengganti tipe data int menjadi category pada day_df dan hour_df**

In [None]:
category_columns = ["season", "yr", "mnth", "holiday", "weekday", "workingday", "weathersit"]

for column in category_columns:
    day_df[column] = day_df[column].astype ("category")
    hour_df[column] = hour_df[column].astype ("category")

- **Cek! apakah sudah terganti?**

In [None]:
day_df.info()
hour_df.info()

- **Mengganti nama kolom pada day_df dan hour_df agar lebih mudah dibaca**

In [None]:
day_df.rename (columns = {"dteday":"date_day","yr": "year", "mnth": "month", "cnt":"count"}, inplace = True)

In [None]:
hour_df.rename (columns = {"dteday":"date_day","yr":"year","mnth":"month","hr":"hours","cnt":"count"}, inplace = True)

In [None]:
day_df.head()

In [None]:
hour_df.head()

- **Mengkonversi nilai pada kolom season dalam day_df dan hour_df**

In [None]:
day_df["season"] = day_df["season"].cat.rename_categories({1:"Spring", 2:"Summer", 3:"Fall", 4: "Winter"})

In [None]:
day_df.head()

In [None]:
hour_df["season"]= hour_df["season"].cat.rename_categories({1:"Spring", 2:"Summer", 3:"Fall", 4: "Winter"})

In [None]:
hour_df.head()

- **Mengkonversi nilai pada kolom year dalam day_df dan hour_df**

In [None]:
day_df["year"] = day_df["year"].cat.rename_categories({0:2011, 1:2012})

In [None]:
day_df.head()

In [None]:
hour_df["year"] = hour_df["year"].cat.rename_categories({0:2011, 1:2012})

In [None]:
hour_df.head()

- **Mengkonversi nilai pada kolom month dalam day_df dan hour_df**

In [None]:
day_df["month"] = day_df["month"].cat.rename_categories({1:"Jan", 2: "Feb", 3:"Mar", 4:"Apr", 5:"Mei", 6:"Jun", 7:"Jul", 8:"Ags", 9:"Sept", 10:"Okt", 11:"Nov", 12:"Des"})

In [None]:
day_df.head()

In [None]:
hour_df["month"] = hour_df["month"].cat.rename_categories({1:"Jan", 2: "Feb", 3:"Mar", 4:"Apr", 5:"Mei", 6:"Jun", 7:"Jul", 8:"Ags", 9:"Sept", 10:"Okt", 11:"Nov", 12:"Des"})

In [None]:
hour_df.head()

- **Mengkonversi nilai pada kolom weekday dalam day_df dan hour_df**

In [None]:
day_df["weekday"] = day_df["weekday"].cat.rename_categories({0:"Sunday", 1: "Monday", 2:"Tuesday", 3:"Wednesday", 4:"Thursday", 5:"Friday", 6:"Saturday"})

In [None]:
day_df.head()

In [None]:
hour_df["weekday"] = hour_df["weekday"].cat.rename_categories({0:"Sunday", 1: "Monday", 2:"Tuesday", 3:"Wednesday", 4:"Thursday", 5:"Friday", 6:"Saturday"})

In [None]:
hour_df.head()

- **Mengkonversi nilai pada kolom workingday dalam day_df dan hour_df**

In [None]:
day_df["workingday"] = day_df["workingday"].cat.rename_categories({0: "Hari Libur", 1:"Hari Kerja"})

In [None]:
day_df.head()

In [None]:
hour_df["workingday"] = hour_df["workingday"].cat.rename_categories({0: "Hari Libur", 1:"Hari Kerja"})

In [None]:
hour_df.head()

- **Mengkonversi nilai pada kolom weathersit dalam day_df dan hour_df**

In [None]:
day_df["weathersit"] = day_df["weathersit"].cat.rename_categories({1: "Clear", 2:"Mist+Cloudy", 3:"Light Snow", 4:"Heavy Rain + Ice Pallets"})

In [None]:
day_df.head()

In [None]:
hour_df["weathersit"] = hour_df["weathersit"].cat.rename_categories({1: "Clear", 2:"Mist+Cloudy", 3:"Light Snow", 4:"Heavy Rain + Ice Pallets"})

In [None]:
hour_df.head()

**Insight:**

- Berdasarkan hasil proses assessing data, diketahui terdapat kesalahan tipe data untuk kolom dteday yang ada pada day_df maupun hour_df. Jadi, untuk mengatasi masalah ini, pada tahap cleaning data dilakukan penggantian tipe data pada **kolom "dteday" yang semula object diganti menjadi datetime**. Selain itu, pada tahap cleaning data dilakukan penggantian tipe data pada **kolom "season", "year", "month", "holiday", "weekday", "workingday", dan "weathersit" yang semula int diganti menjadi category**;
- Melakukan penggantian nama kolom agar mudah dibaca, yakni:
    1. dteday menjadi date_day
    2. yr menjadi year
    3. mnth menjadi month
    4. hr menjadi hours
    5. cnt menjadi count
- Melakukan konversi nilai pada kolom season, year, month, weekday, workingday, dan weathersit agar mudah dipahami, yakni:
    1. season : 1 = Spring, 2 = Summer, 3 = Fall, 4 = Winter
    2. year : 0 = 2011, 1 = 2012
    3. month : 1 = Jan, 2 = Feb, 3 = Mar, 4 = Apr, 5 = Mei, 6 = Jun, 7 = Jul, 8 = Ags, 9 = Sept, 10 = Okt, 11 = Nov, 12 = Des
    4. weekday : 0 = Sunday, 1 = Monday, 2 = Tuesday, 3 = Wednesday, 4 = Thursday, 5 = Friday, 6 = Saturday
    5. workingday : 0 = Hari libur, 1 = Hari kerja
    6. weathersit : 1 = Clear, 2 = Mist+Cloudy, 3 = Light Snow, 4 = Heavy Rain + Ice Pallets

## Exploratory Data Analysis (EDA)

### Explore Data day_df

- **Menampilkan ringkasan parameter statistik dari data day_df**

In [None]:
day_df.describe(include = "all")

- **Menampilkan data jumlah penyewaan sepeda berdasarkan musim dalam data day_df**

In [None]:
day_df.groupby(by = ["season"], observed = True)["count"].sum()

- **Menampilkan data jumlah penyewaan sepeda per-tahun dalam data day_df**

In [None]:
day_df.groupby(by = ["year","month"], observed = True)["count"].sum()

- **Menampilkan data jumlah penyewaan sepeda berdasarkan hari libur dan hari kerja dalam data day_df**

In [None]:
day_df.groupby(by = ["workingday"], observed = True)["count"].sum()

- **Menampilkan data jumlah penyewaan sepeda berdasarkan cuaca dalam data day_df**

In [None]:
day_df.groupby(by = ["weathersit"], observed = True)["count"].sum()

- **Menampilkan data jumlah penyewaan sepeda berdasarkan hari dalam seminggu dalam data day_df**

In [None]:
day_df.groupby(by = ["weekday"], observed = True)["count"].sum()

- **Menampilkan data jumlah penyewaan sepeda berdasarkan pengguna biasa dan pengguna terdaftar per-tahun dalam data day_df**

In [None]:
day_df.groupby(by = ["year"], observed = True).agg({
    "registered":"sum",
    "casual" : "sum"
})

- **Menampilkan data jumlah penyewaan sepeda berdasarkan hari libur Nasional (tanggal merah) dan per-tahun dalam data day_df**

In [None]:
day_df[day_df["holiday"] == 1].groupby(by=["year"], observed=True).agg({
    "count": "sum",
})

### Explore Data hour_df

- **Menampilkan ringkasan parameter statistik dari data hour_df**

In [None]:
hour_df.describe(include ="all")

- **Menampilkan data jumlah penyewaan sepeda berdasarkan jam dari data hour_df**

In [None]:
hour_df.groupby(by = ["hours"], observed = True)["count"].sum()

- **Menampilkan data jumlah penyewaan sepeda berdasarkan jam dan per-tahun dari data hour_df**

In [None]:
hour_df.groupby(by=["year", "hours"], observed=True).agg({
    "count": "sum"
})

**Insight:**
- Berdasarkan ringkasan parameter statistik dari data day_df, diperoleh informasi bahwa total jumlah penyewa sepeda dari tanggal 01-01-2011 sampai 31-12-2012 adalah sebanyak 731 penyewa. Selain itu juga diperoleh informasi:
    1. Berdasarkan musim, jumlah penyewaan sepeda pada musim fall (musim gugur) ada sebanyak 1061129 penyewa, musim summer (musim panas) ada sebanyak 918589 penyewa, musim spring (musim semi) ada sebanyak 471348 penyewa dan musim winter (musim dingin) ada sebanyak 841613 penyewa.
    2. Berdasarkan tahun, jumlah penyewaan sepeda tertinggi ada di tahun 2012 yakni sebanyak 2049576 dan tahun 2011 yakni 1243103 penyewa.
    3. Diperoleh informasi bahwa jumlah penyewa sepeda di hari kerja lebih banyak dibandingkan dengan hari libur, yakni pada saat hari kerja ada sebanyak  2292410 penyewa, sedangkan ketika hari libur hanya ada 1000269 penyewa.
    4. Berdasarkan cuaca, diperoleh informasi bahwa ketika clear (cuaca cerah) ada sebanyak 2257952 penyewa, mist+cloudy (kabut,berawan) ada sebanyak 996858 penyewa, dan light snow (salju) ada sebanyak 37869 penyewa.
    5. Berdasarkan hari dalam satu minggu jumlah penyewaan sepeda pada Sunday 444027 penyewa, Monday: 455503 penyewa, Tuesday: 469109 penyewa, Wednesday: 473048 penyewa, Thursday: 485395 penyewa, Friday: 487790 penyewa, dan Saturday: 477807 penyewa.
    6. Jumlah pengguna sepeda biasa (bukan member) pada tahun 2011 ada sebanyak 247252 orang dan pada tahun 2012 ada sebanyak 372765 orang, sedangkan untuk pengguna terdaftar (member) pada tahun 2011 ada sebanyak 995851 orang dan pada tahun 2012 ada sebanyak 1676811 orang. Berdasarkan informasi tersebut, seseorang yang sudah menjadi member dengan belum/bukan menjadi member memiliki nilai yang cukup jauh.
    7. Jumlah penyewa sepeda pada hari libur Nasional (tanggal merah) pada tahun 2011 ada sebanyak 30022 penyewa, dan pada tahun 2012 ada sebanyak 48413 penyewa.
- Berdasarkan ringkasan parameter statistik dari data hour_df, diperoleh informasi bahwa total jumlah penyewa sepeda ada sebanyak 17379 penyewa dengan range jam penyewaan yakni jam 00.00 sampai 23.00 dan rata-rata penyewaan sepeda terjadi pada jam 11.54 serta standar deviasi 6.91. Selain itu, diperoleh informasi bahwa penyewaan tertinggi terjadi pada jam 17.00 yakni sebesar 336860 penyewa dan penyewaan terendah terjadi pada jam 04.00 yakni sebesar 4428 penyewa.

## Visualization & Explanatory Analysis

### Pertanyaan 1: Bagaimana performa penyewaan sepeda dalam beberapa tahun terakhir ini?

In [None]:
# Membuat figure dengan ukuran (23,9)
plt.figure(figsize=(23,9))

# Mengelompokkan data berdasarkan kolom date_day dan mengambil nilai maksimum
monthly_count = day_df["count"].groupby(day_df["date_day"]).max()

# Membuat scatter plot
plt.scatter(monthly_count.index, monthly_count.values, color="red", s=10, marker='o')

# Membuat line plot untuk menghubungkan titik-titik dalam scatter plot
plt.plot(monthly_count.index, monthly_count.values, color = "skyblue")

# Pemberian nama/label
plt.xlabel=None
plt.ylabel("jumlah penyewaan sepeda", fontsize = 20)
plt.title("Grafik Jumlah penyewa sepeda tahun 2011-2012", fontsize=20)
plt.tick_params(axis ='x', labelsize = 20)
plt.tick_params(axis ='y', labelsize = 20)

# Menampilkan grafik
plt.show()

### Pertanyaan 2:  Pada musim apa yang memiliki tingkat penyewaan sepeda paling tinggi dan paling rendah?

In [None]:
# Mengatur warna untuk masing-masing bar chart
colors1 = ["bisque", "bisque", "darkorange", "bisque"]
colors2 = ["salmon", "mistyrose", "mistyrose", "mistyrose"]

fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(20, 10)) 

# Bar chart pertama
sns.barplot(
    y ="count", 
    x ="season",
    hue ="season",
    data = day_df.sort_values(by="season", ascending=True),
    palette = colors1,
    errorbar = None,
    ax = axes[0] 
)
axes[0].set_title("Grafik Penyewaan Sepeda Berdasarkan Musim Tertinggi", fontsize=20)
axes[0].set_ylabel("Jumlah penyewa sepeda", fontsize = 20)
axes[0].set_xlabel("Musim", fontsize = 20)
axes[0].tick_params(axis ='x', labelsize = 20)
axes[0].tick_params(axis ='y', labelsize = 20)

# Bar chart kedua
sns.barplot(
    y ="count", 
    x ="season",
    hue ="season",
    data = day_df.sort_values(by="season", ascending=False),
    palette = colors2,
    errorbar = None,
    ax = axes[1]  
)
axes[1].set_title("Grafik Penyewaan Sepeda Berdasarkan Musim Terendah", fontsize=20)
axes[1].set_ylabel("Jumlah penyewa sepeda", fontsize = 20)
axes[1].set_xlabel("Musim", fontsize = 20)
axes[1].tick_params(axis ='x', labelsize= 20)
axes[1].tick_params(axis ='y', labelsize= 20)

# Menampilkan plot
plt.tight_layout()
plt.show()


### Pertanyaan 3: Bagaimana perbandingan jumlah penyewaan sepeda pada hari libur dan hari kerja?

In [None]:
# mengatur warna
colors = ["#90CAF9","#1f77b4"]

# membuat subplot dengan 1 baris dan 1 kolom, dengan ukuran (20, 10)
fig, ax = plt.subplots(figsize=(20, 10))

# Buat barplot untuk y="count" dan x="workingday", menggunakan data=day_df
sns.barplot(
        y ="count", 
        x ="workingday",
        hue ="workingday",
        data = day_df.sort_values(by="workingday", ascending=False),
        palette = colors,
        errorbar = None,
        ax = ax
    )
# mengatur judul, label y dan x, serta tick params untuk subplot tersebut
ax.set_title("Hari Libur vs Hari Kerja", loc ="center", fontsize=20)
ax.set_ylabel("Jumlah Penyewa Sepeda", fontsize = 20)
ax.set_xlabel(None)
ax.tick_params(axis ='x', labelsize = 20)
ax.tick_params(axis ='y', labelsize = 20)

# menampilkan plot
plt.show()

### Pertanyaan 4: Bagaimana perbandingan jumlah pengguna sepeda biasa dan pengguna terdaftar?

In [None]:
# Menjumlahkan semua elemen dalam kolom casual (pengguna biasa)
jumlah_total_casual = sum(day_df['casual'])

# Menjumlahkan semua elemen dalam kolom registered (pengguna terdaftar)
jumlah_total_registered = sum(day_df['registered'])

# Membuat data untuk pie plot
data = [jumlah_total_casual, jumlah_total_registered]
labels = ["Casual (pengguna biasa)", "Registered (pengguna terdaftar)"]
colors=["#E67F0D", "#93C572"]

# Membuat pie plot
plt.pie(data, 
        labels=labels, 
        autopct='%1.1f%%', 
        colors=colors)

# Menampilkan pie plot
plt.show()

### Pertanyaan 5: Bagaimana tren jumlah penyewaan sepeda berdasarkan jam?

In [None]:
# Membuat figure dengan ukuran (23,9)
plt.figure(figsize=(23,9))

# Mengelompokkan data berdasarkan kolom hours dan mengambil nilai maksimum
hourly_count = hour_df["count"].groupby(hour_df["hours"]).max()

# Membuat scatter plot
plt.scatter(hourly_count.index, hourly_count.values, color="red", s=50, marker='o')

# Membuat line plot untuk menghubungkan titik-titik dalam scatter plot
plt.plot(hourly_count.index, hourly_count.values, color="#1f77b4")

# Pemberian nama/label
plt.xlabel= None
plt.ylabel("jumlah penyewaan sepeda", fontsize=20)
plt.title("Grafik Jumlah Penyewa Sepeda Berdasarkan Jam", fontsize=20)
plt.tick_params(axis='x', labelsize=20)
plt.tick_params(axis='y', labelsize=20)
plt.show()

**Insight**:
1. Pada pertanyaan 1, diperoleh informasi bahwa secara keseluruhan, jumlah penyewaan sepeda mengalami peningkatan dari awal tahun 2011 hingga akhir tahun 2012. Akan tetapi, setelah mencapai puncak di pertengahan tahun 2012 jumlah penyewaan mengalami sedikit penurunan ketika mendekati akhir tahun. Hal ini mungkin disebabkan oleh perubahan musim atau cuaca dan event-event khusus, misalnya hari libur.
2. Pada pertanyaan 2, diperoleh informasi bahwa berdasarkan musim, jumlah penyewa sepeda tertinggi ada pada musim Fall (Musim gugur), dan musim Spring (musim semi) memiliki penyewaan yang lebih rendah dibandingkan dengan musim lainnya.
3. Pada pertanyaan 3, diperoleh informasi bahwa jumlah penyewa sepeda pada hari kerja lebih banyak daripada jumlah penyewa sepeda pada hari libur.
4. Pada pertanyaan 4, diperoleh informasi bahwa sebagian besar penyewa adalah pengguna terdaftar dibandingkan dengan pengguna biasa.
5. Pada pertanyaan 5, diperoleh informasi bahwa jumlah penyewaan meningkat tajam mulai pagi hari, dan mencapai puncaknya ketika jam pulang kerja atau sore hari. Namun, ada juga pola menurun di malam hari.

## Analisis Lanjutan

### Analisis Clustering

- **Mengelompokkan jumlah penyewa sepeda berdasarkan kategori rentang waktu**

In [None]:
# Definisikan bins dan label untuk kategori waktu
bins = [0, 6, 12, 18, 24]
labels = ["Dini Hari (00.00-05.59)", "Pagi (06.00-11.59)", "Siang-Sore (12.00-17.59)", "Malam (18.00-23.59)"]

# Terapkan binning pada kolom 'hours'
hour_df["kategori_waktu"] = pd.cut(hour_df["hours"], bins=bins, labels=labels, right=False)

# Mengelompokkan data berdasarkan kategori waktu dan menjumlahkan total penyewaan
waktu_grouped = hour_df.groupby("kategori_waktu", observed=True)["count"].sum().reset_index()

# Menampilkan hasilnya
print(waktu_grouped)


In [None]:
# Definisi bins dan label untuk kategori waktu
bins = [0, 6, 12, 18, 24]
labels = ["Dini Hari (00.00-05.59)", "Pagi (06.00-11.59)", "Siang-Sore (12.00-17.59)", "Malam (18.00-23.59)"]

# Terapkan binning pada kolom 'hours'
hour_df["kategori_waktu"] = pd.cut(hour_df["hours"], bins=bins, labels=labels, include_lowest=True, right=False)

# Mengelompokkan data berdasarkan kategori waktu dan menjumlahkan total penyewaan
waktu_grouped = hour_df.groupby("kategori_waktu", observed=True)["count"].sum().astype(int).reset_index()

# Membuat plot
plt.figure(figsize=(10,5))
ax = sns.barplot(x="kategori_waktu", y="count", data=waktu_grouped, color="mediumpurple")

# Mengatur label sumbu
plt.xlabel= ("Kategori Waktu")
plt.ylabel("Jumlah Penyewaan Sepeda")

# Format sumbu y agar hanya menampilkan bilangan bulat
from matplotlib.ticker import FuncFormatter
ax.yaxis.set_major_formatter(FuncFormatter(lambda x, _: '{:,.0f}'.format(x)))

# Menampilkan grafik
plt.xticks(rotation=45)
plt.show()

**Insight:**
- Dilakukan analisis clustering berdasarkan kategori rentang waktu, yakni:
    1. Dini Hari (pukul 00.00-05.59) ada sebanyak 106509 penyewa;
    2. Pagi (pukul 06.00-11.59) ada sebanyak 907319 penyewa;
    3. Siang-Sore (pukul 12.00-17.59) ada sebanyak 1292742 penyewa;
    4. Malam (pukul 18.00-23.59) ada sebanyak 986109 penyewa.
- Berdasarkan informasi diatas, diperoleh rentang waktu terbanyak jumlah penyewa sepeda yaitu pada siang-sore hari sekitar pukul 12.00-17.59, dan waktu terendah jumlah penyewa sepeda yaitu pada dini hari sekitar pukul 00.00-05.59.

## Conclusion

**Pertanyaan:**
- Pertanyaan 1: Bagaimana performa penyewaan sepeda dalam dua tahun terakhir ini?
- Pertanyaan 2: Pada musim apa yang memiliki tingkat penyewaan sepeda paling tinggi dan paling rendah?
- Pertanyaan 3: Bagaimana perbandingan jumlah penyewaan sepeda pada hari libur dan hari kerja?
- Pertanyaan 4: Bagaimana perbandingan jumlah pengguna sepeda biasa dan pengguna terdaftar?
- Pertanyaan 5: Bagaimana tren jumlah penyewaan sepeda berdasarkan jam?

**Conclusion pertanyaan 1:**
- Berdasarkan hasil analisis, pada tahun 2011 jumlah penyewaan sepeda tertinggi ada pada bulan Juni, yaitu sebanyak 143512 penyewa dan terus mengalami penurunan hingga bulan Desember hanya menjadi 87323 penyewa. Selanjutnya pada tahun 2012, jumlah penyewaan terus meningkat dari bulan Januari-Agustus dan mencapai puncaknya pada bulan September, yaitu sebanyak 218573. Akan tetapi, setelah bulan September mengalami penurunan dan secara signifikan ada pada bulan Desember hanya menjadi 123713 penyewa. Diperoleh informasi secara keseluruhan jumlah penyewaan sepeda mengalami peningkatan dari awal tahun 2011 hingga akhir tahun 2012. Akan tetapi, setelah mencapai puncak di pertengahan tahun 2012 jumlah penyewaan mengalami sedikit penurunan ketika mendekati akhir tahun. Hal ini mungkin disebabkan oleh perubahan musim atau cuaca dan event-event khusus, misalnya hari libur.

**Conclusion pertanyaan 2:**
- Berdasarkan hasil analisis, musim yang memiliki tingkat penyewaan sepeda tertinggi ada pada musim Fall(musim gugur) yaitu sebanyak 1061129 penyewa. Selanjutnya untuk musim yang memiliki tingkat penyewaan terendah ada pada musim Spring(musim semi) yaitu sebanyak 471348 penyewa.

**Conclution pertanyaan 3:**
- Diperoleh informasi dari hasil analisis yaitu jumlah penyewaan sepeda pada hari kerja lebih tinggi dari pada jumlah penyewaan sepeda pada hari libur. Pada hari kerja ada sebanyak 22924101 penyewa, sedangkan pada hari libur ada sebanyak 1000269.

**Conclution pertanyaan 4:**
- Berdasarkan informasi yang diperoleh, sebagian besar pengguna telah berstatus sebagai pengguna terdaftar (registered) yakni sebesar 81,2 % dan sebagian kecil masih menjadi pengguna biasa (casual) yakni sebesar 18,8%.

**Conclution pertanyaan 5:**
- Berdasarkan hasil analisis, jumlah penyewaan sepeda tertinggi ada pada sore hari sekitar jam 17.00, dan jumlah penyewaan sepeda terendah ada pada dini hari sekitar jam 04.00.