# Tentang Perusahaan

Pada tahun 2016, Cyclistic meluncurkan penawaran berbagi sepeda yang sukses. Sejak itu, program tersebut telah berkembang menjadi 5.824 armada sepeda yang dilacak secara geografis dan dikunci ke dalam jaringan 692 stasiun di seluruh Chicago. Sepeda dapat dibuka kuncinya dari satu stasiun dan dikembalikan ke stasiun lain di sistem kapan saja.
Sampai saat ini, strategi pemasaran Cyclistic mengandalkan membangun kesadaran umum dan menarik segmen konsumen yang luas. Salah satu pendekatan yang membantu mewujudkan hal ini adalah fleksibilitas rencana penetapan harganya: tiket sekali jalan, tiket sehari penuh, dan keanggotaan tahunan. Pelanggan yang membeli tiket sekali jalan atau sehari penuh disebut sebagai penumpang biasa. Pelanggan yang membeli keanggotaan tahunan adalah anggota Cyclistic.

Analis keuangan Cycistic telah menyimpulkan bahwa anggota tahunan jauh lebih menguntungkan daripada pengendara biasa. Meskipun fleksibilitas harga membantu Cyclistic menarik lebih banyak pelanggan, Moreno percaya bahwa memaksimalkan jumlah anggota tahunan akan menjadi kunci pertumbuhan di masa depan. Daripada membuat kampanye pemasaran yang menargetkan semua pelanggan baru, Moreno percaya ada peluang yang sangat bagus untuk mengubah pengendara biasa menjadi anggota. Dia mencatat bahwa pengendara kasual sudah mengetahui program Cyclistic dan telah memilih Cyclistic untuk kebutuhan mobilitas mereka.

Moreno telah menetapkan tujuan yang jelas: Merancang strategi pemasaran yang ditujukan untuk mengubah pengendara biasa menjadi anggota tahunan. Namun, untuk melakukan itu, tim analis pemasaran perlu lebih memahami bagaimana perbedaan anggota tahunan dan pengendara biasa, mengapa pengendara biasa akan membeli keanggotaan, dan bagaimana media digital dapat memengaruhi taktik pemasaran mereka. Moreno dan timnya
tertarik untuk menganalisis data perjalanan sepeda sejarah Cyclistic untuk mengidentifikasi tren

# 1. Skenario

The Cycistic adalah perusahaan berbagi sepeda di Chicago. Direktur pemasaran percaya bahwa kesuksesan masa depan perusahaan bergantung pada memaksimalkan jumlah keanggotaan tahunan. Oleh karena itu, tim ingin memahami bagaimana pengendara kasual dan anggota tahunan menggunakan sepeda Cyclistic secara berbeda. Dari wawasan ini, tim akan merancang strategi pemasaran baru untuk mengubah pengendara biasa menjadi anggota tahunan. Tapi pertama-tama, eksekutif Cyclistic harus menyetujui rekomendasi, sehingga mereka harus didukung dengan wawasan data yang menarik dan visualisasi data profesional


# 2. Bertanya

Tiga pertanyaan akan memandu program pemasaran di masa depan:
1.	Bagaimana anggota tahunan dan pengendara biasa menggunakan sepeda secara berbeda?
2.	Mengapa pengendara biasa membeli keanggotaan tahunan Cyclistic?
3.	Bagaimana Cyclistic menggunakan media digital untuk mempengaruhi pengendara biasa untuk menjadi anggota?


# 3. Persiapan

Data yang akan digunakan adalah data historikal perjalanan Cycistics, sehingga dapat dianalisis dan diidentifikasi trennya. Pertama-tama, data harus diunduh, dapat diunduh dari kumpulan data yang telah saya lampirkan, atau dari https://divvy-tripdata.s3.amazonaws.com/index.html. (Catatan: Dataset memiliki nama yang berbeda karena Cyclistic adalah perusahaan fiktif. Untuk tujuan studi kasus ini, dataset tersebut sesuai dan akan memungkinkan kita untuk menjawab pertanyaan bisnis. Data telah disediakan oleh Motivate International Inc. di bawah lisensi ini https://ride.divvybikes.com/data-license-agreement.) Ini adalah data publik yang dapat kami gunakan untuk mengeksplorasi bagaimana berbagai jenis pelanggan menggunakan sepeda Cyclistic.

# 4. Proses

Selanjutnya adalah menjalankan langkah-langkah proses. Unduh data dari https://divvy-tripdata.s3.amazonaws.com/index.html, lalu unzip data tersebut. Di sini saya menggunakan data sembilan bulan pertama tahun 2022, jadi saya membuat folder untuk memisahkan data yang hanya ingin saya analisis. Jangan lupa beri nama folder dan file dengan tepat. Langkah-langkah analisis akan dilakukan dengan menggunakan R Studio.

# 5. Menganalisis

Setelah kami menyimpan data dengan benar, sekarang kami siap untuk melakukan analisis data.

**5.1 Install Required Packages**

In [None]:
install.packages("tidyverse")
install.packages("lubridate")
install.packages("ggplot2")

library(tidyverse)
library(lubridate)
library(ggplot2)

**5.2 Mengumpulkan Data**

In [None]:
Jul_2022 <- read_csv("D:/CSV/202207-divvy-tripdata.csv")
Aug_2022 <- read_csv("D:/CSV/202208-divvy-tripdata.csv")
Sep_2022 <- read_csv("D:/CSV/202209-divvy-publictripdata.csv")

* Karena data dipisahkan dalam file, kita perlu menggabungkan file-file ini menjadi satu file. Saya menggunakan kode-kode di bawah ini untuk menggabungkan data

In [None]:
trips_2022 <- bind_rows(Jul_2022, Aug_2022, Sep_2022)

**5.3 Bersihkan Dan Tambahkan Data Untuk Mempersiapkan Analisis**

* Periksa tabel baru yang telah dibuat.

In [None]:
colnames(trips_2022)
nrow(trips_2022) 
dim(trips_2022) 
head(trips_2022) 
str(trips_2022) 
summary(trips_2022) 

* Kemudian saya menambahkan beberapa kolom yang mencantumkan tanggal, bulan, hari, dan tahun setiap perjalanan. Saya menggunakan kode-kode ini di bawah untuk membagi nilai kolom 'started_at' menjadi kolom terpisah yang disebut 'tanggal', 'bulan', 'hari', 'tahun', dan kolom lain yang disebut 'hari dalam seminggu' untuk menunjukkan hari apa dalam seminggu saat pengguna naik.

In [None]:
trips_2022$date <- as.Date(trips_2022$started_at)
trips_2022$month <- format(as.Date(trips_2022$date), "%m")
trips_2022$day <- format(as.Date(trips_2022$date), "%d")
trips_2022$year <- format(as.Date(trips_2022$date), "%Y")
trips_2022$day_of_week <- format(as.Date(trips_2022$date), "%A")

* Langkah selanjutnya adalah menambahkan kolom Panjang Perjalanan untuk menunjukkan berapa lama setiap perjalanan telah berlalu. Untuk itu saya menambahkan kolom baru bernama 'ride_length' ke trips_2022 dalam hitungan detik. Gunakan kode ini di bawah ini

In [None]:
trips_2022$ride_length <- difftime(trips_2022$ended_at, trips_2022$started_at)

* Periksa struktur kolom

In [None]:
str(trips_2022)

* Karena 'ride_length' bukan numerik, maka konversikan 'ride_length' dari Factor ke Numeric, sehingga kita dapat menjalankan perhitungan pada data. Dan setelah itu kami dapat memastikan bahwa panjang perjalanan adalah numerik

In [None]:
trips_2022$ride_length <- as.numeric(as.character(trips_2022$ride_length))

is.numeric(trips_2022$ride_length)

* Kerangka data mencakup beberapa ratus entri saat sepeda dikeluarkan dari dok dan diperiksa kualitasnya oleh Divvy atau ride_length negatif. dan akan membuat versi baru kerangka data (v2) karena data sedang dihapus

In [None]:
trips_2022_v2 <- trips_2022[!(trips_2022$start_station_name == "HQ QR" | trips_2022$ride_length<0),]

5.4 Perilaku Analisis Deskriptif

* Kita dapat menambahkan analisis deskriptif pada ride_length dengan menggunakan kode-kode ini

In [None]:
mean(trips_2022_v2$ride_length) 
median(trips_2022_v2$ride_length) 
max(trips_2022_v2$ride_length) 
min(trips_2022_v2$ride_length)

* Kita dapat menyingkat empat baris di atas menjadi satu baris menggunakan ringkasan() pada atribut tertentu

In [None]:
summary(trips_2022_v2$ride_length)

Lakukan perbandingan anggota dan pengguna biasa

In [None]:
aggregate(trips_2022_v2$ride_length ~ trips_2022_v2$member_casual, FUN = mean)
aggregate(trips_2022_v2$ride_length ~ trips_2022_v2$member_casual, FUN = median)
aggregate(trips_2022_v2$ride_length ~ trips_2022_v2$member_casual, FUN = max)
aggregate(trips_2022_v2$ride_length ~ trips_2022_v2$member_casual, FUN = min)

* Lihat waktu perjalanan rata-rata setiap hari untuk anggota vs pengguna biasa

In [None]:
aggregate(trips_2022_v2$ride_length ~ trips_2022_v2$member_casual + 
            trips_2022_v2$day_of_week, FUN = mean)

* Perhatikan bahwa hari-hari dalam seminggu tidak teratur. Mari kita perbaiki.

In [None]:
trips_2022_v2$day_of_week <- ordered(trips_2022_v2$day_of_week, 
                                     levels=c("Sunday", "Monday", "Tuesday", "Wednesday", 
                                              "Thursday", "Friday", "Saturday"))

* Sekarang, mari kita jalankan waktu perjalanan rata-rata setiap hari untuk anggota vs pengguna biasa

In [None]:
aggregate(trips_2022_v2$ride_length ~ trips_2022_v2$member_casual + 
            trips_2022_v2$day_of_week, FUN = mean)

* menganalisis jumlah wahana berdasarkan keanggotaan dan hari kerja (urutkan berdasarkan jumlah wahana menurun)

In [None]:
trips_2022_v2 %>% 
  mutate(weekday = wday(started_at, label = TRUE)) %>% 
  group_by(member_casual, weekday) %>%  
  summarise(number_of_rides = n()) %>% 
  arrange(-number_of_rides)

* Dan setelah itu kita bisa memvisualisasikan hasilnya dengan menggunakan kode-kode di bawah ini

In [None]:
trips_2022_v2 %>% 
  mutate(weekday = wday(started_at, label = TRUE)) %>% 
  group_by(member_casual, weekday) %>%  
  summarise(number_of_rides = n()
            ,average_duration = mean(ride_length)) %>% 
  arrange(member_casual, weekday)  %>%   
  ggplot(aes(x = weekday, y = number_of_rides, fill = member_casual)) +
  geom_col(position = "dodge")

* atau Anda dapat menganalisis jumlah rata-rata durasi perjalanan, berdasarkan keanggotaan dan hari kerja dengan diurutkan berdasarkan durasi perjalanan rata-rata menurun menggunakan kode di bawah ini

In [None]:
trips_2022_v2 %>% 
  mutate(weekday = wday(started_at, label = TRUE)) %>% 
  group_by(member_casual, weekday) %>%  
  summarise(average_duration = mean(ride_length)) %>% 
  arrange(-average_duration)

* Dan visualisasi dapat dilakukan dengan menggunakan kode-kode ini

In [None]:
trips_2022_v2 %>% 
  mutate(weekday = wday(started_at, label = TRUE)) %>% 
  group_by(member_casual, weekday) %>% 
  summarise(number_of_rides = n()
            ,average_duration = mean(ride_length)) %>% 
  arrange(member_casual, weekday)  %>% 
  ggplot(aes(x = weekday, y = average_duration, fill = member_casual)) +
  geom_col(position = "dodge")

WooHoo Selesai

Setelah visualisasi ditampilkan, selanjutnya adalah mengekspor visualisasi tersebut ke perangkat. Dan sekarang kami siap untuk membagikan hasil visualisasi kami.

# 6. Berbagi dan Bertindak

Setelah analisis dilakukan dan visualisasi dibuat, selanjutnya adalah berbagi temuan. Rekomendasi dapat diberikan berdasarkan data yang disimpulkan dan kami dapatkan dari proses analisis.

Kita bisa melihat bahwa durasi terlama dalam seminggu adalah pada hari Jumat dan Sabtu.