<a href="https://colab.research.google.com/github/atikahlestar/Data-Analysis/blob/main/Kasus_8_Analyst_Visitor.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Kasus 08 : Visito Analytics
VisitoAnalytics adalah perusahaan yang berfokus pada analisis perilaku pengunjung website untuk membantu berbagai perusahaan dalam memahami bagaimana pengunjung berinteraksi dengan platform mereka. Dengan menggunakan teknologi pemantauan sesi, VisitoAnalytics mengumpulkan data mengenai perilaku pengguna, seperti jumlah halaman yang dilihat, durasi sesi, sumber trafik, dan perangkat yang digunakan. Salah satu klien VisitoAnalytics adalah sebuah perusahaan e-commerce terkemuka di Asia Tenggara yang ingin meningkatkan pengalaman pengguna dan konversi.

Sebagai bagian dari upaya meningkatkan pengalaman pengunjung dan mendorong konversi penjualan, tim Data Analyst di VisitoAnalytics melakukan analisis terhadap perilaku pengunjung website e-commerce tersebut. Data yang dianalisis mencakup sesi dari 10.000 pengunjung acak dalam periode waktu tertentu. Dataset ini menyimpan informasi penting seperti ID sesi, ID pengunjung, jumlah halaman yang dilihat, durasi sesi, sumber trafik, perangkat yang digunakan, negara asal pengunjung, dan apakah pengunjung langsung keluar dari situs (bounce rate).

Tim ingin menjawab beberapa pertanyaan kunci yang dapat digunakan untuk menyusun strategi pengoptimalan website dan kampanye pemasaran yang lebih efektif:

## Dataset

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
file_path = "https://docs.google.com/spreadsheets/d/1cStD3BwOHdNCTp8HveMGo4YR8XcEfKXz/export?format=csv"

In [3]:
df = pd.read_csv(file_path)
df.head()

Unnamed: 0,Session ID,Visitor ID,Session Date,Pages Viewed,Session Duration (seconds),Source,Device Type,Country,Bounce Rate
0,1,2476,2024-10-06,1,58,Paid Search,Desktop,Malaysia,No
1,2,7809,2024-10-05,1,34,Referral,Desktop,Malaysia,Yes
2,3,1750,2024-10-02,2,95,Social Media,Mobile,Singapore,No
3,4,1383,2024-10-02,3,56,Organic Search,Desktop,Singapore,No
4,5,6203,2024-10-03,2,83,Paid Search,Tablet,Malaysia,Yes


In [4]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1000 entries, 0 to 999
Data columns (total 9 columns):
 #   Column                      Non-Null Count  Dtype 
---  ------                      --------------  ----- 
 0   Session ID                  1000 non-null   int64 
 1   Visitor ID                  1000 non-null   int64 
 2   Session Date                1000 non-null   object
 3   Pages Viewed                1000 non-null   int64 
 4   Session Duration (seconds)  1000 non-null   int64 
 5   Source                      1000 non-null   object
 6   Device Type                 1000 non-null   object
 7   Country                     1000 non-null   object
 8   Bounce Rate                 1000 non-null   object
dtypes: int64(4), object(5)
memory usage: 70.4+ KB


In [5]:
df.duplicated().sum()

0

In [6]:
df.isnull().sum()

Unnamed: 0,0
Session ID,0
Visitor ID,0
Session Date,0
Pages Viewed,0
Session Duration (seconds),0
Source,0
Device Type,0
Country,0
Bounce Rate,0


## Soal 1
Berapa rata-rata halaman yang dilihat oleh pengunjung per sesi?

### Jawab :

In [7]:
avg_pages_per_session = df["Pages Viewed"].mean()
avg_pages_per_session

1.998

### Analisis :

Hasil analisis menunjukkan bahwa pengunjung rata-rata melihat sekitar 2 halaman (1,988). Berikut adalah beberapa poin penting yang dapat diambil dari hasil ini serta implikasi lebih lanjut:

1. Tingkat Interaksi Pengunjung:

Rata-rata 2 halaman per sesi menunjukkan interaksi yang dangkal, di mana sebagian besar pengunjung hanya melihat satu atau dua halaman sebelum meninggalkan situs.

2. Potensi Faktor Penyebab:

- Relevansi konten: Konten awal mungkin sudah cukup bagi pengunjung.
- Navigasi situs: Navigasi kurang intuitif.
- Kecepatan loading halaman: Halaman lambat memuat dapat mengurangi eksplorasi.
- Optimasi tampilan mobile: Pengalaman buruk di perangkat mobile dapat menghambat interaksi.

3. Bounce Rate:

  Angka rata-rata ini terkait dengan bounce rate tinggi, menunjukkan pengunjung hanya melihat satu halaman sebelum meninggalkan situs.

4. Strategi Pengoptimalan:

- Meningkatkan navigasi dan pengalaman pengguna (UX).
- Memanfaatkan tautan internal untuk merekomendasikan konten terkait.
- Mengoptimalkan tampilan untuk pengguna mobile.
- Mempercepat waktu loading halaman.

5. Perbandingan Industri:

  Dibandingkan dengan benchmark, rata-rata 2 halaman per sesi cenderung rendah, terutama untuk situs e-commerce atau berita yang mengutamakan keterlibatan pengunjung.

**Kesimpulan:**

Rata-rata 2 halaman per sesi menunjukkan interaksi terbatas. Langkah optimasi seperti perbaikan UX, navigasi, kecepatan, dan optimasi mobile dapat meningkatkan keterlibatan pengguna dan jumlah halaman yang dilihat.



## Soal 2

Berapa rata-rata durasi sesi pengunjung?

### Jawab :

In [8]:
avg_session_duration = df["Session Duration (seconds)"].mean()
avg_session_duration

76.956

### Analisis :

1. Durasi Sesi Pendek:

  Pengunjung rata-rata hanya berada di situs selama 1,28 menit (atau sekitar 77 detik), menunjukkan interaksi yang singkat sebelum mereka meninggalkan atau menyelesaikan kunjungan.

2. Potensi Penyebab:

- Relevansi Konten: Konten kurang sesuai dengan kebutuhan pengunjung.
- Pengalaman Pengguna (UX): Navigasi sulit atau informasi sulit ditemukan.
- Kecepatan Situs: Loading lambat membuat pengunjung cepat meninggalkan situs.
- Sifat Trafik: Pengunjung dari iklan berbayar atau media sosial cenderung hanya melihat halaman tertentu secara singkat.

3. Rekomendasi Perbaikan:

- Tinjau relevansi konten agar lebih menarik dan sesuai dengan kebutuhan pengunjung.
- Perbaiki UX dengan navigasi yang lebih intuitif.
- Tingkatkan kecepatan situs untuk meminimalkan frustrasi pengunjung.

**Kesimpulan:**

Durasi sesi rata-rata yang pendek mengindikasikan perlunya perbaikan pada konten, UX, dan kecepatan situs untuk meningkatkan keterlibatan pengunjung dan membuat mereka tinggal lebih lama.








## Soal 3

Apakah pengunjung dari perangkat tertentu (desktop, mobile, tablet) cenderung melihat lebih banyak halaman atau memiliki durasi sesi yang lebih lama?




### Jawab :

In [9]:
customer_device = df.groupby("Device Type")[["Pages Viewed", "Session Duration (seconds)"]].mean()
customer_device

Unnamed: 0_level_0,Pages Viewed,Session Duration (seconds)
Device Type,Unnamed: 1_level_1,Unnamed: 2_level_1
Desktop,2.006116,76.131498
Mobile,1.970674,78.255132
Tablet,2.018072,76.433735


### Analisis :

1. Halaman yang Dilihat:

- Pengguna tablet cenderung melihat sedikit lebih banyak halaman per sesi dibandingkan desktop dan mobile, meskipun perbedaannya kecil.
- Desktop dan mobile hampir sama, dengan desktop sedikit lebih tinggi.

2. Durasi Sesi:

- Pengguna mobile memiliki durasi sesi rata-rata sedikit lebih lama dibandingkan desktop dan tablet (selisih sekitar 0,03 menit).
- Meski melihat lebih sedikit halaman, pengunjung mobile cenderung menghabiskan lebih banyak waktu di situs.


3. Implikasi:

- Pengalaman Mobile: Penting untuk mengoptimalkan kecepatan loading dan navigasi bagi pengguna mobile karena mereka cenderung menghabiskan waktu lebih lama di situs.
- Tablet dan Desktop: Pengoptimalan pada desktop dapat diterapkan untuk tablet dengan memastikan tampilan dan navigasi kompatibel untuk kedua perangkat.

**Kesimpulan:**

Tidak ada perbedaan signifikan dalam interaksi antar perangkat. Pengoptimalan yang konsisten di semua perangkat, terutama untuk pengalaman mobile, dapat membantu meningkatkan keterlibatan pengguna.

## Soal 4

Dari mana sumber trafik yang paling efektif dalam mempertahankan pengunjung? (Paid Search, Organic Search, Referral, Social Media, dll.)



### Jawab :

In [10]:
customer_source = df.groupby("Source")[["Pages Viewed", "Session Duration (seconds)"]].mean()
customer_source

Unnamed: 0_level_0,Pages Viewed,Session Duration (seconds)
Source,Unnamed: 1_level_1,Unnamed: 2_level_1
Direct,2.023474,75.943662
Organic Search,2.0,75.185714
Paid Search,2.015,77.975
Referral,1.937173,78.570681
Social Media,2.010753,77.360215


### Analisis :

1. Referral:

- Sumber trafik dengan durasi sesi rata-rata terlama (1,31 menit).
- Meskipun jumlah halaman yang dilihat sedikit lebih rendah, pengunjung dari referral lebih lama berinteraksi di situs.

2. Paid Search & Social Media:

- Durasi sesi mendekati referral, dengan pengunjung cenderung melihat lebih banyak halaman.
- Efektif dalam mendatangkan pengunjung yang aktif.

3. Direct & Organic Search:

- Durasi sesi lebih pendek dibanding sumber lain.
- Pengunjung Direct cenderung melihat lebih banyak halaman, sementara pengunjung Organic Search membutuhkan optimasi untuk mendorong interaksi lebih lanjut.

4. Implikasi:

- Referral: Tingkatkan kerjasama dengan situs lain untuk memaksimalkan trafik referral.
- Paid Search & Social Media: Alokasikan anggaran pemasaran lebih banyak ke sumber ini karena efektif mendatangkan pengunjung aktif.
- Organic Search & Direct: Optimalkan pengalaman pengguna untuk pencarian organik guna meningkatkan keterlibatan.

**Kesimpulan:**

Mengalokasikan anggaran pemasaran ke sumber trafik seperti Referral, Paid Search, dan Social Media dapat memberikan hasil yang efektif, sambil tetap memperbaiki pengalaman pengguna untuk Organic Search dan Direct Trafik.


## Soal 5

Bagaimana pola "bounce rate" dari berbagai sumber trafik?


### Jawab :

In [11]:
df["Bounce Rate"] = df["Bounce Rate"].map({"No": 0, "Yes": 1})

bounce_rate = df.groupby("Source")["Bounce Rate"].mean() * 100
bounce_rate

Unnamed: 0_level_0,Bounce Rate
Source,Unnamed: 1_level_1
Direct,41.784038
Organic Search,49.047619
Paid Search,48.0
Referral,50.26178
Social Media,50.0


### Analisis

1. Bounce Rate Tertinggi:

- Referral & Social Media: Sekitar 50% pengunjung meninggalkan situs setelah melihat satu halaman, mengindikasikan konten atau halaman arahan kurang relevan atau menarik.

2. Bounce Rate Sedang:

- Organic Search & Paid Search: Bounce rate mendekati 50%, menunjukkan perlunya peningkatan relevansi halaman arahan atau pengoptimalan strategi kata kunci dan iklan.

3. Bounce Rate Terendah:

- Direct Trafik: 41,78%, menandakan pengunjung lebih termotivasi untuk menjelajah, kemungkinan karena mereka lebih familiar dengan situs.

4. Implikasi dan Rekomendasi:

- Referral & Social Media: Tingkatkan relevansi konten dan optimalkan halaman arahan untuk audiens dari sumber ini.
- Organic & Paid Search: Optimalkan halaman arahan dengan strategi kata kunci dan konten yang lebih menarik untuk menurunkan bounce rate.
- Direct Trafik: Manfaatkan keterlibatan tinggi dengan menawarkan konten eksklusif untuk pengunjung langsung.

**Kesimpulan:**

Fokus pada peningkatan pengalaman pengguna di halaman arahan untuk referral, social media, dan pencarian (organik dan berbayar) dapat mengurangi bounce rate dan meningkatkan keterlibatan pengunjung.