# **Korelasi**

Korelasi adalah ukuran statistik yang mengungkapkan sejauh mana dua variabel terkait secara linier artinya mereka berubah bersama pada tingkat yang konstan baik searah maupun berlawanan arah. Korelasi digunakan untuk mendeskripsikan hubungan sederhana tanpa membuat pernyataan tentang sebab dan akibat.

## **Nilai Korelasi**

Koefisien korelasi (biasa disimbolkan dengan *r*) dapat bernilai positif ( + ) jika hubungan dua variabel searah / berbanding lurus (semakin meningkat variabel A maka nilai variabel B juga meningkat pun sebaliknya) atau negatif ( - ) jika hubungan dua variabel berbeda arah (semakin meningkat variabel A maka nilai variabel B akan menurun begitu juga sebaliknya) dan berada pada rentang -1 s.d. 1 mendekati -1 atau 1 maka hubungan keeratan dua variabel semakin kuat. Jika nilainya mendekati 0, maka hubungan keeratan dua variabel semakin lemah.

Berikut ini adalah interpretasi besarnya nilai koefisien korelasi.

*   0.0 <= |*r*| <= 0.2 menyatakan hubungan keeratan sangat lemah
*   0.2 < |*r*| <= 0.4 menyatakan hubungan keeratan lemah
*   0.4 < |*r*| <= 0.7 menyatakan hubungan keeratan cukup kuat
*   0.7 < |*r*| <= 0.9 menyatakan hubungan keeratan kuat
*   0.9 < |*r*| <= 1.0 menyatakan hubungan keeratan sangat kuat.

## **Pearson Correlation**

Korelasi Pearson adalah alat analisis statistik parametrik yang digunakan untuk melihat keeratan hubungan linier antara 2 variabel yang skala datanya adalah interval atau rasio.
<br></br>
<b>Rumus Korelasi Pearson</b>
  \begin{equation}
  r=\frac{\sum_{i=1}^{n}(x_{i} - \bar{x})\cdot(y_{i} - \bar{y})}{\sqrt{\sum_{i=1}^{n}(x_{i} - \bar{x})^2\cdot\sum_{i=1}^{n}(y_{i} - \bar{y})^2}} \\
  \end{equation}

Dengan :  
<li>𝑥 = Variabel pertama </li>
<li>𝑥̄ = Rata-rata variabel pertama </li>
<li>𝑦 = Variabel Kedua</li>
<li>𝑦̄ = Rata-rata variabel kedua </li>
</ol>

## **CONTOH**
Korelasi antara email marketing dan tingkat konversi adalah salah satu aspek yang sangat penting dalam digital marketing. Email marketing digunakan untuk mengirimkan pesan kepada pelanggan atau prospek dengan tujuan mempengaruhi tindakan mereka, seperti melakukan pembelian, mendaftar, atau mengunduh konten. Sementara itu, tingkat konversi mengukur seberapa efektif suatu kampanye dalam mendorong pengunjung untuk melakukan tindakan yang diinginkan, seperti pembelian atau pendaftaran.

Hitung berapa korelasi antara data open_rate dan conversion_rate dibawah ini serta tentukan jenis korelasinya!

In [1]:
# Data kampanye email
open_rate= [0.34, 0.57, 0.61, 0.68, 0.41, 0.83, 0.91, 0.26, 0.65, 0.49, 0.74, 0.75, 0.52, 0.85, 0.59]
conversion_rate= [0.12, 0.09, 0.14, 0.16, 0.18, 0.06, 0.05, 0.02, 0.1, 0.13, 0.04, 0.03, 0.15, 0.07, 0.08]

**JAWAB :**

1. Cari rata-rata open_rate

In [3]:
rataan_open_rate = sum(open_rate) / len(open_rate)
print(f'Rataan open_rate: {rataan_open_rate:.4f}')

Rataan open_rate: 0.6133


2. Cari rata-rata conversion_rate

In [4]:
rataan_conversion_rate = sum(conversion_rate) / len(conversion_rate)
print(f'Rataan conversion_rate: {rataan_conversion_rate:.4f}')


Rataan conversion_rate: 0.0947


3. Hitung bagian pembilang (dimisalkan sebagai A)

  \begin{equation}
  A = \sum_{i=1}^{n}(x_{i} - \bar{x})\cdot(y_{i} - \bar{y})
  \end{equation}

In [7]:
open_rate= [0.34, 0.57, 0.61, 0.68, 0.41, 0.83, 0.91, 0.26, 0.65, 0.49, 0.74, 0.75, 0.52, 0.85, 0.59]
conversion_rate= [0.12, 0.09, 0.14, 0.16, 0.18, 0.06, 0.05, 0.02, 0.1, 0.13, 0.04, 0.03, 0.15, 0.07, 0.08]

rataan_open_rate = sum(open_rate) / len(open_rate)
rataan_conversion_rate = sum(conversion_rate) / len(conversion_rate)

jumlah_pembilang = 0

for i in range(len(open_rate)):
    # Indent the line below with 4 spaces
    jumlah_pembilang += (open_rate[i] - rataan_open_rate) * (conversion_rate[i] - rataan_conversion_rate)

print(f'Jumlah pembilang (A): {jumlah_pembilang:.4f}')

Jumlah pembilang (A): -0.0448


4. Hitung bagian penyebut (dimisalkan sebagai B)

  \begin{equation}
  B = \sqrt{\sum_{i=1}^{n}(x_{i} - \bar{x})^2\cdot\sum_{i=1}^{n}(y_{i} - \bar{y})^2}
  \end{equation}

In [8]:
import math

# Data kampanye email
open_rate = [0.34, 0.57, 0.61, 0.68, 0.41, 0.83, 0.91, 0.26, 0.65, 0.49, 0.74, 0.75, 0.52, 0.85, 0.59]
conversion_rate = [0.12, 0.09, 0.14, 0.16, 0.18, 0.06, 0.05, 0.02, 0.1, 0.13, 0.04, 0.03, 0.15, 0.07, 0.08]

# Rata-rata open_rate dan conversion_rate
rataan_open_rate = sum(open_rate) / len(open_rate)
rataan_conversion_rate = sum(conversion_rate) / len(conversion_rate)

# Menghitung bagian penyebut (B)
jumlah_kuadrat_selisih_x = 0  # Σ(xi - x̄)^2
jumlah_kuadrat_selisih_y = 0  # Σ(yi - ȳ)^2

for i in range(len(open_rate)):
    jumlah_kuadrat_selisih_x += (open_rate[i] - rataan_open_rate) ** 2
    jumlah_kuadrat_selisih_y += (conversion_rate[i] - rataan_conversion_rate) ** 2

jumlah_penyebut = math.sqrt(jumlah_kuadrat_selisih_x * jumlah_kuadrat_selisih_y)

print(f'Jumlah penyebut (B): {jumlah_penyebut:.4f}')

Jumlah penyebut (B): 0.1328


5. Lakukan perhitungan korelasi

<b>Rumus Korelasi Pearson</b>
  \begin{equation}
  r=\frac{\sum_{i=1}^{n}(x_{i} - \bar{x})\cdot(y_{i} - \bar{y})}{\sqrt{\sum_{i=1}^{n}(x_{i} - \bar{x})^2\cdot\sum_{i=1}^{n}(y_{i} - \bar{y})^2}} \\
  \end{equation}

In [9]:
import math

# Data kampanye email
open_rate = [0.34, 0.57, 0.61, 0.68, 0.41, 0.83, 0.91, 0.26, 0.65, 0.49, 0.74, 0.75, 0.52, 0.85, 0.59]
conversion_rate = [0.12, 0.09, 0.14, 0.16, 0.18, 0.06, 0.05, 0.02, 0.1, 0.13, 0.04, 0.03, 0.15, 0.07, 0.08]

# Rata-rata open_rate dan conversion_rate
rataan_open_rate = sum(open_rate) / len(open_rate)
rataan_conversion_rate = sum(conversion_rate) / len(conversion_rate)

# Menghitung bagian pembilang (A)
jumlah_pembilang = 0
for i in range(len(open_rate)):
    jumlah_pembilang += (open_rate[i] - rataan_open_rate) * (conversion_rate[i] - rataan_conversion_rate)

# Menghitung bagian penyebut (B)
jumlah_kuadrat_selisih_x = 0
jumlah_kuadrat_selisih_y = 0
for i in range(len(open_rate)):
    jumlah_kuadrat_selisih_x += (open_rate[i] - rataan_open_rate) ** 2
    jumlah_kuadrat_selisih_y += (conversion_rate[i] - rataan_conversion_rate) ** 2
jumlah_penyebut = math.sqrt(jumlah_kuadrat_selisih_x * jumlah_kuadrat_selisih_y)

# Menghitung korelasi (r)
r = jumlah_pembilang / jumlah_penyebut

print(f'Korelasi (r) = {r:.4f}')

Korelasi (r) = -0.3375


6. Tentukan jenis korelasi

*   0.0 <= |*r*| <= 0.2 menyatakan hubungan keeratan sangat lemah
*   0.2 < |*r*| <= 0.4 menyatakan hubungan keeratan lemah
*   0.4 < |*r*| <= 0.7 menyatakan hubungan keeratan cukup kuat
*   0.7 < |*r*| <= 0.9 menyatakan hubungan keeratan kuat
*   0.9 < |*r*| <= 1.0 menyatakan hubungan keeratan sangat kuat.

In [10]:
import math

# ... (previous code for calculating r) ...

# Tentukan jenis korelasi
if 0.0 <= abs(r) <= 0.2:
    jenis_korelasi = "sangat lemah"
elif 0.2 < abs(r) <= 0.4:
    jenis_korelasi = "lemah"
elif 0.4 < abs(r) <= 0.7:
    jenis_korelasi = "cukup kuat"
elif 0.7 < abs(r) <= 0.9:
    jenis_korelasi = "kuat"
elif 0.9 < abs(r) <= 1.0:
    jenis_korelasi = "sangat kuat"
else:
    jenis_korelasi = "tidak valid"  # Handle cases where r is outside the expected range

print(f"Jenis korelasi: {jenis_korelasi}")

Jenis korelasi: lemah


7. Interpretasikan Hasilnya

....

In [11]:
import math

# ... (previous code for calculating r and jenis_korelasi) ...

# Interpretasi hasil
print(f"Korelasi (r) = {r:.4f}")
print(f"Jenis korelasi: {jenis_korelasi}")

# Interpretasi arah korelasi
if r > 0:
    arah_korelasi = "positif"
elif r < 0:
    arah_korelasi = "negatif"
else:
    arah_korelasi = "tidak ada korelasi"

print(f"Arah korelasi: {arah_korelasi}")

# Interpretasi lengkap
print("\nInterpretasi:")
if arah_korelasi == "positif":
    print(f"Terdapat korelasi {jenis_korelasi} {arah_korelasi} antara open_rate dan conversion_rate.")
    print("Artinya, semakin tinggi open_rate, cenderung semakin tinggi pula conversion_rate.")
elif arah_korelasi == "negatif":
    print(f"Terdapat korelasi {jenis_korelasi} {arah_korelasi} antara open_rate dan conversion_rate.")
    print("Artinya, semakin tinggi open_rate, cenderung semakin rendah conversion_rate.")
else:
    print("Tidak terdapat korelasi linier antara open_rate dan conversion_rate.")

# Contoh interpretasi berdasarkan nilai r yang didapatkan:
# Misalkan r = -0.65
# Output:
# Korelasi (r) = -0.6500
# Jenis korelasi: cukup kuat
# Arah korelasi: negatif
#
# Interpretasi:
# Terdapat korelasi cukup kuat negatif antara open_rate dan conversion_rate.
# Artinya, semakin tinggi open_rate, cenderung semakin rendah conversion_rate.

Korelasi (r) = -0.3375
Jenis korelasi: lemah
Arah korelasi: negatif

Interpretasi:
Terdapat korelasi lemah negatif antara open_rate dan conversion_rate.
Artinya, semakin tinggi open_rate, cenderung semakin rendah conversion_rate.
