# Uji Chi-Square
Studi kasus yang penulis lakukan adalah untuk menguji hubungan antara jumlah produk terjual dan tipe produk skincare tertentu. Analisis ini bertujuan untuk mengetahui apakah jenis produk, seperti serum, pelembab, atau toner, memiliki hubungan yang signifikan dengan tingkat penjualannya di platform e-commerce. Data yang digunakan mencakup tipe produk skincare dan jumlah terjual yang telah dikelompokkan ke dalam kategori tertentu (misalnya: rendah, sedang, dan tinggi) berdasarkan rentang kuantil penjualan, dari platform Tokopedia dan Lazada.

In [None]:
import pandas as pd
from scipy.stats import chi2_contingency

### Produk skincare Tokopedia

In [None]:
df = pd.read_excel("/content/190924-skincare clean versi2.xlsx")
df

In [None]:
df2_new = df[['Product Type', 'Sold Item']]
df2_new

In [None]:
# Membuat kategori jumlah terjual
median_sold = df2_new['Sold Item'].median()
df2_new['Sold Category'] = pd.cut(df2_new['Sold Item'], bins=[0, median_sold, df2_new['Sold Item'].max()], labels=['Low', 'High'])


# Mengelola nilai Sold = 0 secara eksplisit
df2_new['Sold Category'] = df2_new['Sold Category'].fillna('Low')


# Membuat tabel kontingensi
contingency_table = pd.crosstab(df2_new['Product Type'], df2_new['Sold Category'])


# Uji Chi-Square
chi2, p, dof, expected = chi2_contingency(contingency_table)


# Output hasil
print("Chi-Square Statistic:", chi2)
print("p-value:", p)
print("Degrees of Freedom:", dof)
print("Expected Frequency Table:\n", expected)


# Interpretasi hasil
if p < 0.05:
    print("Ada hubungan signifikan antara tipe produk dan kategori jumlah terjual.")
else:
    print("Tidak ada hubungan signifikan antara tipe produk dan kategori jumlah terjual.")

**Kesimpulan:** Hasil uji Chi-Square menunjukkan nilai Chi-Square Statistic sebesar 67,65, dengan p-value sebesar 8,81 × 10⁻¹⁰, yang jauh lebih kecil dari batas signifikansi α=0,05. Dengan demikian, dapat disimpulkan bahwa terdapat hubungan yang signifikan antara tipe produk dan kategori jumlah terjual di Tokopedia. Hal ini menunjukkan bahwa distribusi jumlah produk yang terjual berbeda secara signifikan berdasarkan tipe produk. Beberapa tipe produk cenderung memiliki jumlah terjual yang lebih tinggi atau lebih rendah dari yang diharapkan jika tidak ada hubungan, seperti yang terlihat pada Expected Frequency Table. Hal ini mengindikasikan bahwa tipe produk di Tokopedia dapat memengaruhi volume penjualannya, sehingga penjual atau pengambil keputusan di platform ini dapat menggunakan informasi tersebut untuk merancang strategi pemasaran atau penawaran produk yang lebih tepat sasaran

### Produk skincare Lazada

In [None]:
import pandas as pd
from scipy.stats import chi2_contingency

In [None]:
df1 = pd.read_csv("/content/240924 - Data Clean Skincare - Versi7.csv")
df1

In [None]:
df3_new = df1[['jenis', 'produkterjual']]
df3_new

In [None]:
# Membuat kategori jumlah terjual
median_sold = df3_new['produkterjual'].median()
df3_new['Sold Category'] = pd.cut(df3_new['produkterjual'], bins=[0, median_sold, df3_new['produkterjual'].max()], labels=['Low', 'High'])


# Mengelola nilai Sold = 0 secara eksplisit
df3_new['Sold Category'] = df3_new['Sold Category'].fillna('Low')


# Membuat tabel kontingensi
contingency_table = pd.crosstab(df3_new['jenis'], df3_new['Sold Category'])


# Uji Chi-Square
chi2, p, dof, expected = chi2_contingency(contingency_table)


# Output hasil
print("Chi-Square Statistic:", chi2)
print("p-value:", p)
print("Degrees of Freedom:", dof)
print("Expected Frequency Table:\n", expected)


# Interpretasi hasil
if p < 0.05:
    print("Ada hubungan signifikan antara tipe produk dan kategori jumlah terjual.")
else:
    print("Tidak ada hubungan signifikan antara tipe produk dan kategori jumlah terjual.")

**Kesimpulan:** Hasil uji Chi-Square menunjukkan nilai Chi-Square Statistic sebesar 20,85, dengan p-value sebesar 0,03497, yang lebih kecil dari batas signifikansi α=0,05. Dengan demikian, dapat disimpulkan bahwa terdapat hubungan yang signifikan antara tipe produk dan kategori jumlah terjual di Lazada. Hal ini menunjukkan bahwa distribusi jumlah produk yang terjual bervariasi secara signifikan berdasarkan tipe produk. Dari Expected Frequency Table, dapat dilihat bahwa beberapa tipe produk memiliki perbedaan yang jelas antara jumlah terjual yang diamati dan jumlah yang diharapkan secara acak. Hal ini menunjukkan bahwa tipe produk memainkan peran penting dalam penjualan, yang dapat dimanfaatkan oleh penjual untuk merancang strategi pemasaran yang lebih efisien, dengan fokus pada tipe produk yang memiliki peluang lebih besar untuk terjual dalam jumlah lebih tinggi.