# Conjoint Analysis

In [26]:
# http://www.askanalytics.in/2015/11/linear-conjoint-analysis-simplified.html

In [25]:
# http://www.askanalytics.in/p/conjoint-analysis.html

In [23]:
# https://github.com/victor7246/Academic-Projects/tree/master/Conjoint%20Analysis

In [24]:
# https://github.com/bayuprasetyaa/ConjointAnalysis

In [1]:
# https://ariepratama.github.io/How-to-do-conjoint-analysis-in-python/

In [2]:
# https://github.com/JanisIranee/Traditional-Conjoint-Analysis-with-Python

Изучается набор из нескольких конкурирующих продуктов. Эти продукты обладают полезными характеристиками (факторами). Например, при выборе наилучшего варианта тюбика для зубной пасты аналитик может ограничиться рассмотрением следующих факторов:
* размер тюбика (tube);
* размер колпачка (cap);
* материал, из которого изготовлен тюбик (material);
* рисунок на тюбике (color).

Рассматриваются следующие возможные значения факторов:
* размер тюбика (tube):
    * большой (tube_1);
    * маленький (tube_2);
* размер колпачка (cap):
    * большой (cap_1);
    * маленький (cap_2);
* материал, из которого изготовлен тюбик (material):
    * алюминий (material_1);
    * пластик (material_2);
* рисунок на тюбике (color):
    * белый, синий и красный цвета (color_1);
    * белый и синий цвета (color_2);
    * рисунок (color_3).

In [135]:
# Создадим словарь факторов
FNames={'tube_n':'размер тюбика','cap_n':'размер колпачка','material_n':'материал, из которого изготовлен тюбик','color_n':'рисунок на тюбике'}
FNames

{'tube_n': 'размер тюбика',
 'cap_n': 'размер колпачка',
 'material_n': 'материал, из которого изготовлен тюбик',
 'color_n': 'рисунок на тюбике'}

In [136]:
# Создадим словарь значений факторов
FGrad={'tube_g':{'tube_1_n':'большой','tube_2_n':'маленький'},'cap_g':{'cap_1_n':'большой','cap_2_n':'маленький'},'material_g':{'material_1_n':'алюминий','material_2_n':'пластик'},'color_g':{'color_1_n':'белый, синий и красный цвета','color_2_n':'белый и синий цвета','color_3_n':'рисунок'}}
FGrad

{'tube_g': {'tube_1_n': 'большой', 'tube_2_n': 'маленький'},
 'cap_g': {'cap_1_n': 'большой', 'cap_2_n': 'маленький'},
 'material_g': {'material_1_n': 'алюминий', 'material_2_n': 'пластик'},
 'color_g': {'color_1_n': 'белый, синий и красный цвета',
  'color_2_n': 'белый и синий цвета',
  'color_3_n': 'рисунок'}}

В файле data приведены варианты тюбика для зубной пасты (pasta01 - pasta08) с их рейтингами (от 1 до 10, 1 - самый высокий), которые поставили 30 опрошенных респондентов.

Отметим, что всего возможно 2x2x2x3=24 варианта тюбика для зубной пасты.

Также отметим, что соблюдено правило создания фиктивных переменных, а именно для переменной, имеющей n категорий, число фиктивных переменных составит (n-1).

In [137]:
import os
os.chdir("C:/Users/HP/Documents/analysis/Marketing/data/")

In [138]:
from pandas import read_csv
df = read_csv('conjoint_data.csv',delimiter=';')
df.head()

Unnamed: 0,pasta,tube_1,cap_1,material_1,color_1,color_2,rating
0,pasta01,1,0,1,0,1,10
1,pasta01,1,0,1,0,1,10
2,pasta01,1,0,1,0,1,5
3,pasta01,1,0,1,0,1,10
4,pasta01,1,0,1,0,1,3


In [139]:
# checking for empty data
df.isnull().sum()

pasta         0
tube_1        0
cap_1         0
material_1    0
color_1       0
color_2       0
rating        0
dtype: int64

In [140]:
#Estimate Main Effects with a linear regression
import statsmodels.api as sm

y=df.rating
x=df[[x for x in df.columns if x != 'rating' and x != 'pasta']]
x=sm.add_constant(x)

linearRegression = sm.OLS(y,x).fit()
linearRegression.summary()

0,1,2,3
Dep. Variable:,rating,R-squared:,0.179
Model:,OLS,Adj. R-squared:,0.162
Method:,Least Squares,F-statistic:,10.21
Date:,"Thu, 12 Aug 2021",Prob (F-statistic):,7.23e-09
Time:,14:13:34,Log-Likelihood:,-536.47
No. Observations:,240,AIC:,1085.0
Df Residuals:,234,BIC:,1106.0
Df Model:,5,,
Covariance Type:,nonrobust,,

0,1,2,3,4,5,6
,coef,std err,t,P>|t|,[0.025,0.975]
const,4.1000,0.391,10.479,0.000,3.329,4.871
tube_1,1.4000,0.296,4.733,0.000,0.817,1.983
cap_1,-0.1500,0.296,-0.507,0.613,-0.733,0.433
material_1,1.4500,0.296,4.902,0.000,0.867,2.033
color_1,-0.3500,0.362,-0.966,0.335,-1.064,0.364
color_2,0.4000,0.418,0.956,0.340,-0.424,1.224

0,1,2,3
Omnibus:,11.405,Durbin-Watson:,2.042
Prob(Omnibus):,0.003,Jarque-Bera (JB):,11.883
Skew:,0.518,Prob(JB):,0.00263
Kurtosis:,2.662,Cond. No.,5.8


The beta coefficients of the regression equation are called "Part Worth Utility" (PWU) of the variants of variables. Large part-worth utilities are assigned to the most preferred levels, and small part-worth utilities are assigned to the least preferred levels.

Однако учтем, что используются фиктивные переменные, коэффициенты регрессии при которых интерпретируются относительно базовой градации переменной.

Now we calculate the utility of each variant using part worth utilities. We can consider solving following sets of equations:
* размер тюбика (tube):
    * tube_1 - tube_2 = coef_tube_1
    * tube_1 + tube_2 = 0
* размер колпачка (cap):
    * cap_1 - cap_2 = coef_cap_1
    * cap_1 + cap_2 = 0
* материал, из которого изготовлен тюбик (material):
    * material_1 - material_2 = coef_material_1
    * material_1 + material_2 = 0
* рисунок на тюбике (color):
    * color_1 - color_3 = coef_color_1
    * color_2 - color_3 = coef_color_2
    * color_1 + color_2 + color_3 = 0

In [141]:
linearRegression.params

const         4.10
tube_1        1.40
cap_1        -0.15
material_1    1.45
color_1      -0.35
color_2       0.40
dtype: float64

In [142]:
# полезности размеров тюбика (tube)
A = np.array([[1, -1], [1, 1]])
B = np.array([linearRegression.params.tube_1, 0])
X_tube = np.linalg.solve(A,B)
[tube_1_ut, tube_2_ut]=X_tube
print(FNames['tube_n'] +': '+ FGrad['tube_g']['tube_1_n'] +':',tube_1_ut)
print(FNames['tube_n'] +': '+ FGrad['tube_g']['tube_2_n'] +':',tube_2_ut)

размер тюбика: большой: 0.6999999999999991
размер тюбика: маленький: -0.6999999999999991


In [170]:
# Составим словарь градаций фактора tube и их полезностей
tube_ut={'tube_1_n': tube_1_ut,'tube_2_n': tube_2_ut}
tube_ut

{'tube_1_n': 0.6999999999999991, 'tube_2_n': -0.6999999999999991}

In [144]:
# полезности размеров колпачка (cap)
A = np.array([[1, -1], [1, 1]])
B = np.array([linearRegression.params.cap_1, 0])
X_cap = np.linalg.solve(A,B)
[cap_1_ut, cap_2_ut]=X_cap
print(FNames['cap_n'] +': '+ FGrad['cap_g']['cap_1_n'] +':',cap_1_ut)
print(FNames['cap_n'] +': '+ FGrad['cap_g']['cap_2_n'] +':',cap_2_ut)

размер колпачка: большой: -0.07500000000000026
размер колпачка: маленький: 0.07500000000000026


In [172]:
# Составим словарь градаций фактора cap и их полезностей
cap_ut={'cap_1_n': cap_1_ut,'cap_2_n': cap_2_ut}
cap_ut

{'cap_1_n': -0.07500000000000026, 'cap_2_n': 0.07500000000000026}

In [145]:
# полезности материалов, из которых изготовлен тюбик (material)
A = np.array([[1, -1], [1, 1]])
B = np.array([linearRegression.params.material_1, 0])
X_material = np.linalg.solve(A,B)
[material_1_ut, material_2_ut]=X_material
print(FNames['material_n'] +': '+ FGrad['material_g']['material_1_n'] +':',material_1_ut)
print(FNames['material_n'] +': '+ FGrad['material_g']['material_2_n'] +':',material_2_ut)

материал, из которого изготовлен тюбик: алюминий: 0.7249999999999998
материал, из которого изготовлен тюбик: пластик: -0.7249999999999998


In [173]:
# Составим словарь градаций фактора material и их полезностей
material_ut={'material_1_n': material_1_ut,'material_2_n': material_2_ut}
material_ut

{'material_1_n': 0.7249999999999998, 'material_2_n': -0.7249999999999998}

In [146]:
# полезности рисунков на тюбике (color)
rand=0.00001*np.random.rand(3,3)
A = np.array([[1, -1, 0],[1, -1, 0], [1, 1, 1]]+rand)
B = np.array([linearRegression.params.color_1, linearRegression.params.color_2, 0])
X_color = np.linalg.solve(A,B)
[color_1_ut, color_2_ut, color_3_ut]=X_color
print(FNames['color_n'] +': '+ FGrad['color_g']['color_1_n'] +':',color_1_ut)
print(FNames['color_n'] +': '+ FGrad['color_g']['color_2_n'] +':',color_2_ut)
print(FNames['color_n'] +': '+ FGrad['color_g']['color_3_n'] +':',color_3_ut)

рисунок на тюбике: белый, синий и красный цвета: -275991.99137033685
рисунок на тюбике: белый и синий цвета: -275992.24269397475
рисунок на тюбике: рисунок: 551987.9274348574


In [174]:
# Составим словарь градаций фактора color и их полезностей
color_ut={'color_1_n': color_1_ut,'color_2_n': color_2_ut, 'color_3_n': color_3_ut}
color_ut

{'color_1_n': -275991.99137033685,
 'color_2_n': -275992.24269397475,
 'color_3_n': 551987.9274348574}

Также результирующая переменная может быть биномиальной (1 - выбор, 0 - нет). Тогда нужно использовать sm.families.Binomial()).fit()

Далее рассчитаем значимость факторов (Relative Importance Weights).

First we calculate the range of utility using following formula :
* Range =  Maximum (Utility of variants) -   Minimum (Utility of variants)

In [147]:
Range_tube=max(X_tube)-min(X_tube)
Range_cap=max(X_cap)-min(X_cap)
Range_material=max(X_material)-min(X_material)
Range_color=max(X_color)-min(X_color)

In [148]:
# Now relative importance or weighatge :
Imp_tube  = Range_tube /  (Range_tube + Range_cap + Range_material + Range_color)
Imp_cap  = Range_cap /  (Range_tube + Range_cap + Range_material + Range_color)
Imp_material  = Range_material /  (Range_tube + Range_cap + Range_material + Range_color)
Imp_color  = Range_color /  (Range_tube + Range_cap + Range_material + Range_color)
print(FNames['tube_n'] +': ',Imp_tube)
print(FNames['cap_n'] +': ',Imp_cap)
print(FNames['material_n'] +': ',Imp_material)
print(FNames['color_n'] +': ',Imp_color)

размер тюбика:  1.6908556242540071e-06
размер колпачка:  1.8116310259864447e-07
материал, из которого изготовлен тюбик:  1.7512433251202234e-06
рисунок на тюбике:  0.9999963767379481


In [177]:
# Оптимальный продукт (продукт с максимальной полезностью признаков)
print(FNames['tube_n'] +': '+ FGrad['tube_g'][max(tube_ut, key=tube_ut.get)] +':',max(X_tube))
print(FNames['cap_n'] +': '+ FGrad['cap_g'][max(cap_ut, key=cap_ut.get)] +':',max(X_cap))
print(FNames['material_n'] +': '+ FGrad['material_g'][max(material_ut, key=material_ut.get)] +':',max(X_material))
print(FNames['color_n'] +': '+ FGrad['color_g'][max(color_ut, key=color_ut.get)] +':',max(X_color))

размер тюбика: большой: 0.6999999999999991
размер колпачка: маленький: 0.07500000000000026
материал, из которого изготовлен тюбик: алюминий: 0.7249999999999998
рисунок на тюбике: рисунок: 551987.9274348574
