# 直行表を作る

In [1]:
import pandas as pd


In [2]:
#=============================================
# CSVを読み込む
#=============================================
levels_df = pd.read_csv("levels.csv")
print(levels_df)


             OS（ブランド）    バッテリー   画面サイズ   価格
0              iPhone  3000mAh    5インチ  6万円
1         Android（一般）  4500mAh    6インチ  13万
2  Galaxy M51（高バッテリー）  6500mAh  6.8インチ  24万


In [3]:
#=============================================
# 各列ごとにユニーク値（非NA）を水準として抽出
#=============================================
factor_levels = {}
for col in levels_df.columns:
    unique_levels = levels_df[col].dropna().unique().tolist()
    factor_levels[col] = unique_levels

    print(factor_levels)

{'OS（ブランド）': ['iPhone', 'Android（一般）', 'Galaxy M51（高バッテリー）']}
{'OS（ブランド）': ['iPhone', 'Android（一般）', 'Galaxy M51（高バッテリー）'], 'バッテリー': ['3000mAh', '4500mAh', '6500mAh']}
{'OS（ブランド）': ['iPhone', 'Android（一般）', 'Galaxy M51（高バッテリー）'], 'バッテリー': ['3000mAh', '4500mAh', '6500mAh'], '画面サイズ': ['5インチ', '6インチ', '6.8インチ']}
{'OS（ブランド）': ['iPhone', 'Android（一般）', 'Galaxy M51（高バッテリー）'], 'バッテリー': ['3000mAh', '4500mAh', '6500mAh'], '画面サイズ': ['5インチ', '6インチ', '6.8インチ'], '価格': ['6万円', '13万', '24万']}


In [4]:
#=============================================
# 因子ごとにユニークな水準リストを作る
#=============================================
factor_levels = {}
for col in levels_df.columns:
    factor_levels[col] = levels_df[col].dropna().unique().tolist()
    print(factor_levels[col])

['iPhone', 'Android（一般）', 'Galaxy M51（高バッテリー）']
['3000mAh', '4500mAh', '6500mAh']
['5インチ', '6インチ', '6.8インチ']
['6万円', '13万', '24万']


In [5]:
#=============================================
# L9直交表の水準番号（0始まり）
#=============================================
orthogonal_index = [
    [0, 0, 0, 0], 
    [0, 1, 1, 1], 
    [0, 2, 2, 2], 
    [1, 0, 1, 2], 
    [1, 1, 2, 0], 
    [1, 2, 0, 1], 
    [2, 0, 2, 1], 
    [2, 1, 0, 2], 
    [2, 2, 1, 0],
]

In [6]:
#=============================================
# 直交表を作る順番を決める
#=============================================
# 必ず factor_levels の全列を使う
selected_factors = list(factor_levels.keys()) 

selected_factors

['OS（ブランド）', 'バッテリー', '画面サイズ', '価格']

In [7]:
#=============================================
# 水準リストも順番を合わせる
#=============================================
selected_levels = [factor_levels[f] for f in selected_factors]

selected_levels

[['iPhone', 'Android（一般）', 'Galaxy M51（高バッテリー）'],
 ['3000mAh', '4500mAh', '6500mAh'],
 ['5インチ', '6インチ', '6.8インチ'],
 ['6万円', '13万', '24万']]

In [8]:
#=============================================
# L9のインデックスを水準値に変換しながら直交表を作成
#=============================================
data_OA = []
for row in orthogonal_index:
    entry = [selected_levels[i][row[i]] for i in range(len(selected_factors))]
    data_OA.append(entry)

# DataFrame化（列名も元の因子名のまま）
df_OA = pd.DataFrame(data_OA, columns=selected_factors)
df_OA 


Unnamed: 0,OS（ブランド）,バッテリー,画面サイズ,価格
0,iPhone,3000mAh,5インチ,6万円
1,iPhone,4500mAh,6インチ,13万
2,iPhone,6500mAh,6.8インチ,24万
3,Android（一般）,3000mAh,6インチ,24万
4,Android（一般）,4500mAh,6.8インチ,6万円
5,Android（一般）,6500mAh,5インチ,13万
6,Galaxy M51（高バッテリー）,3000mAh,6.8インチ,13万
7,Galaxy M51（高バッテリー）,4500mAh,5インチ,24万
8,Galaxy M51（高バッテリー）,6500mAh,6インチ,6万円


In [9]:
#=============================================
# コンジョイント分析用に行列入れ替えます
#=============================================
df_OA = df_OA.T
#=============================================
#保存
#=============================================
df_OA.to_csv("直交表.csv", index=True, encoding="utf-8-sig")
df_OA

Unnamed: 0,0,1,2,3,4,5,6,7,8
OS（ブランド）,iPhone,iPhone,iPhone,Android（一般）,Android（一般）,Android（一般）,Galaxy M51（高バッテリー）,Galaxy M51（高バッテリー）,Galaxy M51（高バッテリー）
バッテリー,3000mAh,4500mAh,6500mAh,3000mAh,4500mAh,6500mAh,3000mAh,4500mAh,6500mAh
画面サイズ,5インチ,6インチ,6.8インチ,6インチ,6.8インチ,5インチ,6.8インチ,5インチ,6インチ
価格,6万円,13万,24万,24万,6万円,13万,13万,24万,6万円
