### DataFrame 생성

다음 그림과 같은 데이터프레임을 생성하세요.

In [1]:
import pandas as pd

data = [
    ['Multiples', 'PER', 21.09, 13.55],
    ['Multiples', 'PBR', 2.06, 1.80],
    ['Dividends', 'DPS', 2944, 1444],
    ['Dividends', '배당성향', 78, 25]
]
columns = ['Category', 'Factor', 2020, 2021]
df = pd.DataFrame(data, columns=columns)
df

Unnamed: 0,Category,Factor,2020,2021
0,Multiples,PER,21.09,13.55
1,Multiples,PBR,2.06,1.8
2,Dividends,DPS,2944.0,1444.0
3,Dividends,배당성향,78.0,25.0


### DataFrame.set_index (멀티인덱스)
위 데이터프레임에서 set_index 메서드를 사용해서 'Category' 컬럼과 'Factor' 컬럼을 MultiIndex로 설정하세요.

In [2]:
df.set_index(['Category', 'Factor'])

Unnamed: 0_level_0,Unnamed: 1_level_0,2020,2021
Category,Factor,Unnamed: 2_level_1,Unnamed: 3_level_1
Multiples,PER,21.09,13.55
Multiples,PBR,2.06,1.8
Dividends,DPS,2944.0,1444.0
Dividends,배당성향,78.0,25.0


### pandas.MultiIndex.from_tuples(로우방향 저장)

MultiIndex의 from_tuples 메서드를 사용해서 tuples를 MultiIndex 객체로 생성하세요. 멀티 인덱스의 이름은 ['number', 'color']로 지정하세요.

In [4]:
import pandas as pd

tuples = [
    ('Multiples', 'PER'),
    ('Multiples', 'PBR'),
    ('Dividends', 'DPS'),
    ('Dividends', '배당성향')
]

tuples

[('Multiples', 'PER'),
 ('Multiples', 'PBR'),
 ('Dividends', 'DPS'),
 ('Dividends', '배당성향')]

In [6]:
# 위키독스에서 제시한 답

index = pd.MultiIndex.from_tuples(tuples, names=['Category', 'Factor'])

index

MultiIndex([('Multiples',  'PER'),
            ('Multiples',  'PBR'),
            ('Dividends',  'DPS'),
            ('Dividends', '배당성향')],
           names=['Category', 'Factor'])

### pandas.MultiIndex.from_arrays (컬럼방향 저장)
MultiIndex의 from_arrays 메서드를 사용해서 파이썬 이중 리스트를 MultiIndex 객체로 생성하세요. 멀티 인덱스의 이름은 ['number', 'color']로 지정하세요.

In [10]:
import pandas as pd

arrays = [
    ['Mutiples', 'Multiples', 'Dividends', 'Dividends'],
    ['PER', 'PBR', 'DPS', '배당성향']
]

arrays

[['Mutiples', 'Multiples', 'Dividends', 'Dividends'],
 ['PER', 'PBR', 'DPS', '배당성향']]

In [11]:
# 위키독스에서 제시한 답


index = pd.MultiIndex.from_arrays(arrays, names=['Category', 'Factor'])

index

MultiIndex([( 'Mutiples',  'PER'),
            ('Multiples',  'PBR'),
            ('Dividends',  'DPS'),
            ('Dividends', '배당성향')],
           names=['Category', 'Factor'])

### pandas.MultiIndex
tuples 변수가 바인딩하는 리스트로부터 먼저 MultiIndex 객체를 생성한 후 데이터프레임 객체를 생성하세요.

In [12]:
import pandas as pd

tuples = [
    ('Multiples', 'PER'),
    ('Multiples', 'PBR'),
    ('Dividends', 'DPS'),
    ('Dividends', '배당성향')
]


data = [
    [21.09, 13.55],
    [2.06, 1.80],
    [2944, 1444],
    [78, 25]
]

columns = [2020, 2021]

In [14]:
index = pd.MultiIndex.from_tuples(tuples, names=['Category', 'Factor'])
df = pd.DataFrame(data=data, index=index, columns=columns)

df

Unnamed: 0_level_0,Unnamed: 1_level_0,2020,2021
Category,Factor,Unnamed: 2_level_1,Unnamed: 3_level_1
Multiples,PER,21.09,13.55
Multiples,PBR,2.06,1.8
Dividends,DPS,2944.0,1444.0
Dividends,배당성향,78.0,25.0


### MultiIndex 인덱싱
다음 데이터프레임에서 빨간색 영역을 선택하세요.

In [15]:
import pandas as pd

tuples = [
    ('Multiples', 'PER'),
    ('Multiples', 'PBR'),
    ('Dividends', 'DPS'),
    ('Dividends', '배당성향')
]


data = [
    [21.09, 13.55],
    [2.06, 1.80],
    [2944, 1444],
    [78, 25]
]

columns = [2020, 2021]

index = pd.MultiIndex.from_tuples(tuples, names=['Category', 'Factor'])
df = pd.DataFrame(data=data, index=index, columns=columns)


In [16]:
#위키독스에서 제시한 답

df.loc['Multiples']

Unnamed: 0_level_0,2020,2021
Factor,Unnamed: 1_level_1,Unnamed: 2_level_1
PER,21.09,13.55
PBR,2.06,1.8


### pandas.MultiIndex 인덱싱
위 데이터프레임에서 loc 속성을 이용해 Multiples의 PER 로우만 선택하세요.

In [17]:
df.loc[('Multiples', 'PER')]

2020    21.09
2021    13.55
Name: (Multiples, PER), dtype: float64