## 인덱스를 공유하는 다수의 시리즈

In [1]:
import pandas as pd

In [3]:
s1 = {'서울':100,'부산':80,'대구':50,'인천':90}
s2 = {'서울':120,'부산':70,'대구':45,'인천':95}
s3 = {'서울':140,'부산':60,'대구':35,'인천':100}

In [4]:
s1 = pd.Series(s1)
s2 = pd.Series(s2)
s3 = pd.Series(s3)

## 데이터프레임: 인덱스를 공유하는 다수의 시리즈

In [5]:
pd.DataFrame([s1,s2,s3])

Unnamed: 0,서울,부산,대구,인천
0,100,80,50,90
1,120,70,45,95
2,140,60,35,100


In [6]:
pd.DataFrame([s1,s2,s3],index=[2010,2020,2030])

Unnamed: 0,서울,부산,대구,인천
2010,100,80,50,90
2020,120,70,45,95
2030,140,60,35,100


In [8]:
df=pd.DataFrame([s1,s2,s3],index=[2010,2020,2030])
df

Unnamed: 0,서울,부산,대구,인천
2010,100,80,50,90
2020,120,70,45,95
2030,140,60,35,100


## 데이터프레임 명칭: 칼럼, 인덱스

In [9]:
df.columns

Index(['서울', '부산', '대구', '인천'], dtype='object')

In [10]:
df.index

Int64Index([2010, 2020, 2030], dtype='int64')

In [11]:
df.values

array([[100,  80,  50,  90],
       [120,  70,  45,  95],
       [140,  60,  35, 100]])

## 데이터프레임 열 선택하기

In [13]:
df['서울']

2010    100
2020    120
2030    140
Name: 서울, dtype: int64

In [14]:
df[['서울','부산']]

Unnamed: 0,서울,부산
2010,100,80
2020,120,70
2030,140,60


## 데이터프레임 행 선택하기

In [18]:
df.loc[2010]

서울    100
부산     80
대구     50
인천     90
Name: 2010, dtype: int64

In [19]:
df.loc[[2010,2030]]

Unnamed: 0,서울,부산,대구,인천
2010,100,80,50,90
2030,140,60,35,100


In [20]:
df.iloc[0]

서울    100
부산     80
대구     50
인천     90
Name: 2010, dtype: int64

In [22]:
df.iloc[[0,2]]

Unnamed: 0,서울,부산,대구,인천
2010,100,80,50,90
2030,140,60,35,100


## 열과 행을 혼합한 선택

In [23]:
df['서울']

2010    100
2020    120
2030    140
Name: 서울, dtype: int64

In [24]:
df['서울'].loc[2010]

100

In [34]:
#df['서울'][2010]
df['서울'].loc[2010]

100

In [35]:
#df['부산'][[2010,2020]]
df['부산'].loc[[2010,2020]]

2010    80
2020    70
Name: 부산, dtype: int64

In [33]:
df[['부산','대구']].loc[[2010,2020]]

Unnamed: 0,부산,대구
2010,80,50
2020,70,45


## 연습문제

In [38]:
s1 = pd.Series({'국어':80,'영어':90,'수학':90})
s2 = pd.Series({'국어':90,'영어':70,'수학':60})
s3 = pd.Series({'국어':70,'영어':60,'수학':80})
s4 = pd.Series({'국어':30,'영어':40,'수학':70})
df=pd.DataFrame([s1,s2,s3,s4],index=['춘향','몽룡','향단','방자'])

![image.png](attachment:541445cc-eff9-4a52-83b7-39e360022b74.png)

## 데이터프레임의 연산

In [40]:
df['국어']-10

춘향    70
몽룡    80
향단    60
방자    20
Name: 국어, dtype: int64

In [43]:
df['국어']*2

춘향    160
몽룡    180
향단    140
방자     60
Name: 국어, dtype: int64

In [44]:
df['국어']-10

춘향    70
몽룡    80
향단    60
방자    20
Name: 국어, dtype: int64

In [45]:
df['수학']/2

춘향    45.0
몽룡    30.0
향단    40.0
방자    35.0
Name: 수학, dtype: float64

## 칼럼간연산

In [47]:
df['국어']+df['수학']

춘향    170
몽룡    150
향단    150
방자    100
dtype: int64

In [48]:
df['국어']+df['수학']

춘향    85.0
몽룡    75.0
향단    75.0
방자    50.0
dtype: float64

In [49]:
(df['국어']+df['수학']+df['영어'])/3

춘향    86.666667
몽룡    73.333333
향단    70.000000
방자    46.666667
dtype: float64

## 조건에 맞는 데이터 추려내기

In [53]:
df['국어']>50

춘향     True
몽룡     True
향단     True
방자    False
Name: 국어, dtype: bool

In [54]:
df[df['국어']>50]

Unnamed: 0,국어,영어,수학
춘향,80,90,90
몽룡,90,70,60
향단,70,60,80


In [55]:
df['영어']==70

춘향    False
몽룡     True
향단    False
방자    False
Name: 영어, dtype: bool

In [56]:
df[df['영어']==70]

Unnamed: 0,국어,영어,수학
몽룡,90,70,60


In [57]:
df[(df['국어']>50)&(df['영어']>80)]

Unnamed: 0,국어,영어,수학
춘향,80,90,90


## 연산 결과를 새로운 열에 추가하기

In [58]:
(df['국어']+df['수학']+df['영어'])/3

춘향    86.666667
몽룡    73.333333
향단    70.000000
방자    46.666667
dtype: float64

In [59]:
df['평균']=(df['국어']+df['수학']+df['영어'])/3
df

Unnamed: 0,국어,영어,수학,평균
춘향,80,90,90,86.666667
몽룡,90,70,60,73.333333
향단,70,60,80,70.0
방자,30,40,70,46.666667


## 열 지우기

In [60]:
del df['평균']
df

Unnamed: 0,국어,영어,수학
춘향,80,90,90
몽룡,90,70,60
향단,70,60,80
방자,30,40,70
