#### 데이터 프레임 연결 : pd.concat()
- concat() : 특정 axis에 따라 판다스 개체를 연결
- 연결 axis에 계층적 인덱싱 레이어를 추가할 수 있다. 
- 레이블이 전달된 axis 번호에서 동일하거나 겹치는 경우 유용
    - axis : {0: 위아래 합치기/ 1: 좌우 합치기}, default 0    
       * 0 : 행(index)간 연결
       * 1 : 열(columns)간 연결
    - keys : 멀티인덱스를 사용하려면 keys 튜플입력
    - names : index의 이름 부여하려면 names 튜플입력
    - ignore_index : bool, default False
        * False : 연결되기 전의 index 값을 그대로 사용
        * True : 새로운 index 값을 할당 (0, 1, ..., n-1)

In [418]:
import pandas as pd
import numpy as np
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'C': ['C0', 'C1', 'C2', 'C3'],
                    'D': ['D0', 'D1', 'D2', 'D3']}
                    )
df1

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3


In [419]:
import pandas as pd
import numpy as np
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
                    'B': ['B4', 'B5', 'B6', 'B7'],
                    'C': ['C4', 'C5', 'C6', 'C7'],
                    'D': ['D4', 'D5', 'D6', 'D7']}
                    )
df2

Unnamed: 0,A,B,C,D
0,A4,B4,C4,D4
1,A5,B5,C5,D5
2,A6,B6,C6,D6
3,A7,B7,C7,D7


In [420]:
result1 = pd.concat([df1,df2])
result1

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3
0,A4,B4,C4,D4
1,A5,B5,C5,D5
2,A6,B6,C6,D6
3,A7,B7,C7,D7


In [421]:
result2 = pd.concat([df1,df2], ignore_index= False)
result2

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3
0,A4,B4,C4,D4
1,A5,B5,C5,D5
2,A6,B6,C6,D6
3,A7,B7,C7,D7


In [422]:
result3 = pd.concat([df1,df2], ignore_index= True)
result3

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3
4,A4,B4,C4,D4
5,A5,B5,C5,D5
6,A6,B6,C6,D6
7,A7,B7,C7,D7


In [423]:
df3 = pd.DataFrame({'E': ['E0', 'E1', 'E2', 'E3'],
                    'F': ['F0', 'F1', 'F2', 'F3']}
                    )
df3

Unnamed: 0,E,F
0,E0,F0
1,E1,F1
2,E2,F2
3,E3,F3


In [424]:
result4 = pd.concat([df1,df3], axis= 1)
result4

Unnamed: 0,A,B,C,D,E,F
0,A0,B0,C0,D0,E0,F0
1,A1,B1,C1,D1,E1,F1
2,A2,B2,C2,D2,E2,F2
3,A3,B3,C3,D3,E3,F3


In [425]:
result5 = pd.concat([df1,df3], axis= 0)
result5

Unnamed: 0,A,B,C,D,E,F
0,A0,B0,C0,D0,,
1,A1,B1,C1,D1,,
2,A2,B2,C2,D2,,
3,A3,B3,C3,D3,,
0,,,,,E0,F0
1,,,,,E1,F1
2,,,,,E2,F2
3,,,,,E3,F3


#### concat() : join
- join : {'inner', 'outer'}, default 'outer'
    * outer : 데이터 손실이 없는 결합연결(union)
    * inner : 공통된 부분만 교차연결(intersection)

In [427]:
import pandas as pd
import numpy as np

In [428]:
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'C': ['C0', 'C1', 'C2', 'C3'],
                    'D': ['D0', 'D1', 'D2', 'D3']}
                    )
df1

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3


In [429]:
df4 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
                    'B': ['B4', 'B5', 'B6', 'B7'],
                    'C': ['C4', 'C5', 'C6', 'C7']}
                    )
df4

Unnamed: 0,A,B,C
0,A4,B4,C4
1,A5,B5,C5
2,A6,B6,C6
3,A7,B7,C7


In [430]:
result6 = pd.concat([df1,df4]) #outer join
result6

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3
0,A4,B4,C4,
1,A5,B5,C5,
2,A6,B6,C6,
3,A7,B7,C7,


In [431]:
result7 = pd.concat([df1,df4], ignore_index= True) #outer join, 인덱스 무시하고 재지정
result7

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3
4,A4,B4,C4,
5,A5,B5,C5,
6,A6,B6,C6,
7,A7,B7,C7,


In [432]:
result8 = pd.concat([df1,df4], join= 'inner', ignore_index= True) #inner join,ignore_index
result8

Unnamed: 0,A,B,C
0,A0,B0,C0
1,A1,B1,C1
2,A2,B2,C2
3,A3,B3,C3
4,A4,B4,C4
5,A5,B5,C5
6,A6,B6,C6
7,A7,B7,C7


In [433]:
result9 = pd.concat([df1,df4], join= 'inner', axis= 1, ignore_index= True)
result9

Unnamed: 0,0,1,2,3,4,5,6
0,A0,B0,C0,D0,A4,B4,C4
1,A1,B1,C1,D1,A5,B5,C5
2,A2,B2,C2,D2,A6,B6,C6
3,A3,B3,C3,D3,A7,B7,C7


#### 데이터프레임 병합 : merge()
- how : {'left', 'right', 'outer', 'inner'}, default 'inner'
    Type of merge to be performed.
    * left: 왼쪽 프레임의 키만 사용, SQL left outer join과 유사
    * right: 오른쪽 프레임의 키만 사용, SQL right outer join과 유사
    * outer: 두 프레임의 키 통합사용, SQL full outer join과 유사
    * inner: 두 프레임의 키 교차사용, SQL inner join과 유사
- on : 열 기준 병합 시 기준으로 할 열의 이름(공통열을 갖는 경우)
- left_on / right_on : 열 기준 병합 시 기준으로 할 열의 양측 이름이 다른 경우 각각 설정
- left_index / right_index : True로 하면 해당 객체의 인덱스가 병합 기준
- suffixes : 병합할 객체들간 이름이 중복되는 열이 있다면, 해당 열에 접미사를 추가

In [1]:
import pandas as pd
import numpy as np

- 단일 key를 사용하는 경우

In [2]:
left = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
                      'A': ['A0', 'A1', 'A2', 'A3'],
                      'B': ['B0', 'B1', 'B2', 'B3']})
left

Unnamed: 0,key,A,B
0,K0,A0,B0
1,K1,A1,B1
2,K2,A2,B2
3,K3,A3,B3


In [3]:
right = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
                       'C': ['C0', 'C1', 'C2', 'C3'],
                       'D': ['D0', 'D1', 'D2', 'D3']})
right

Unnamed: 0,key,C,D
0,K0,C0,D0
1,K1,C1,D1
2,K2,C2,D2
3,K3,C3,D3


In [4]:
# pandas로 merge
result = pd.merge(left, right, on='key')
result

Unnamed: 0,key,A,B,C,D
0,K0,A0,B0,C0,D0
1,K1,A1,B1,C1,D1
2,K2,A2,B2,C2,D2
3,K3,A3,B3,C3,D3


In [440]:
left.merge(right, on='key')

Unnamed: 0,key,A,B,C,D
0,K0,A0,B0,C0,D0
1,K1,A1,B1,C1,D1
2,K2,A2,B2,C2,D2
3,K3,A3,B3,C3,D3


- 다중 key를 사용하는 경우

In [442]:
left1 = pd.DataFrame({'key1': ['K0', 'K0', 'K1', 'K2'],
                     'key2': ['K0', 'K1', 'K0', 'K1'],
                      'A': ['A0', 'A1', 'A2', 'A3'],
                      'B': ['B0', 'B1', 'B2', 'B3']})
left1

Unnamed: 0,key1,key2,A,B
0,K0,K0,A0,B0
1,K0,K1,A1,B1
2,K1,K0,A2,B2
3,K2,K1,A3,B3


In [443]:
right1 = pd.DataFrame({'key1': ['K0', 'K1', 'K1', 'K2'],
                      'key2': ['K0', 'K0', 'K0', 'K0'],
                       'C': ['C0', 'C1', 'C2', 'C3'],
                       'D': ['D0', 'D1', 'D2', 'D3']})
right1

Unnamed: 0,key1,key2,C,D
0,K0,K0,C0,D0
1,K1,K0,C1,D1
2,K1,K0,C2,D2
3,K2,K0,C3,D3


In [444]:
pd.merge(left1, right1, on=['key1', 'key2'])

Unnamed: 0,key1,key2,A,B,C,D
0,K0,K0,A0,B0,C0,D0
1,K1,K0,A2,B2,C1,D1
2,K1,K0,A2,B2,C2,D2


In [445]:
left1.merge(right1, on=['key1', 'key2'])

Unnamed: 0,key1,key2,A,B,C,D
0,K0,K0,A0,B0,C0,D0
1,K1,K0,A2,B2,C1,D1
2,K1,K0,A2,B2,C2,D2


In [446]:
pd.merge(left1, right1, how='left', on=['key1', 'key2'])

Unnamed: 0,key1,key2,A,B,C,D
0,K0,K0,A0,B0,C0,D0
1,K0,K1,A1,B1,,
2,K1,K0,A2,B2,C1,D1
3,K1,K0,A2,B2,C2,D2
4,K2,K1,A3,B3,,


In [447]:
pd.merge(left1, right1, how='right', on=['key1', 'key2'])

Unnamed: 0,key1,key2,A,B,C,D
0,K0,K0,A0,B0,C0,D0
1,K1,K0,A2,B2,C1,D1
2,K1,K0,A2,B2,C2,D2
3,K2,K0,,,C3,D3


In [448]:
pd.merge(left1, right1, how='outer', on=['key1', 'key2'])

Unnamed: 0,key1,key2,A,B,C,D
0,K0,K0,A0,B0,C0,D0
1,K0,K1,A1,B1,,
2,K1,K0,A2,B2,C1,D1
3,K1,K0,A2,B2,C2,D2
4,K2,K0,,,C3,D3
5,K2,K1,A3,B3,,


In [449]:
pd.merge(left1, right1, how='inner', on=['key1', 'key2'])

Unnamed: 0,key1,key2,A,B,C,D
0,K0,K0,A0,B0,C0,D0
1,K1,K0,A2,B2,C1,D1
2,K1,K0,A2,B2,C2,D2


In [450]:
left2 = pd.DataFrame({'key1': ['K0', 'K0', 'K1', 'K2'],
                     'key2': ['K0', 'K1', 'K0', 'K1'],
                      'A': ['A0', 'A1', 'A2', 'A3'],
                      'B': ['B0', 'B1', 'B2', 'B3']})
left2

Unnamed: 0,key1,key2,A,B
0,K0,K0,A0,B0
1,K0,K1,A1,B1
2,K1,K0,A2,B2
3,K2,K1,A3,B3


In [451]:
right2 = pd.DataFrame({'key1': ['K0', 'K1', 'K1', 'K2'],
                      'key2': ['K0', 'K0', 'K0', 'K0'],
                       'A': ['C0', 'C1', 'C2', 'C3'],
                       'D': ['D0', 'D1', 'D2', 'D3']})
right2

Unnamed: 0,key1,key2,A,D
0,K0,K0,C0,D0
1,K1,K0,C1,D1
2,K1,K0,C2,D2
3,K2,K0,C3,D3


- 두 데이터프레임의 컬럼명이 같은 경우의 merge

In [453]:
left2.merge(right2, how='outer', on=['key1', 'key2'])

Unnamed: 0,key1,key2,A_x,B,A_y,D
0,K0,K0,A0,B0,C0,D0
1,K0,K1,A1,B1,,
2,K1,K0,A2,B2,C1,D1
3,K1,K0,A2,B2,C2,D2
4,K2,K0,,,C3,D3
5,K2,K1,A3,B3,,


In [454]:
left2.merge(right2, how='outer', on=['key1', 'key2'], suffixes=('_1', '_2'))

Unnamed: 0,key1,key2,A_1,B,A_2,D
0,K0,K0,A0,B0,C0,D0
1,K0,K1,A1,B1,,
2,K1,K0,A2,B2,C1,D1
3,K1,K0,A2,B2,C2,D2
4,K2,K0,,,C3,D3
5,K2,K1,A3,B3,,


### join()
- index가 다른 두 프레임의 열을 결합하는 방법
![image.png](attachment:25b601a5-5274-4a66-a604-640a01885ee9.png)
- 인덱스로 병합할 때는 데이터프레임의 join 메소드를 이용하는 것이 편리하다.
- join 메소드는 컬럼이 겹치지 않으며 완전히 같거나 유사한 인덱스 구조를 가진 여러 개의 데이터프레임 객체를 병합할 때 사용할 수 있다.
- df1.join(df2)의 형태로, 기본적인 병합 기준은 df1의 인덱스이다(left join)

In [456]:
left3 = pd.DataFrame({'A': ['A0', 'A1', 'A2'],
                     'B': ['B0', 'B1', 'B2']},
                    index=['K0', 'K1', 'K2'])
left3

Unnamed: 0,A,B
K0,A0,B0
K1,A1,B1
K2,A2,B2


In [457]:
right3 = pd.DataFrame({'C': ['C0', 'C2', 'C3'],
                      'D': ['D0', 'D2', 'D3']},
                     index=['K0', 'K2', 'K3'])
right3

Unnamed: 0,C,D
K0,C0,D0
K2,C2,D2
K3,C3,D3


In [458]:
left3.join(right3)

Unnamed: 0,A,B,C,D
K0,A0,B0,C0,D0
K1,A1,B1,,
K2,A2,B2,C2,D2


In [459]:
left3.join(right3, how='left')

Unnamed: 0,A,B,C,D
K0,A0,B0,C0,D0
K1,A1,B1,,
K2,A2,B2,C2,D2


In [460]:
left3.join(right3, how='right')

Unnamed: 0,A,B,C,D
K0,A0,B0,C0,D0
K2,A2,B2,C2,D2
K3,,,C3,D3


In [461]:
left3.join(right3, how='outer')

Unnamed: 0,A,B,C,D
K0,A0,B0,C0,D0
K1,A1,B1,,
K2,A2,B2,C2,D2
K3,,,C3,D3


In [462]:
left3.join(right3, how='inner')

Unnamed: 0,A,B,C,D
K0,A0,B0,C0,D0
K2,A2,B2,C2,D2


#### groupby() : Series of columns을 사용하여 DataFrame을 그룹화
- Splitting : 데이터를 그룹으로 나누고 
- Applying : 각 그룹별 함수를 적용하여
- Combining : 데이터 구조로 결과를 결합

In [464]:
import pandas as pd
import numpy as np

In [465]:
import pandas as pd
import numpy as np

# 데이터프레임 생성
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar',
                         'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three',
                         'two', 'two', 'one', 'three'],
                   'C': np.random.randn(8),
                   'D': np.random.randn(8)})
df

Unnamed: 0,A,B,C,D
0,foo,one,-0.081941,0.010648
1,bar,one,0.942692,-0.032616
2,foo,two,1.325791,-0.336272
3,bar,three,0.757218,0.012731
4,foo,two,1.46982,-0.804387
5,bar,two,-0.426035,-1.125028
6,foo,one,0.610455,-0.024414
7,foo,three,-0.970587,-0.848364


In [466]:
# 경고를 수정한 코드
df.groupby(by='A').std(numeric_only=True)

Unnamed: 0_level_0,C,D
A,Unnamed: 1_level_1,Unnamed: 2_level_1
bar,0.742507,0.644194
foo,1.016326,0.411799


In [467]:
df.groupby('A')[['C', 'D']].std()

Unnamed: 0_level_0,C,D
A,Unnamed: 1_level_1,Unnamed: 2_level_1
bar,0.742507,0.644194
foo,1.016326,0.411799


In [468]:
df.groupby(['A', 'B']).sum()

Unnamed: 0_level_0,Unnamed: 1_level_0,C,D
A,B,Unnamed: 2_level_1,Unnamed: 3_level_1
bar,one,0.942692,-0.032616
bar,three,0.757218,0.012731
bar,two,-0.426035,-1.125028
foo,one,0.528514,-0.013767
foo,three,-0.970587,-0.848364
foo,two,2.79561,-1.140659


In [469]:
df.groupby(['B', 'A']).sum()

Unnamed: 0_level_0,Unnamed: 1_level_0,C,D
B,A,Unnamed: 2_level_1,Unnamed: 3_level_1
one,bar,0.942692,-0.032616
one,foo,0.528514,-0.013767
three,bar,0.757218,0.012731
three,foo,-0.970587,-0.848364
two,bar,-0.426035,-1.125028
two,foo,2.79561,-1.140659


In [470]:
df.groupby(['A','B'])['C'].count()

A    B    
bar  one      1
     three    1
     two      1
foo  one      2
     three    1
     two      2
Name: C, dtype: int64

In [471]:
df.groupby(['A','B']).agg('count')
#df.groupby(['A','B']).aggregate('count')

Unnamed: 0_level_0,Unnamed: 1_level_0,C,D
A,B,Unnamed: 2_level_1,Unnamed: 3_level_1
bar,one,1,1
bar,three,1,1
bar,two,1,1
foo,one,2,2
foo,three,1,1
foo,two,2,2


In [472]:
df.groupby(['A', 'B']).agg({'C':'sum','D':'min'})

Unnamed: 0_level_0,Unnamed: 1_level_0,C,D
A,B,Unnamed: 2_level_1,Unnamed: 3_level_1
bar,one,0.942692,-0.032616
bar,three,0.757218,0.012731
bar,two,-0.426035,-1.125028
foo,one,0.528514,-0.024414
foo,three,-0.970587,-0.848364
foo,two,2.79561,-0.804387


#### 결측치(누락 데이터)
- Pandas는 np.nan 을 사용하여 누락된 데이터를 나타냄
- Pandas는 산술데이터에 한해 누락 데이터인 ‘데이터 없음(null)’에 대해 ‘NaN’으로 처리
- 파이썬의 None도 NA(Not Available)로 취급
- pandas의 NA처리 메소드 :  isnull , notnull,  dropna,  fillna

In [474]:
import pandas as pd
import numpy as np

In [475]:
# 시리즈 데이터 생성
s = pd.Series([1, np.nan, 3.5, None, 'Y'])
s

0       1
1     NaN
2     3.5
3    None
4       Y
dtype: object

#### 결측 데이터 확인
- isnull( ) :  데이터가 없으면 True, 있으면 False 반환
- notnull( ) :  데이터가 있으면 True, 없으면 False 반환

In [477]:
s.isnull()

0    False
1     True
2    False
3     True
4    False
dtype: bool

In [478]:
s.notnull()

0     True
1    False
2     True
3    False
4     True
dtype: bool

In [479]:
s.isnull().sum()

2

In [480]:
s.notnull().sum()

3

In [481]:
s.dropna()

0      1
2    3.5
4      Y
dtype: object

#### 결측 데이터 제거 : dropna()
- NaN값을 가진 모든 행/열을 제거
- 데이터프레임(DataFrame)에 대해, 행이나 열이 모두 null로 이뤄진 행이나 열을 제외시키거나, 
- 하나라도 null을 포함한 행이나 열을 제외시킴
- 기본값은 null을 하나라도 포함하고 있는 행을 제외
    - axis=0 or axis=‘rows’ or axis=‘index’(default) : null을 포함한 행 삭제
    - axis=1 or axis='columns' : null을 포함한 열 삭제
    - how : {'any', 'all'}, default 'any'
    - 'any' : 하나라도 NA 값을 가지면 해당 행 또는 열 제거 : default는 any
    - 'all' : 모든 값이 NA 이면 해당 행 또는 열 제거
    - subset 인수로 특정 컬럼을 지정, null을 포함한 행 삭제
    - inplace=True/False(default) : True는 원본에 반영, False는 원본에 미반영(default)

In [483]:
# 데이터프레임 생성
df = pd.DataFrame(np.arange(10, 22).reshape(3, 4),
                  index=["a", "b", "c"],
                  columns=["A", "B", "C", "D"])
df

Unnamed: 0,A,B,C,D
a,10,11,12,13
b,14,15,16,17
c,18,19,20,21


In [484]:
# 결측 데이터 만들기
df.iloc[0,0] = None  
df.iloc[1,3] = np.nan
df

Unnamed: 0,A,B,C,D
a,,11,12,13.0
b,14.0,15,16,
c,18.0,19,20,21.0


In [485]:
df.dropna() # 결측 데이터가 있으면 drop : 행
# df.dropna(axis=0)
# df.dropna(axis='rows')
# df.dropna(axis='index')

Unnamed: 0,A,B,C,D
c,18.0,19,20,21.0


In [486]:
df.dropna(axis=1) # 결측 데이터 열방향으로 drop
# df.dropna(axis='columns')

Unnamed: 0,B,C
a,11,12
b,15,16
c,19,20


In [487]:
# subset으로 특정 컬럼만 지정, 원본에 반영
df.dropna(subset=["D"], inplace=True)
df

Unnamed: 0,A,B,C,D
a,,11,12,13.0
c,18.0,19,20,21.0


In [488]:
# 데이터프레임 생성
df = pd.DataFrame(np.arange(10, 22).reshape(3, 4),
                  index=["a", "b", "c"],
                  columns=["A", "B", "C", "D"])
# 결측 데이터 만들기
df.iloc[0,0] = None  
df.iloc[2,0] = None  
df.loc['b', :] = np.nan
df

Unnamed: 0,A,B,C,D
a,,11.0,12.0,13.0
b,,,,
c,,19.0,20.0,21.0


In [489]:
df.dropna(axis=0, how='all')

Unnamed: 0,A,B,C,D
a,,11.0,12.0,13.0
c,,19.0,20.0,21.0


In [490]:
df.dropna(axis=1, how='all')

Unnamed: 0,B,C,D
a,11.0,12.0,13.0
b,,,
c,19.0,20.0,21.0


In [491]:
df.dropna(axis=0)
# df.dropna(axis=0, how='any')

Unnamed: 0,A,B,C,D


In [492]:
df.dropna(axis=1)
# df.dropna(axis=1, how='any')

a
b
c


#### 결측 데이터 대체 : fillna()
- fillna() : 모든 NaN값을 value값으로 채우기
- df.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None) 
    - method : {'backfill', 'bfill', 'pad', 'ffill', None}, default None
        * pad / ffill: 앞의 유효한 값으로 채우기
        * backfill / bfill: 뒤의 유효한 값으로 채우기
    - limit : int, default None
        * NaN값을 채우기할 최대 수 지정

In [494]:
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'C': ['C0', 'C1', 'C2', 'C3'],
                    'D': ['D0', 'D1', 'D2', 'D3']}
                    )
df1

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3


In [495]:
df4 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
                    'B': ['B4', 'B5', 'B6', 'B7'],
                    'C': ['C4', 'C5', 'C6', 'C7']}
                    )
df4

Unnamed: 0,A,B,C
0,A4,B4,C4
1,A5,B5,C5
2,A6,B6,C6
3,A7,B7,C7


In [496]:
result = pd.concat([df1,df4])
result

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3
0,A4,B4,C4,
1,A5,B5,C5,
2,A6,B6,C6,
3,A7,B7,C7,


In [497]:
result = result.fillna(100)
result

Unnamed: 0,A,B,C,D
0,A0,B0,C0,D0
1,A1,B1,C1,D1
2,A2,B2,C2,D2
3,A3,B3,C3,D3
0,A4,B4,C4,100
1,A5,B5,C5,100
2,A6,B6,C6,100
3,A7,B7,C7,100


In [498]:
df = pd.DataFrame([[np.nan, 2, np.nan, 0],
                   [3, 4, np.nan, 1],
                   [np.nan, np.nan, np.nan, 5],
                   [np.nan, 3, np.nan, 4]],
                   columns=list('ABCD'))
df

Unnamed: 0,A,B,C,D
0,,2.0,,0
1,3.0,4.0,,1
2,,,,5
3,,3.0,,4


In [499]:
df.isnull().sum()

A    3
B    1
C    4
D    0
dtype: int64

In [500]:
df.notnull().sum()

A    1
B    3
C    0
D    4
dtype: int64

In [501]:
df.fillna(df.mean())

Unnamed: 0,A,B,C,D
0,3.0,2.0,,0
1,3.0,4.0,,1
2,3.0,3.0,,5
3,3.0,3.0,,4


In [502]:
df.fillna(df['D'].max())

Unnamed: 0,A,B,C,D
0,5.0,2.0,5.0,0
1,3.0,4.0,5.0,1
2,5.0,5.0,5.0,5
3,5.0,3.0,5.0,4


In [503]:
df.ffill()

Unnamed: 0,A,B,C,D
0,,2.0,,0
1,3.0,4.0,,1
2,3.0,4.0,,5
3,3.0,3.0,,4


In [504]:
df.bfill()

Unnamed: 0,A,B,C,D
0,3.0,2.0,,0
1,3.0,4.0,,1
2,,3.0,,5
3,,3.0,,4


In [505]:
df.fillna({'A': 0, 'B': 1, 'C': 2, 'D': 3})

Unnamed: 0,A,B,C,D
0,0.0,2.0,2.0,0
1,3.0,4.0,2.0,1
2,0.0,1.0,2.0,5
3,0.0,3.0,2.0,4


In [506]:
df.fillna({'A': 0, 'B': 1, 'C': 2, 'D': 3}, limit=1)

Unnamed: 0,A,B,C,D
0,0.0,2.0,2.0,0
1,3.0,4.0,,1
2,,1.0,,5
3,,3.0,,4


#### 중복데이터 처리
- duplicated( ) : 중복 여부 확인
    - 중복되는 행에 대해 True 반환.  중복되지 않는 행에 대해 False 반환

In [518]:
df1 = pd.DataFrame({'k1':['one', 'two']*3 + ['two'],
                   'k2':[1,4,2,3,3,4,4]})
df1  

Unnamed: 0,k1,k2
0,one,1
1,two,4
2,one,2
3,two,3
4,one,3
5,two,4
6,two,4


In [519]:
df1.duplicated()  # 1행과 5,6행이 동일 --> 5,6행에 True --> 첫행은 False로 처리

0    False
1    False
2    False
3    False
4    False
5     True
6     True
dtype: bool

In [520]:
df1.duplicated(keep='last') # 마지막 중복 행은 False로 처리

0    False
1     True
2    False
3    False
4    False
5     True
6    False
dtype: bool

In [521]:
df1.duplicated(subset=['k1'])

0    False
1    False
2     True
3     True
4     True
5     True
6     True
dtype: bool

In [522]:
df1.duplicated(subset=['k2'])

0    False
1    False
2    False
3    False
4     True
5     True
6     True
dtype: bool

#### drop_duplicates( ) : 중복 행 제거
- duplicated( )의 False인 데이터프레임을 반환
- 특정 컬럼을 기준으로 중복을 걸러낼 수 있음
- 컬럼명을 리스트 인수로 사용
- keep=‘last’를 사용하면 마지막으로 중복되는 행을 유지함. 
- (기본(default)값은 처음 발견된 중복 행을 유지함)

In [524]:
df1.drop_duplicates()  # 중복 데이터 제거

Unnamed: 0,k1,k2
0,one,1
1,two,4
2,one,2
3,two,3
4,one,3


In [525]:
# k1 컬럼을 기준으로 중복 제거
df1.drop_duplicates(subset = ['k1']) 
# df.drop_duplicates(['k1'])

Unnamed: 0,k1,k2
0,one,1
1,two,4


In [526]:
# k2 컬럼을 기준으로 중복 제거
df1.drop_duplicates(subset = ['k2'])
# df.drop_duplicates(['k2']) 

Unnamed: 0,k1,k2
0,one,1
1,two,4
2,one,2
3,two,3


In [527]:
# k2 컬럼을 기준으로 중복 제거, 마지막 중복 행을 남기기
df1.drop_duplicates(['k2'], keep='last')

Unnamed: 0,k1,k2
0,one,1
2,one,2
4,one,3
6,two,4


#### replace( ) : 다른 값으로 치환(변경)
- 시리즈, 데이터프레임의 어떤 값을 다른 값으로 치환
- 1:1, N:1 치환
- 하나 이상의 값을 지정하기 위해서는 리스트 또는 딕셔너리를 이용

In [529]:
df2 = pd.DataFrame({'A': [0, 1, 2, 3, 4],
                   'B': [5, 6, 7, 8, 9],
                   'C': ['a', 'b', 'c', 'd', 'e']})
df2

Unnamed: 0,A,B,C
0,0,5,a
1,1,6,b
2,2,7,c
3,3,8,d
4,4,9,e


In [530]:
df2.replace(0, 5)

Unnamed: 0,A,B,C
0,5,5,a
1,1,6,b
2,2,7,c
3,3,8,d
4,4,9,e


In [531]:
df2.replace([0, 1, 2, 3], 4)

Unnamed: 0,A,B,C
0,4,5,a
1,4,6,b
2,4,7,c
3,4,8,d
4,4,9,e


In [532]:
df2.replace([0, 1, 2, 3], [4, 3, 2, 1])

Unnamed: 0,A,B,C
0,4,5,a
1,3,6,b
2,2,7,c
3,1,8,d
4,4,9,e


In [533]:
df2.replace({0: 10, 1: 100})

Unnamed: 0,A,B,C
0,10,5,a
1,100,6,b
2,2,7,c
3,3,8,d
4,4,9,e


In [534]:
df2.replace({'A': 0, 'B': 5}, 100)

Unnamed: 0,A,B,C
0,100,100,a
1,1,6,b
2,2,7,c
3,3,8,d
4,4,9,e


In [535]:
df2.replace({'A': {0: 100, 4: 400}})

Unnamed: 0,A,B,C
0,100,5,a
1,1,6,b
2,2,7,c
3,3,8,d
4,400,9,e


#### 판다스에서 문자열 다루기

In [537]:
import pandas as pd
# 문자열 데이터
wiseSay = [
    "삶이 있는 한 희망은 있다",
    "언제나 현재에 집중할 수 있다면 행복할 것이다",
    "신은 용기있는 자를 결코 버리지 않는다",
    "피할 수 없으면 즐겨라",
    "행복한 삶을 살기위해 필요한 것은 거의 없다",
    "내일은 내일의 태양이 뜬다",
    "계단을 밟아야 계단 위에 올라설 수 있다",
    "행복은 습관이다, 그것을 몸에 지니라",
    "1퍼센트의 가능성, 그것이 나의 길이다",
    "작은 기회로 부터 종종 위대한 업적이 시작된다" ]
index=['영', '일', '이', '삼', '사', '오', '육', '칠', '팔', '구']
df1 = pd.DataFrame(wiseSay, columns =['명언'], index=index)
df1

Unnamed: 0,명언
영,삶이 있는 한 희망은 있다
일,언제나 현재에 집중할 수 있다면 행복할 것이다
이,신은 용기있는 자를 결코 버리지 않는다
삼,피할 수 없으면 즐겨라
사,행복한 삶을 살기위해 필요한 것은 거의 없다
오,내일은 내일의 태양이 뜬다
육,계단을 밟아야 계단 위에 올라설 수 있다
칠,"행복은 습관이다, 그것을 몸에 지니라"
팔,"1퍼센트의 가능성, 그것이 나의 길이다"
구,작은 기회로 부터 종종 위대한 업적이 시작된다


- 문자열 나누기 : .split()

In [539]:
df1['명언']

영               삶이 있는 한 희망은 있다
일    언제나 현재에 집중할 수 있다면 행복할 것이다
이        신은 용기있는 자를 결코 버리지 않는다
삼                 피할 수 없으면 즐겨라
사     행복한 삶을 살기위해 필요한 것은 거의 없다
오               내일은 내일의 태양이 뜬다
육       계단을 밟아야 계단 위에 올라설 수 있다
칠         행복은 습관이다, 그것을 몸에 지니라
팔        1퍼센트의 가능성, 그것이 나의 길이다
구    작은 기회로 부터 종종 위대한 업적이 시작된다
Name: 명언, dtype: object

In [540]:
# 어절(단어) 나누기
df1['명언'].str.split()

영                 [삶이, 있는, 한, 희망은, 있다]
일    [언제나, 현재에, 집중할, 수, 있다면, 행복할, 것이다]
이         [신은, 용기있는, 자를, 결코, 버리지, 않는다]
삼                    [피할, 수, 없으면, 즐겨라]
사     [행복한, 삶을, 살기위해, 필요한, 것은, 거의, 없다]
오                  [내일은, 내일의, 태양이, 뜬다]
육       [계단을, 밟아야, 계단, 위에, 올라설, 수, 있다]
칠           [행복은, 습관이다,, 그것을, 몸에, 지니라]
팔          [1퍼센트의, 가능성,, 그것이, 나의, 길이다]
구    [작은, 기회로, 부터, 종종, 위대한, 업적이, 시작된다]
Name: 명언, dtype: object

In [541]:
# 어절(단어) 나누기
df1['명언'].str.split().str.len()

영    5
일    7
이    6
삼    4
사    7
오    4
육    7
칠    5
팔    5
구    7
Name: 명언, dtype: int64

In [542]:
# 어절 나누고 데이터프레임으로 변환
df1['명언'].str.split(expand = True)

Unnamed: 0,0,1,2,3,4,5,6
영,삶이,있는,한,희망은,있다,,
일,언제나,현재에,집중할,수,있다면,행복할,것이다
이,신은,용기있는,자를,결코,버리지,않는다,
삼,피할,수,없으면,즐겨라,,,
사,행복한,삶을,살기위해,필요한,것은,거의,없다
오,내일은,내일의,태양이,뜬다,,,
육,계단을,밟아야,계단,위에,올라설,수,있다
칠,행복은,"습관이다,",그것을,몸에,지니라,,
팔,1퍼센트의,"가능성,",그것이,나의,길이다,,
구,작은,기회로,부터,종종,위대한,업적이,시작된다


In [543]:
df1['명언'].str.split(expand = True)[1]

영       있는
일      현재에
이     용기있는
삼        수
사       삶을
오      내일의
육      밟아야
칠    습관이다,
팔     가능성,
구      기회로
Name: 1, dtype: object

In [544]:
df1['명언'].str.split(expand = True).loc['일']

0    언제나
1    현재에
2    집중할
3      수
4    있다면
5    행복할
6    것이다
Name: 일, dtype: object

In [545]:
df1['명언'].str.split(expand = True).loc[['일']]

Unnamed: 0,0,1,2,3,4,5,6
일,언제나,현재에,집중할,수,있다면,행복할,것이다


In [546]:
df1['명언'].loc['일']

'언제나 현재에 집중할 수 있다면 행복할 것이다'

In [547]:
# 특정 단어를 기준으로 나누기
df1['명언'].loc['일'].split('수')

['언제나 현재에 집중할 ', ' 있다면 행복할 것이다']

- 특정 문자 찾기 : contains()

In [549]:
df1['명언'].str.contains('있다')

영     True
일     True
이    False
삼    False
사    False
오    False
육     True
칠    False
팔    False
구    False
Name: 명언, dtype: bool

In [550]:
df1[df1['명언'].str.contains('있다')]

Unnamed: 0,명언
영,삶이 있는 한 희망은 있다
일,언제나 현재에 집중할 수 있다면 행복할 것이다
육,계단을 밟아야 계단 위에 올라설 수 있다


In [551]:
df1['있다'] = df1[df1['명언'].str.contains('있다')]
df1

Unnamed: 0,명언,있다
영,삶이 있는 한 희망은 있다,삶이 있는 한 희망은 있다
일,언제나 현재에 집중할 수 있다면 행복할 것이다,언제나 현재에 집중할 수 있다면 행복할 것이다
이,신은 용기있는 자를 결코 버리지 않는다,
삼,피할 수 없으면 즐겨라,
사,행복한 삶을 살기위해 필요한 것은 거의 없다,
오,내일은 내일의 태양이 뜬다,
육,계단을 밟아야 계단 위에 올라설 수 있다,계단을 밟아야 계단 위에 올라설 수 있다
칠,"행복은 습관이다, 그것을 몸에 지니라",
팔,"1퍼센트의 가능성, 그것이 나의 길이다",
구,작은 기회로 부터 종종 위대한 업적이 시작된다,


- 데이터 변경(문자열, 숫자) : .replace()

In [553]:
df1['명언'].str.replace('있다', '있을 수 있니?')

영               삶이 있는 한 희망은 있을 수 있니?
일    언제나 현재에 집중할 수 있을 수 있니?면 행복할 것이다
이              신은 용기있는 자를 결코 버리지 않는다
삼                       피할 수 없으면 즐겨라
사           행복한 삶을 살기위해 필요한 것은 거의 없다
오                     내일은 내일의 태양이 뜬다
육       계단을 밟아야 계단 위에 올라설 수 있을 수 있니?
칠               행복은 습관이다, 그것을 몸에 지니라
팔              1퍼센트의 가능성, 그것이 나의 길이다
구          작은 기회로 부터 종종 위대한 업적이 시작된다
Name: 명언, dtype: object

In [554]:
df1['변경된 명언'] = df1['명언'].str.replace('있다', '있을 수 있니?')
df1

Unnamed: 0,명언,있다,변경된 명언
영,삶이 있는 한 희망은 있다,삶이 있는 한 희망은 있다,삶이 있는 한 희망은 있을 수 있니?
일,언제나 현재에 집중할 수 있다면 행복할 것이다,언제나 현재에 집중할 수 있다면 행복할 것이다,언제나 현재에 집중할 수 있을 수 있니?면 행복할 것이다
이,신은 용기있는 자를 결코 버리지 않는다,,신은 용기있는 자를 결코 버리지 않는다
삼,피할 수 없으면 즐겨라,,피할 수 없으면 즐겨라
사,행복한 삶을 살기위해 필요한 것은 거의 없다,,행복한 삶을 살기위해 필요한 것은 거의 없다
오,내일은 내일의 태양이 뜬다,,내일은 내일의 태양이 뜬다
육,계단을 밟아야 계단 위에 올라설 수 있다,계단을 밟아야 계단 위에 올라설 수 있다,계단을 밟아야 계단 위에 올라설 수 있을 수 있니?
칠,"행복은 습관이다, 그것을 몸에 지니라",,"행복은 습관이다, 그것을 몸에 지니라"
팔,"1퍼센트의 가능성, 그것이 나의 길이다",,"1퍼센트의 가능성, 그것이 나의 길이다"
구,작은 기회로 부터 종종 위대한 업적이 시작된다,,작은 기회로 부터 종종 위대한 업적이 시작된다


#### fillna() : 결측데이터를 대체하는 함수
- df.fillna(0), df.fiina(‘missing’), df.fillna(df.mean())

In [556]:
# 결측치를 '..'로 대체
result = df1.fillna("..")
result

Unnamed: 0,명언,있다,변경된 명언
영,삶이 있는 한 희망은 있다,삶이 있는 한 희망은 있다,삶이 있는 한 희망은 있을 수 있니?
일,언제나 현재에 집중할 수 있다면 행복할 것이다,언제나 현재에 집중할 수 있다면 행복할 것이다,언제나 현재에 집중할 수 있을 수 있니?면 행복할 것이다
이,신은 용기있는 자를 결코 버리지 않는다,..,신은 용기있는 자를 결코 버리지 않는다
삼,피할 수 없으면 즐겨라,..,피할 수 없으면 즐겨라
사,행복한 삶을 살기위해 필요한 것은 거의 없다,..,행복한 삶을 살기위해 필요한 것은 거의 없다
오,내일은 내일의 태양이 뜬다,..,내일은 내일의 태양이 뜬다
육,계단을 밟아야 계단 위에 올라설 수 있다,계단을 밟아야 계단 위에 올라설 수 있다,계단을 밟아야 계단 위에 올라설 수 있을 수 있니?
칠,"행복은 습관이다, 그것을 몸에 지니라",..,"행복은 습관이다, 그것을 몸에 지니라"
팔,"1퍼센트의 가능성, 그것이 나의 길이다",..,"1퍼센트의 가능성, 그것이 나의 길이다"
구,작은 기회로 부터 종종 위대한 업적이 시작된다,..,작은 기회로 부터 종종 위대한 업적이 시작된다


#### 조건에 부합하는 데이터 추출 :  query()
- DataFrame의 열을 query
- df.query()함수 유용 -> .loc() 보다 느리다는 단점 
- Query 함수는 아래 6가지 기능 포함
    - 1) 비교 연산자( ==, >, >=, <, <=, != )
    - 2) in 연산자( in, ==, not in, != )
    - 3) 논리 연산자(and, or, not) 
    - 4) 인덱스 검색
    - 5) 문자열 부분검색( str.contains, str.startswith, str.endswith )

In [558]:
data = {"name": ["kim youngsin", "Kim sunsin", "park miso"], "age": [20, 27, 29]}
df2 = pd.DataFrame(data)
df2

Unnamed: 0,name,age
0,kim youngsin,20
1,Kim sunsin,27
2,park miso,29


In [559]:
# 인덱스
df2.query("index < 2" )

Unnamed: 0,name,age
0,kim youngsin,20
1,Kim sunsin,27


In [560]:
df2.query("name.str.contains('sin')" )

Unnamed: 0,name,age
0,kim youngsin,20
1,Kim sunsin,27


In [561]:
df2.query("name.str.contains('kim')")

Unnamed: 0,name,age
0,kim youngsin,20


In [562]:
#case=False 대소문자 구분하지 않고 검색
df2.query("name.str.contains('kim',case=False)" )

Unnamed: 0,name,age
0,kim youngsin,20
1,Kim sunsin,27


In [563]:
df2.query("name.str.startswith('kim')" ) # kim로 시작하는 문자열

Unnamed: 0,name,age
0,kim youngsin,20


In [564]:
df2.query("name.str.endswith('sin')" ) # sin으로 끝나는 문자열

Unnamed: 0,name,age
0,kim youngsin,20
1,Kim sunsin,27


### 정규표현식
https://ko.wikipedia.org/wiki/%EC%A0%95%EA%B7%9C_%ED%91%9C%ED%98%84%EC%8B%9D

In [566]:
import pandas as pd
table = pd.read_html("https://ko.wikipedia.org/wiki/%EC%A0%95%EA%B7%9C_%ED%91%9C%ED%98%84%EC%8B%9D")
len(table)

12

In [567]:
table[2]

Unnamed: 0,메타문자,기능,설명
0,?,0 또는 1회,"""a?b""는 ""b"", ""ab""를 포함한다."
1,+,1회 이상,"""a+b""는 ""ab"", ""aab"", ""aaab""를 포함하지만 ""b""는 포함하지 않는다."
2,¦,선택,"여러 식 중에서 하나를 선택한다. 예를 들어, ""abc¦adc""는 abc와 adc ..."


In [568]:
table[1]

Unnamed: 0,메타문자,기능,설명
0,.,문자,1개의 문자와 일치한다. 단일행 모드에서는 새줄 문자를 제외한다.
1,[ ],문자 클래스,"""[""과 ""]"" 사이의 문자 중 하나를 선택한다. ""¦""를 여러 개 쓴 것과 같은 ..."
2,[^ ],부정,문자 클래스 안의 문자를 제외한 나머지를 선택한다. 예를 들면 [^abc]d는 ad...
3,^,처음,문자열이나 행의 처음을 의미한다.
4,$,끝,문자열이나 행의 끝을 의미한다.
5,( ),하위식,"여러 식을 하나로 묶을 수 있다. ""abc¦adc""와 ""a(b¦d)c""는 같은 의미..."
6,\n,일치하는 n번째 패턴,"일치하는 패턴들 중 n번째를 선택하며, 여기에서 n은 1에서 9 중 하나가 올 수 있다."
7,*,0회 이상,"0개 이상의 문자를 포함한다. ""a*b""는 ""b"", ""ab"", ""aab"", ""aaa..."
8,"{m, n}",m회 이상 n회 이하,"""a{1,3}b""는 ""ab"", ""aab"", ""aaab""를 포함하지만, ""b""나 ""a..."


In [569]:
table[4][['메타문자', '설명']]

Unnamed: 0,메타문자,설명
0,.,일반적으로 새 줄을 제외한 모든 어떠한 문자열과도 일치한다.
1,( ),"일련의 패턴 요소들을 하나의 요소로 묶는다. 괄호 안의 패턴을 일치시킬 때 $1, ..."
2,+,1번 이상 발생하는 패턴과 일치시킨다.
3,?,0~1번 발생하는 패턴과 일치시킨다.
4,?,
5,*,0번 이상 발생하는 패턴과 일치시킨다.
6,"{M,N}","최소 M번, 최대 N번 발생되는 패턴과 일치시킨다."
7,[...],가능한 문자열의 집합과 일치시킨다.
8,|,가능성 있는 항목들을 구별하여 선택한다.
9,\b,


In [570]:
import pandas as pd

# 문자열 데이터
wiseSay = [
    "삶이 있는 한 희망은 있다",
    "언제나 현재에 집중할 수 있다면 행복할 것이다",
    "신은 용기있는 자를 결코 버리지 않는다",
    "피할 수 없으면 즐겨라",
    "행복한 삶을 살기위해 필요한 것은 거의 없다",
    "내일은 내일의 태양이 뜬다",
    "계단을 밟아야 계단 위에 올라설 수 있다",
    "행복은 습관이다, 그것을 몸에 지니라",
    "1퍼센트의 가능성, 그것이 나의 길이다",
    "작은 기회로 부터 종종 위대한 업적이 시작된다"
]
index = ['영', '일', '이', '삼', '사', '오', '육', '칠', '팔', '구']
df1 = pd.DataFrame(wiseSay, columns=['명언'], index=index)

# 1. '있다'라는 단어가 포함된 명언
result1 = df1[df1['명언'].str.contains(r'있다')]
print("1) 명언에 '있다'가 포함된 경우:\n", result1)

# 2. '행복'이라는 단어가 포함된 명언
result2 = df1[df1['명언'].str.contains(r'행복')]
print("\n2) 명언에 '행복'이 포함된 경우:\n", result2)

# 3. '라'로 끝나는 명언
result3 = df1[df1['명언'].str.match(r'.*라$')]
print("\n3) 명언이 '라'로 끝나는 경우:\n", result3)

# 4. 숫자가 포함된 명언
result_numbers = df1[df1['명언'].str.contains(r'\d')]
print("\n4)숫자가 포함된 명언:\n", result_numbers)

# 5. '삶'로 시작하는 명언
result5 = df1[df1['명언'].str.match(r'^삶')]
print("\n5) 명언이 '삶'로 시작하는 경우:\n", result5)

1) 명언에 '있다'가 포함된 경우:
                           명언
영             삶이 있는 한 희망은 있다
일  언제나 현재에 집중할 수 있다면 행복할 것이다
육     계단을 밟아야 계단 위에 올라설 수 있다

2) 명언에 '행복'이 포함된 경우:
                           명언
일  언제나 현재에 집중할 수 있다면 행복할 것이다
사   행복한 삶을 살기위해 필요한 것은 거의 없다
칠       행복은 습관이다, 그것을 몸에 지니라

3) 명언이 '라'로 끝나는 경우:
                      명언
삼          피할 수 없으면 즐겨라
칠  행복은 습관이다, 그것을 몸에 지니라

4)숫자가 포함된 명언:
                       명언
팔  1퍼센트의 가능성, 그것이 나의 길이다

5) 명언이 '삶'로 시작하는 경우:
                명언
영  삶이 있는 한 희망은 있다
