## DataFrame 인덱싱

___
#### pandas 함수들
``` python
- DataFrame 인덱싱하기
변수명.loc['row', 'column'] : 특정 row와 column에 있는 데이터를 출력
변수명.loc['row', :] : 특정 row의 모든 column을 출력 (= 변수명.loc['row'])
변수명.loc[:, 'column'] : 특정 column의 모든 데이터 출력 (= 변수명.loc['row'])

- 여러 row/column을 인덱싱하고 싶은 경우
변수명.loc[['row1','row2'], 'column']
    >> 이런 식으로 여러 row/column을 대괄호로 묶어준다.


- DataFrame 슬라이싱하기
1. 행 슬라이싱
변수명.loc[row1 : row2] -> row1 부터 row2 까지의 행이 선택됨
변수명.loc[: row2] -> 첫 행 부터 row2 까지의 행이 선택됨
변수명.loc[row1 : ] -> row1부터 마지막 행이 선택됨.

2. 열 슬라이싱
변수명.loc[:, col_1:col_2] -> col_1 부터 col_2 까지의 컬럼의 모든 데이터
변수명.loc[row1:row2, col_1:col_2] -> row1~row2 까지의 행에서 col_1~col_2 까지의 컬럼을 선택.


- DataFrame에서 조건을 만족하는 데이터 인덱싱하기
변수명.loc[조건]
변수명.loc[(조건1) & (조건2)] : 조건1과 조건2를 모두 만족하는 데이터
변수명.loc[(조건1) | (조건2)] : 조건1과 조건2 중 하나라도 만족하는 데이터
    예)
    iphone_df.loc[iphone_df['Face ID'] == 'Yes']  # 조건이 1개
    iphone_df.loc[(iphone_df['디스플레이'] > 5) & (iphone_df['Face ID'] == 'Yes')]  # 조건이 여러개


- DataFrame에서 위치로 인덱싱하기
변수명.iloc[행, 열]
변수명.iloc[[행1, 열1], [행2, 열2]]  -> 여러 행과 열을 인덱싱할 수 있다.
변수명.iloc[행1, 열n:열m]  -> 슬라이싱; 행1에 대해서 열n~열(m-1)까지 출력.
```
___

In [35]:
%config Completer.use_jedi = False

In [2]:
import pandas as pd

In [6]:
iphone_df = pd.read_csv("../data/iphone.csv", index_col=0)
iphone_df

Unnamed: 0,출시일,디스플레이,메모리,출시 버전,Face ID
iPhone 7,2016-09-16,4.7,2GB,iOS 10.0,No
iPhone 7 Plus,2016-09-16,5.5,3GB,iOS 10.0,No
iPhone 8,2017-09-22,4.7,2GB,iOS 11.0,No
iPhone 8 Plus,2017-09-22,5.5,3GB,iOS 11.0,No
iPhone X,2017-11-03,5.8,3GB,iOS 11.1,Yes
iPhone XS,2018-09-21,5.8,4GB,iOS 12.0,Yes
iPhone XS Max,2018-09-21,6.5,4GB,iOS 12.0,Yes


In [10]:
# 특정 행, 열의 데이터 인덱싱하기
iphone_df.loc['iPhone 8', '메모리']   # ['row_name', 'column_name'] 

'2GB'

In [16]:
# 특정 행의 전체 열을 인덱싱하기
iphone_df.loc['iPhone X', :]   # 콜론(:)을 사용하면 모든 열을 선택한다는 뜻.
iphone_df.loc['iPhone X']   # 위와 동일한 코드

출시일        2017-11-03
디스플레이             5.8
메모리               3GB
출시 버전        iOS 11.1
Face ID           Yes
Name: iPhone X, dtype: object

In [20]:
# 자료형 확인
type(iphone_df.loc['iPhone X'])   # pandas.core.series.Series
                                  # Series는 pandas의 1차원 자료형.

pandas.core.series.Series

In [28]:
# 특정 열의 전체 행을 인덱싱하기
iphone_df.loc[:, '출시일']
iphone_df['출시일']   # 위와 동일한 코드

iPhone 7         2016-09-16
iPhone 7 Plus    2016-09-16
iPhone 8         2017-09-22
iPhone 8 Plus    2017-09-22
iPhone X         2017-11-03
iPhone XS        2018-09-21
iPhone XS Max    2018-09-21
Name: 출시일, dtype: object

In [45]:
# 자료형 확인
type(iphone_df.loc[:, '출시일'])   # pandas.core.series.Series

pandas.core.series.Series

In [50]:
# 여러 row를 한 번에 인덱싱하기
iphone_df.loc[['iPhone X', 'iPhone 8']]

Unnamed: 0,출시일,디스플레이,메모리,출시 버전,Face ID
iPhone X,2017-11-03,5.8,3GB,iOS 11.1,Yes
iPhone 8,2017-09-22,4.7,2GB,iOS 11.0,No


In [52]:
# 여러 column을 한 번에 인덱싱하기
iphone_df[['출시일', '메모리', 'Face ID']]

Unnamed: 0,출시일,메모리,Face ID
iPhone 7,2016-09-16,2GB,No
iPhone 7 Plus,2016-09-16,3GB,No
iPhone 8,2017-09-22,2GB,No
iPhone 8 Plus,2017-09-22,3GB,No
iPhone X,2017-11-03,3GB,Yes
iPhone XS,2018-09-21,4GB,Yes
iPhone XS Max,2018-09-21,4GB,Yes


## DataFrame 슬라이싱

In [55]:
iphone_df.loc['iPhone 8': 'iPhone XS']   # iPhone 8부터 iPhone XS까지 출력.

Unnamed: 0,출시일,디스플레이,메모리,출시 버전,Face ID
iPhone 8,2017-09-22,4.7,2GB,iOS 11.0,No
iPhone 8 Plus,2017-09-22,5.5,3GB,iOS 11.0,No
iPhone X,2017-11-03,5.8,3GB,iOS 11.1,Yes
iPhone XS,2018-09-21,5.8,4GB,iOS 12.0,Yes


In [57]:
iphone_df.loc[: 'iPhone XS']

Unnamed: 0,출시일,디스플레이,메모리,출시 버전,Face ID
iPhone 7,2016-09-16,4.7,2GB,iOS 10.0,No
iPhone 7 Plus,2016-09-16,5.5,3GB,iOS 10.0,No
iPhone 8,2017-09-22,4.7,2GB,iOS 11.0,No
iPhone 8 Plus,2017-09-22,5.5,3GB,iOS 11.0,No
iPhone X,2017-11-03,5.8,3GB,iOS 11.1,Yes
iPhone XS,2018-09-21,5.8,4GB,iOS 12.0,Yes


In [59]:
# 컬럼 슬라이싱
iphone_df.loc[:, '메모리':'Face ID']

Unnamed: 0,메모리,출시 버전,Face ID
iPhone 7,2GB,iOS 10.0,No
iPhone 7 Plus,3GB,iOS 10.0,No
iPhone 8,2GB,iOS 11.0,No
iPhone 8 Plus,3GB,iOS 11.0,No
iPhone X,3GB,iOS 11.1,Yes
iPhone XS,4GB,iOS 12.0,Yes
iPhone XS Max,4GB,iOS 12.0,Yes


In [61]:
iphone_df.loc['iPhone 8':'iPhone XS', '메모리':'Face ID']

Unnamed: 0,메모리,출시 버전,Face ID
iPhone 8,2GB,iOS 11.0,No
iPhone 8 Plus,3GB,iOS 11.0,No
iPhone X,3GB,iOS 11.1,Yes
iPhone XS,4GB,iOS 12.0,Yes


## DataFrame 조건으로 인덱싱

In [None]:
# 불린값을 활용해서 인덱싱하기
iphone_df.loc[[True, False, True, True, False, True, False]]  # 행 인덱싱-True인 행만 인덱싱됨.

Unnamed: 0,출시일,디스플레이,메모리,출시 버전,Face ID
iPhone 7,2016-09-16,4.7,2GB,iOS 10.0,No
iPhone 8,2017-09-22,4.7,2GB,iOS 11.0,No
iPhone 8 Plus,2017-09-22,5.5,3GB,iOS 11.0,No
iPhone XS,2018-09-21,5.8,4GB,iOS 12.0,Yes


In [None]:
iphone_df['디스플레이'] > 5   # '디스플레이' 값이 5보다 큰지 여부를 Pandas Series 자료형으로 보여줌.
iphone_df.loc[iphone_df['디스플레이'] > 5]   # 디스플레이가 5보다 큰 값만 출력

Unnamed: 0,출시일,디스플레이,메모리,출시 버전,Face ID
iPhone 7 Plus,2016-09-16,5.5,3GB,iOS 10.0,No
iPhone 8 Plus,2017-09-22,5.5,3GB,iOS 11.0,No
iPhone X,2017-11-03,5.8,3GB,iOS 11.1,Yes
iPhone XS,2018-09-21,5.8,4GB,iOS 12.0,Yes
iPhone XS Max,2018-09-21,6.5,4GB,iOS 12.0,Yes


In [76]:
iphone_df.loc[iphone_df['Face ID'] == 'Yes']

Unnamed: 0,출시일,디스플레이,메모리,출시 버전,Face ID
iPhone X,2017-11-03,5.8,3GB,iOS 11.1,Yes
iPhone XS,2018-09-21,5.8,4GB,iOS 12.0,Yes
iPhone XS Max,2018-09-21,6.5,4GB,iOS 12.0,Yes


In [78]:
# 여러 조건을 만족하는 데이터 출력하기
iphone_df.loc[(iphone_df['디스플레이'] > 5) & (iphone_df['Face ID'] == 'Yes')]

Unnamed: 0,출시일,디스플레이,메모리,출시 버전,Face ID
iPhone X,2017-11-03,5.8,3GB,iOS 11.1,Yes
iPhone XS,2018-09-21,5.8,4GB,iOS 12.0,Yes
iPhone XS Max,2018-09-21,6.5,4GB,iOS 12.0,Yes


## DataFrame 위치로 인덱싱하기

In [85]:
# 인덱싱
iphone_df.iloc[2, 4]

'No'

In [87]:
# 여러 행과 열 인덱싱
iphone_df.iloc[[1, 3], [1, 4]]

Unnamed: 0,디스플레이,Face ID
iPhone 7 Plus,5.5,No
iPhone 8 Plus,5.5,No


In [89]:
# 슬라이싱
iphone_df.iloc[3, 1:4]  # 3번 행에 대해서 1번열~3번열까지

디스플레이         5.5
메모리           3GB
출시 버전    iOS 11.0
Name: iPhone 8 Plus, dtype: object