# **[4-2] 데이터프레임(DataFrame) 이름 기반 인덱싱**

## **🎯 학습 목표**
**이름을 이용해 데이터프레임(DataFrame)에 부분적으로 접근해봅시다.**

---

데이터프레임도 시리즈와 마찬가지로 특정 부분만 가져와 사용할 경우가 있습니다.  
데이터프레임에서는 특정 열, 특정 행, 특정 행과 열을 가지는 데이터를 가져올 수 있습니다.  

데이터프레임을 인덱실 할 때에는 열과 행을 잘 구분해야 합니다.

## 열이름 정보를 이용해 데이터프레임의 열 인덱싱하기

열이름 정보를 이용해 데이터프레임의 원하는 열을 가져올 수 있습니다.

1. 하나의 열 인덱싱하기  
`DataFrame["열이름"]` : 데이터프레임에서 "열이름"에 해당하는 열을 가져옵니다.  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_03_08.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임에서 열이름정보 이용해 하나의 열에 인덱싱</th>
</tr>
</table>

2. 여러개의 열 인덱싱하기  
`DataFrame[["열이름1", "열이름2"]]` : 데이터프레임에서 "열이름1", "열이름2"에 해당하는 열을 가져옵니다.  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_03_09.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임에서 열이름정보 이용해 여러개의 열에 인덱싱</th>
</tr>
</table>

> **⛔️ 오류(ERROR):**
>
> `DataFrame["열이름1":"열이름2"]`으로 연속된 열에 접근할 수 없습니다.  
> 해당 방법을 사용하면 오류가 발생합니다.

In [None]:
# 예제_1_데이터프레임에서_하나의_열에_인덱싱

import pandas as pd

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score["국어"]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score["국어"])
print('\n','#'*30, "{:^15s}".format('score["프로그래밍"]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score["프로그래밍"])

In [None]:
# 예제_2_데이터프레임에서_여러개의_열에_인덱싱

import pandas as pd

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score[["국어","영어"]]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score[["국어","영어"]])
print('\n','#'*30, "{:^15s}".format('score[["국어","영어","프로그래밍","한국사"]]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score[["국어","영어","프로그래밍","한국사"]])

## 인덱스 정보를 이용해 데이터프레임의 행 인덱싱하기

`loc`을 사용하면 데이터프레임의 인덱스 정보를 이용해 원하는 행을 가져올 수 있습니다.

1. 하나의 행 인덱싱하기  
`DataFrame.loc['인덱스']`: 데이터프레임의 '인덱스'에 해당하는 행을 가져옵니다.  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_03_10.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임에서 인덱스 정보를 이용해 하나의 행에 인덱싱</th>
</tr>
</table>

2. 연속된 여러개의 행 인덱싱하기  
`DataFrame.loc['인덱스1':'인덱스2']`: 데이터프레임의 '인덱스1'부터 '인덱스2'까지 행을 데이터프레임의 형태로 가져옵니다.  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_03_11.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임에서 인덱스 정보를 이용해 연속된 여러개의 행에 인덱싱</th>
</tr>
</table>

3. 연속되지 않은 여러개의 행 인덱싱하기  
`DataFrame.loc[['인덱스1', '인덱스2']]`: 데이터프레임의  '인덱스1', '인덱스2'에 해당하는 행을 데이터프레임의 형태로 가져옵니다.  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_03_12.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임에서 인덱스 정보를 이용해 연속되지 않은 여러개의 행에 인덱싱</th>
</tr>
</table>

In [None]:
# 예제_3_데이터프레임에서_하나의_행에_인덱싱

import pandas as pd

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score.loc["배지우"]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc["배지우"])
print('\n','#'*30, "{:^15s}".format('score.loc["김다은"]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc["김다은"])

In [None]:
# 예제_4_데이터프레임에서_연속된_여러개의_행에_인덱싱

import pandas as pd

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score.loc["배지우":"한지훈"]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc["배지우":"한지훈"])
print('\n','#'*30, "{:^15s}".format('score.loc["김다은":"최하은"]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc["이민준":"최하은"])

In [None]:
# 예제_5_데이터프레임에서_연속되지_않은_여러개의_행에_인덱싱

import pandas as pd

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score.loc[["배지우","한지훈","김지후","이현우"]]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc[["배지우","한지훈","김지후","이현우"]])
print('\n','#'*30, "{:^15s}".format('score.loc[["이민준","최하은"]]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc[["이민준","최하은"]])

## 인덱스 정보를 이용해 데이터프레임의 열과 행 동시에 인덱싱하기

데이터프레임의 열과 행을 동시에 인덱싱하는 방법은 여러가지가 있습니다.  
이번에는 `loc`을 사용해 행과 열을 동시에 인덱싱하는 방법을 배워보겠습니다.

1. 행과 열 동시에 인덱싱 하기  
`DataFrame.loc[행 인덱싱, 열 인덱싱]` : `loc`을 사용해 행과 열을 동시에 인덱싱 할 수 있습니다.  
`행 인덱싱`, `열 인덱싱`의 순서로 지정해 주면 됩니다.  
행, 열을 인덱싱 할 때에는 위에서 배운 3가지의 인덱싱 방법을 모두 사용할 수 있습니다.  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_03_13.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임에서 인덱스 정보, 열이름 정보를 이용해 행과 열 동시에 인덱싱</th>
</tr>
</table>

2. 행, 열 전체를 선택하기  
`DataFrame.loc[행 인덱싱,:]` : 선택된 행의 모든 열을 가져옵니다.  
`DataFrame.loc[:,열 인덱싱]` : 선택된 열의 모든 행을 가져옵니다.  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_03_14.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임에서 loc을 사용할 때에 행, 열 전체 선택하기</th>
</tr>
</table>



In [None]:
# 예제_6_데이터프레임에서_loc을_사용한_다양한_인덱싱

import pandas as pd

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score.loc["배지우",["국어","영어","프로그래밍"]]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc["배지우",["국어","영어","프로그래밍"]])
print('\n','#'*30, "{:^15s}".format('score.loc[["배지우","이민준","최하은"],"프로그래밍"]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc[["배지우","이민준","최하은"],"프로그래밍"])
print('\n','#'*30, "{:^15s}".format('score.loc[["배지우","이민준","최하은"],["프로그래밍","국어","수학"]]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc[["배지우","이민준","최하은"],["프로그래밍","국어","수학"]])
print('\n','#'*30, "{:^15s}".format('score.loc[["배지우","이민준","최하은"],:]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc[["배지우","이민준","최하은"],:])
print('\n','#'*30, "{:^15s}".format('score.loc[:,["프로그래밍","국어","수학"]]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc[:,["프로그래밍","국어","수학"]])
print('\n','#'*30, "{:^15s}".format('score.loc[:,:]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.loc[:,:])

> **❓ 생각해보기(QUESTION):**
>
> 어떠한 경우에 인덱싱을 통해 특정 데이터에 접근해야 할까요?

### **💯 연습문제를 풀어봅시다**



1. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="ryIJK2tzdpY" href='#jce-judge/open/ryIJK2tzdpY' target='_self'><span>판다스 기초 5 - 데이터프레임 열 이름으로 불러오기</span></a>

2. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="hyZz6FjltlQ" href='#jce-judge/open/hyZz6FjltlQ' target='_self'><span>탑승객 수 불러오기</span></a>

3. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="P8-2zq1pydI" href='#jce-judge/open/P8-2zq1pydI' target='_self'><span>지출 확인하기 (1)</span></a>

4. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="R3AMh0eTzDA" href='#jce-judge/open/R3AMh0eTzDA' target='_self'><span>판다스 기초 - 데이터프레임 열 인덱싱 (여러개)</span></a>

5. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="qSuptxQhUQ8" href='#jce-judge/open/qSuptxQhUQ8' target='_self'><span>홀수열 불러오기</span></a>

6. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="XS2g21h31uU" href='#jce-judge/open/XS2g21h31uU' target='_self'><span>지출 확인하기 (2)</span></a>

7. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="NPfqVcJiU2s" href='#jce-judge/open/NPfqVcJiU2s' target='_self'><span>판다스 기초 - 데이터 프레임 행 이름으로 불러오기</span></a>

8. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="XhmHxvwG71Y" href='#jce-judge/open/XhmHxvwG71Y' target='_self'><span>데이터 프레임 행 이름으로 불러오기 (2)</span></a>

9. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="cesVayS2x70" href='#jce-judge/open/cesVayS2x70' target='_self'><span>둘째부터 넷째까지</span></a>

10. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="dJEltjvjDO0" href='#jce-judge/open/dJEltjvjDO0' target='_self'><span>가족 정보 인덱싱 (1)</span></a>

11. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="V51LDQ08Vqk" href='#jce-judge/open/V51LDQ08Vqk' target='_self'><span>판다스 기초 - 데이터프레임 2차원 인덱싱 (3)</span></a>

12. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="c-SZQmiXNi0" href='#jce-judge/open/c-SZQmiXNi0' target='_self'><span>가족 정보 인덱싱 (2) </span></a>

13. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="Sd1hbOkQ9BA" href='#jce-judge/open/Sd1hbOkQ9BA' target='_self'><span>데이터 통계 정보 인덱싱</span></a>
