# **[6-1] 불 인덱싱(Boolean Indexing)을 이용해 필터링하기**

## **🎯 학습 목표**
**불 인덱싱(Boolean Indexing)을 이용해 데이터를 필터링 해봅시다.**

---

데이터프레임에서 특정 행과 특정 열에 접근하는 인덱싱에 대해서 배웠습니다.  
이번에는 조건을 만족하는 행과 열을 찾아 접근하는 방법인 불 인덱싱(bool indexing)에 대해서 배워보겠습니다.

## 시리즈에 불 인덱싱을 사용해 특정 조건을 만족하는 행에 접근하기

시리즈에 불 인덱싱을 사용하기 위해서는 각 행의 포함여부를 True와 False로 저장하고 있는 시리즈 혹은 리스트를 가지고 있어야 합니다.  
각 행의 포함여부정보를 가지고 있는 시리즈 혹은 리스트를 `[]`에 넣어주면 해당 포함여부정보가 True인 데이터만으로 이루어진 시리즈를 반환합니다.  
`Series[포함여부정보_시리즈_또는_리스트]`

> **⛔️ 오류(ERROR):**
>
> 주어진 시리즈와 각 행의 포함여부 정보를 가지고 있는 시리즈, 리스트의 크기가 다르면 오류가 발생합니다.

다음과 같이 이전에 배운 비교연산, 논리연산을 불 인덱싱에 응용할 수 있습니다.

1. 포함여부정보를 이용해 필터링 하기  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_06_01.gif" width="750"></th>
</tr>
<tr>
    <th>포함여부 정보를 이용한 시리즈의 불 인덱싱</th>
</tr>
</table>

2. 비교연산을 사용해 필터링 하기  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_06_02.gif" width="750"></th>
</tr>
<tr>
    <th>비교연산을 이용한 시리즈의 불 인덱싱</th>
</tr>
</table>

3. 논리연산을 사용해 필터링 하기  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_06_03.gif" width="750"></th>
</tr>
<tr>
    <th>논리연산을 이용한 시리즈의 불 인덱싱</th>
</tr>
</table>

In [None]:
# 예제_1_포함여부_정보를_이용한_시리즈의_필터링

import pandas as pd

df = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')

score = pd.Series(df['프로그래밍'])
score.index = df['이름']

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score.isin([10,20,30,40,50,60,70,80,90,100])') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score.isin([10,20,30,40,50,60,70,80,90,100]))
print('\n','#'*30, "{:^15s}".format('score[score.isin([10,20,30,40,50,60,70,80,90,100])]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score[score.isin([10,20,30,40,50,60,70,80,90,100])])

In [None]:
# 예제_2_비교함수를_이용한_시리즈의_필터링

import pandas as pd

df = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')

score = pd.Series(df['프로그래밍'])
score.index = df['이름']

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score > 60') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score > 60)
print('\n','#'*30, "{:^15s}".format('score[score > 60]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score[score > 60])

In [None]:
# 예제_3_논리함수를_이용한_시리즈의_필터링

import pandas as pd

df = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')

score = pd.Series(df['프로그래밍'])
score.index = df['이름']

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('(score > 60) & (score < 90)') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print((score > 60) & (score < 90))
print('\n','#'*30, "{:^15s}".format('score[(score > 60) & (score < 90)]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score[(score > 60) & (score < 90)])

## 데이터프레임에 불 인덱싱을 사용해 특정 조건을 만족하는 행에 접근하기

데이터프레임에 불 인덱싱을 사용하기 위해서는 각 행의 포함여부를 True와 False로 저장하고 있는 시리즈 혹은 리스트를 가지고 있어야 합니다.  
각 행의 포함여부정보를 가지고 있는 시리즈 혹은 리스트를 `.loc[]`에 넣어주면 해당 포함여부정보가 True인 행들로만 이루어진 데이터프레임를 반환합니다.

`DataFrame.loc[포함여부정보_시리즈_또는_리스트]`

> **⛔️ 오류(ERROR):**
>
> 주어진 데이터프레임과 포함여부정보를 가지고 있는 데이터프레임의 크기가 다르면 오류가 발생합니다.  

다음과 같이 이전에 배운 비교연산, 논리연산을 불 인덱싱에 응용할 수 있습니다.

1. 포함여부정보를 이용해 필터링 하기  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_06_04.gif" width="750"></th>
</tr>
<tr>
    <th>포함여부 정보를 이용한 데이터프레임의 불 인덱싱</th>
</tr>
</table>

2. 비교연산을 사용해 필터링 하기  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_06_05.gif" width="750"></th>
</tr>
<tr>
    <th>비교연산을 이용한 데이터프레임의 불 인덱싱</th>
</tr>
</table>

3. 논리연산을 사용해 필터링 하기  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_06_06.gif" width="750"></th>
</tr>
<tr>
    <th>논리연산을 이용한 데이터프레임의 불 인덱싱</th>
</tr>
</table>

In [None]:
# 예제_4_포함여부_정보를_이용한_데이터프레임의_필터링

import pandas as pd

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score["국어"].isin([50,51,52,53,54,55,56,57,58,59])') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score["국어"].isin([50,51,52,53,54,55,56,57,58,59]))
print('\n','#'*30, "{:^15s}".format('score[score["국어"].isin([50,51,52,53,54,55,56,57,58,59])]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score[score["국어"].isin([50,51,52,53,54,55,56,57,58,59])])

In [None]:
# 예제_5_비교연산을_이용한_데이터프레임의_필터링

import pandas as pd

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score["국어"] > 50') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score["국어"] > 50)
print('\n','#'*30, "{:^15s}".format('score[score["국어"] > 50]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score[score["국어"] > 50])

In [None]:
# 예제_6_논리연산을_이용한_데이터프레임의_필터링

import pandas as pd

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('\n','#'*30, "{:^15s}".format('score["국어"] > 50') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print((score["국어"] > 50) & (score["프로그래밍"] > 70))
print('\n','#'*30, "{:^15s}".format('score[(score["국어"] > 50) & (score["프로그래밍"] > 70)]') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score[(score["국어"] > 50) & (score["프로그래밍"] > 70)])

### **💯 연습문제를 풀어봅시다**



1. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="nuRAz-IVE_s" href='#jce-judge/open/nuRAz-IVE_s' target='_self'><span>판다스 - 데이터 나누기 - 행 기준 (비교 연산 1)</span></a>

2. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="BlvfsJPAf0c" href='#jce-judge/open/BlvfsJPAf0c' target='_self'><span>판다스 - 데이터 나누기 - boolean indexing</span></a>

3. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="bwvFokLhC_Y" href='#jce-judge/open/bwvFokLhC_Y' target='_self'><span>판다스 - 데이터 나누기 - boolean indexing(2)</span></a>

4. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="ChuKgwqgGus" href='#jce-judge/open/ChuKgwqgGus' target='_self'><span>판다스 - 데이터 나누기 - 행 기준 (비교 연산 2)</span></a>

5. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="tYDpenjOzyA" href='#jce-judge/open/tYDpenjOzyA' target='_self'><span>득표수 100이상</span></a>

6. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="KltxWJ2iYbs" href='#jce-judge/open/KltxWJ2iYbs' target='_self'><span>키 170초과</span></a>

7. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="Dk1xdaA_OTE" href='#jce-judge/open/Dk1xdaA_OTE' target='_self'><span>판다스 - 데이터 나누기 - 행 기준(비교 연산 3)</span></a>

8. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="j6F4bQcy91w" href='#jce-judge/open/j6F4bQcy91w' target='_self'><span>판다스 - 데이터 나누기 - 행 기준 (포함 관계)</span></a>

9. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="0jksIko2Wvg" href='#jce-judge/open/0jksIko2Wvg' target='_self'><span>판다스 - 데이터나누기 - 행 기준(포함관계 2)</span></a>

10. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="f_rtq-NVNxs" href='#jce-judge/open/f_rtq-NVNxs' target='_self'><span>4반 빼고</span></a>

11. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="Zj3rqV004aU" href='#jce-judge/open/Zj3rqV004aU' target='_self'><span>판다스 - 데이터 나누기 - 행 기준 (조건 조합)</span></a>

12. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="7SBVgSyGvaE" href='#jce-judge/open/7SBVgSyGvaE' target='_self'><span>4반이 아니고 170이상</span></a>

13. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="36T7V0SjZtM" href='#jce-judge/open/36T7V0SjZtM' target='_self'><span>판다스 - 데이터 나누기 - 행 기준(조건 조합 2)</span></a>
