# 조건을 만족하는 값 추출

데이터 프레임에서 각각의 column으로부터 조건을 만족하는 값만 추출할 수 있다.

Numpy의 마스킹(masking) 연산과 같이 조건식을 직접 쓸 수도 있고,
query() 함수를 이용할 수도 있다.

데이터 프레임 내에서 원하는 데이터를 조건에 따라 검색해 보자.

A컬럼 값이 0.5보다 작고 B컬럼 값이 0.3보다 큰 값들을 마스킹 연산을 활용하여 출력해 보자.

같은 조건의 값들을 query 함수를 활용하여 출력해보자.

In [1]:
import numpy as np
import pandas as pd

In [2]:
print("Masking & query")
df = pd.DataFrame(np.random.rand(5, 2), columns=["A", "B"])
print(df, "\n")

# 데이터 프레임에서 A 컬럼 값이 0.5보다 작고 B컬럼 값이 0.3보다 큰 값을 구할 것
# 마스킹 연산 활용
print(df[(df['A'] < 0.5 ) & (df['B'] > 0.3)], "\n")

# query 함수 활용
print(df.query("A<0.5 and B>0.3")) # "A<0.5 and B>0.3" 쿼리를 사용하세요.

Masking & query
          A         B
0  0.888096  0.275565
1  0.340638  0.337735
2  0.144111  0.164649
3  0.214791  0.408649
4  0.795787  0.195064 

          A         B
1  0.340638  0.337735
3  0.214791  0.408649 

          A         B
1  0.340638  0.337735
3  0.214791  0.408649
