## Subset Variables (Columns)
[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/corazzon/cracking-the-pandas-cheat-sheet/blob/master/06-pandas_cheat_sheet_columns.ipynb)

* https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf

In [None]:
import pandas as pd
import seaborn as sns

In [None]:
# 1. 실습용 데이터 로드 (붓꽃 데이터)
df = sns.load_dataset("iris")
df.head()

In [None]:
# --- 기본 컬럼 선택 ---

In [None]:
# 2. 리스트로 여러 컬럼 선택
# 대괄호 안에 리스트[]를 넣어 원하는 컬럼명들을 지정합니다.
columns = ['sepal_width','sepal_length','species']
df[columns].head()

In [None]:
# 3. 단일 컬럼 선택 (Series 반환)
# 대괄호 안에 문자열 하나만 넣으면 1차원 데이터(Series)가 됩니다.
df['sepal_width']

In [None]:
# --- 정규표현식 필터 맛보기 ---

In [None]:
# 4. 이름 패턴으로 찾기
# 이름이 'length'로 끝나는($) 컬럼만 찾기
df.filter(regex='length$' )

In [None]:
# 이름이 'sepal'로 시작하는(^) 컬럼만 찾기
df.filter(regex='^sepal' )

In [None]:
# 'species' 컬럼을 제외한 모든 컬럼 선택
df.filter(regex='^(?!species$).*' )

In [None]:
# --- loc과 iloc을 이용한 선택 ---

In [None]:
# 5. loc (이름 기반 범위 선택)
# 행: 2번부터 5번까지 / 열: 'sepal_width'부터 'petal_width'까지
# 특징: 끝 범위(petal_width)를 포함합니다.
df.loc[2:5,'sepal_width':'petal_width']

In [None]:
# 6. iloc (인덱스 번호 기반 선택)
# 행: 처음부터 3번 인덱스 전까지(0,1,2) / 열: 1번, 3번 인덱스 컬럼만
# 특징: 끝 범위(3)를 포함하지 않습니다.
df.iloc[:3,[1,3]]

In [None]:
# --- 조건부 컬럼 선택 ---

In [None]:
# 7. 조건을 만족하는 행에서 특정 열만 선택
# 'sepal_length'가 5보다 큰 행들 중에서,
# 'sepal_length'와 'sepal_width' 컬럼만 뽑아봅니다.
df.loc[df['sepal_length'] > 5, ['sepal_length','sepal_width']].head()