### 1. 인덱싱 (Indexing)
- 인덱싱은 pandas에서 특정 **행(row)**이나 **열(column)**을 선택하는 기본적인 방법입니다. pandas에서 인덱싱을 수행하는 주요 방법은 loc[], iloc[], 그리고 간단한 열 이름 인덱싱이 있습니다.

### 기본 열 인덱싱

In [None]:
import pandas as pd

df = pd.DataFrame(
    {"name": ["Alice", "Bob", "Charlie"], 
     "age": [25, 30, 35], 
     "score": [85, 90, 88]}
)

# 'name' 열을 선택
print(df["name"])

0      Alice
1        Bob
2    Charlie
Name: name, dtype: object


### 행 인덱싱 (iloc, loc)
- loc[]: 레이블 기반 인덱싱, 즉 인덱스 이름(레이블)을 기준으로 행/열을 선택합니다.
- iloc[]: 위치 기반 인덱싱, 즉 행/열의 정수 위치를 기준으로 선택합니다.

In [None]:
# loc[]: 인덱스 레이블로 선택
print(df.loc[0])  # 첫 번째 행 선택 (0번 인덱스)
print(df.loc[0, "name"])  # 첫 번째 행의 'name' 열 값 선택

# iloc[]: 위치(정수 인덱스)로 선택
print(df.iloc[0])  # 첫 번째 행 선택
print(df.iloc[0, 1])  # 첫 번째 행의 두 번째 열 값 ('age') 선택

name     Alice
age         25
score       85
Name: 0, dtype: object
Alice
name     Alice
age         25
score       85
Name: 0, dtype: object
25


In [None]:
# 여러 열 선택
print(df[["name", "score"]])

      name  score
0    Alice     85
1      Bob     90
2  Charlie     88


## 슬라이싱 (Slicing)

- 슬라이싱은 연속적인 행 또는 열을 선택할 때 사용됩니다. iloc[]와 loc[] 모두 슬라이싱을 지원합니다. 이 때 iloc[]는 정수 인덱스를, loc[]는 레이블 기반으로 슬라이싱을 합니다.

> 2.1 행 슬라이싱
- **iloc[]**는 정수 인덱스 범위로 슬라이싱할 때 사용합니다.
- **loc[]**는 인덱스 레이블 범위로 슬라이싱할 때 사용합니다.

In [None]:
# iloc[]로 행 슬라이싱
print(df.iloc[1:3])  # 두 번째와 세 번째 행 선택

# loc[]로 행 슬라이싱
print(df.loc[1:2])  # 1번과 2번 레이블을 가진 행 선택

      name  age  score
1      Bob   30     90
2  Charlie   35     88
      name  age  score
1      Bob   30     90
2  Charlie   35     88


In [None]:
# iloc[]로 열 슬라이싱
print(df.iloc[:, 0:2])  # 첫 번째와 두 번째 열 선택

# loc[]로 열 슬라이싱
print(df.loc[:, ["name", "score"]])  # 'name'과 'score' 열 선택

      name  age
0    Alice   25
1      Bob   30
2  Charlie   35
      name  score
0    Alice     85
1      Bob     90
2  Charlie     88


In [None]:
# iloc[]로 행과 열 동시에 슬라이싱
print(df.iloc[0:2, 1:3])  # 첫 번째와 두 번째 행, 두 번째와 세 번째 열 선택
print()
# loc[]로 행과 열 동시에 슬라이싱
print(df.loc[0:1, ["name", "score"]])  # 첫 번째와 두 번째 행의 'name'과 'score' 열 선택

   age  score
0   25     85
1   30     90

    name  score
0  Alice     85
1    Bob     90


### 조건부 인덱싱 (Conditional Indexing)
- 조건부 인덱싱은 특정 조건을 만족하는 데이터만 선택하는 방법입니다. pandas에서 조건문을 이용하여 데이터를 필터링할 수 있습니다. 조건은 열에 대해 직접 적용할 수 있습니다.

In [None]:
# 'age'가 30 이상인 행 선택
print(df[df["age"] >= 30])

      name  age  score
1      Bob   30     90
2  Charlie   35     88


> 여러 조건을 결합하여 AND (&), OR (|), NOT (~) 연산자를 사용할 수 있습니다.

- AND: & (괄호를 사용해야 합니다)
- OR: |
- NOT: ~

In [None]:
# 'age'가 30 이상이고 'score'가 90 이상인 행 선택
print(df[(df["age"] >= 30) & (df["score"] >= 90)])
print()

# 'age'가 30 이상 또는 'score'가 85 이상인 행 선택
print(df[(df["age"] >= 30) | (df["score"] >= 85)])
print()

# 'age'가 30 미만인 행 선택
print(df[~(df["age"] >= 30)])

  name  age  score
1  Bob   30     90

      name  age  score
0    Alice   25     85
1      Bob   30     90
2  Charlie   35     88

    name  age  score
0  Alice   25     85


In [None]:
# 'age'가 30 이상인 행의 'score' 값을 100으로 수정
df.loc[df["age"] >= 30, "score"] = 100
print(df)

      name  age  score
0    Alice   25     85
1      Bob   30    100
2  Charlie   35    100


In [None]:
# query() 함수로 'age'가 30 이상이고 'score'가 90 이상인 행 선택
print(df.query("age >= 30 and score >= 90"))

      name  age  score
1      Bob   30    100
2  Charlie   35    100


## 실전 예시: 데이터 필터링과 분석
> 실제로 데이터를 처리할 때, 조건부 인덱싱을 활용하여 데이터를 필터링하고, 특정 조건에 맞는 통계량을 계산할 수 있습니다.

In [None]:
# 예시 데이터프레임
df = pd.DataFrame(
    {
        "name": ["Alice", "Bob", "Charlie", "David"],
        "age": [25, 30, 35, 40],
        "score": [85, 90, 88, 92],
    }
)

# 'score'가 85 이상인 학생들의 나이 평균
average_age = df[df["score"] >= 85]["age"].mean()
print(f"Average age of students with score >= 85: {average_age}")

# 'age'가 30 이상이고 'score'가 88 이상인 학생들의 이름과 점수
filtered_df = df[(df["age"] >= 30) & (df["score"] >= 88)][["name", "score"]]
print(filtered_df)

Average age of students with score >= 85: 32.5
      name  score
1      Bob     90
2  Charlie     88
3    David     92
