# 🐼 판다스(Pandas) 입문자를 위한 기초 이론 정리
판다스는 파이썬에서 **데이터 분석과 조작**을 위해 가장 널리 사용되는 라이브러리입니다.

---
## 1. 판다스 소개
- Pandas는 **Panel Data**의 약자입니다.
- 주로 **표 형태의 데이터(테이블)**를 다루는 데에 사용됩니다.
- 핵심 객체: `Series`와 `DataFrame`


## 2. Series와 DataFrame
- **Series**: 1차원 배열, 인덱스를 가지는 리스트
- **DataFrame**: 2차원 테이블 구조

```python
import pandas as pd

# Series 예제
s = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
print(s)

# DataFrame 예제
data = {'이름': ['홍길동', '김영희'], '나이': [25, 30]}
df = pd.DataFrame(data)
print(df)
```

## 3. 데이터 읽기/쓰기
- CSV, Excel, JSON 등의 파일을 읽고 쓸 수 있음

```python
# CSV 파일 읽기
df = pd.read_csv('data.csv')

# Excel 파일 읽기
df = pd.read_excel('data.xlsx')

# CSV 파일로 저장
df.to_csv('output.csv', index=False)
```

## 4. DataFrame 기본 탐색
- `head()`, `tail()`, `info()`, `describe()` 등을 사용

```python
df.head()      # 처음 5개 행
df.tail(3)     # 마지막 3개 행
df.info()      # 데이터 요약 정보
df.describe()  # 수치형 컬럼 통계 요약
```

## 5. 인덱싱과 필터링
- `.loc[]`, `.iloc[]`, 조건 필터링 등

```python
# 행, 열 선택
df.loc[0]           # 라벨 기반 접근
df.iloc[0]          # 위치 기반 접근

# 조건 필터링
df[df['나이'] > 25]
```

## 6. 데이터 정렬 및 결측치 처리

```python
# 정렬
df.sort_values(by='나이', ascending=False)

# 결측치 처리
df.isnull()             # 결측치 확인
df.fillna(0)            # 결측치 대체
df.dropna()             # 결측치 제거
```

## 7. 데이터 그룹화
- `groupby()` 함수 사용

```python
# 그룹별 평균 계산
df.groupby('성별')['나이'].mean()
```

## 8. 열 추가 및 삭제

```python
# 열 추가
df['국적'] = ['한국', '한국']

# 열 삭제
df.drop('국적', axis=1, inplace=True)
```