# 11. File IO

## 1. 파일 입출력(File I/O) 개요

- 외부 데이터 활용 => 파일을 통한 데이터에 접근 (표준 입출력에 의존 X)
- 파일 읽고 쓰는 과정
    1. `open()` 함수를 사용해 파일 객체 생성
    2. 파일 읽기/쓰기 작업 수행
    3. 작업 완료 후 `close()`를 호출해 파일 닫기
       (또는 `with`문을 사용해 자동으로 파일 닫기)

## 2. 파일 열기, 닫기

### 2.1 `open()`

- `open()` : 파일 이름과 접근 모드(읽기, 쓰기, 추가 등) 지정, 파일 객체(file object)를 반환

```python
# 일반적인 사용법
file = open("파일명", "모드", encoding="인코딩 형식")
```

이후 해당 `file` 객체를 이용해 파일 읽기/쓰기 작업을 수행한 뒤, `file.close()`를 호출해 파일을 닫아야 함

**예제: 파일 열기와 닫기**

```python
# "example.txt" 파일을 읽기 모드로 연 뒤 닫는 예제
file = open("example.txt", "r")
# file.close() 호출 전까지 file.read() 등을 통해 파일 내용 읽기가 가능
file.close()
```

> [주의!!!]파일을 닫지 않는다면?
>
> 메모리 누수, 데이터 손실 등이 발생 가능
>
> 연 파일은 반드시 닫을 것!!!
>
> 닫지 않고 그냥 가상환경/프로그램/실행/연결 중지 시켜도 됨



### 2.2 파일 모드(mode)

- `"r"`: 읽기 모드 (파일이 존재하지 않으면 에러 발생)
- `"w"`: 쓰기 모드 (파일이 없으면 생성, 파일이 있으면 기존 내용 삭제 후 새로 작성)
- `"a"`: 추가 모드 (파일 끝에 새로운 내용을 추가)


### 2.3 `with` 문을 이용한 자원 관리

`with`문을 사용하면 파일을 다 쓴 후 명시적으로 `close()`를 호출하지 않아도 블록을 벗어날 때 자동으로 파일을 닫아준다. 이는 자원 누수를 막고 코드 가독성을 높여준다.

**예제: with문 사용**

```python
with open("example.txt", "r") as f:
    data = f.read()
    print(data)
# with 블록이 끝나면 f는 자동으로 close() 호출됨
```

---


## 3. 파일 읽기(Read)
1. read() : 파일은 하나의 문자열로 읽음
2. readline() : 파일에서 한줄씩 읽음
3. readlines() : 파일을 줄로 구분된 리스트로 읽음

### 3.1 `read()` 함수

`read()` 함수는 **파일 전체 내용**을 **하나의 문자열**로 읽음

**예제: 전체 내용 읽기**

```python
with open("example.txt", "r") as f:
    content = f.read()
    print(content)
```


### 3.2 `readline()` 함수

`readline()` 함수는 파일에서 한 줄씩 읽어온다. 반복문과 함께 사용하면 효율적으로 줄 단위 처리를 할 수 있다.

**예제: 한 줄씩 읽기**

```python
with open("example.txt", "r") as f:
    line = f.readline()  # 첫 번째 줄 읽기
    print("첫 번째 줄:", line.strip())

    line = f.readline()  # 두 번째 줄 읽기
    print("두 번째 줄:", line.strip())
```

반복문으로 순회 가능
```python
with open("example.txt", "r") as f:
    for line in f:
        print(line.strip())  # 각 줄을 순서대로 출력
```

### 3.3 `readlines()` 함수

`readlines()` 함수는 파일의 모든 줄을 리스트로 읽어온다.

**예제: 모든 줄을 리스트로 읽기**

```python
with open("example.txt", "r") as f:
    lines = f.readlines()  # 각 줄이 리스트의 원소가 됨
    for idx, line in enumerate(lines, start=1):
        print(f"{idx}번째 줄: {line.strip()}")
```
---

## 4. 파일 쓰기(Write)

파일에 데이터를 쓰기 위해서는 open() 호출시  쓰기 모드(`"w"`) 또는 추가 모드(`"a"`)로 파일을 열어야 `write()` 사용 가능


### 4.1 `write()` 함수

**예제: 쓰기 모드로 파일 열기**

```python
with open("output.txt", "w") as f:
    f.write("첫 번째 줄\n")
    f.write("두 번째 줄\n")
```

- output.txt이 없다면 `output.txt` 파일이 생성되고 지정 내용이 기록됨
- 기존 파일이 이미 있다면 내용을 덮어씀(시작 부분 부터 쓰기 적용)
- 문자열 타입이 아닌 데이터는 str()을 통해 변환해야 한다.


### 4.2 추가 모드(`"a"`)로 쓰기

추가 모드(`"a"`)를 사용하면 **기존 내용 뒤**에 새로운 내용을 추가

```python
with open("output.txt", "a") as f:
    f.write("새로 추가된 내용\n")
```

---


### 4.3 파일 위치 제어
1. f.tell() : 현재 파일 위치를 바이트 단위로 반환함
2. f.seek(offset, whence) : 파일 위치를 변경함
    - offset: 기준점에서의 바이트 수
    - whence:
        - 0: 파일 시작점 (기본값)
        - 1: 현재 위치
        - 2: 파일의 끝
```python
f = open('workfile', 'rb+')
f.write(b'0123456789abcdef')

f.seek(5)      # 6번째 바이트로 이동
# 출력: 5

f.read(1)
# 출력: b'5'

f.seek(-3, 2)  # 끝에서 세 번째 바이트로 이동
# 출력: 13

f.read(1)
# 출력: b'd'
```
- 텍스트 파일의 경우, 시작점에서 상대적인 이동만 허용됨
- 그 외의 경우는 정의되지 않은 동작을 유발할 수 있음

## 5. 바이너리 파일 처리하기

- 텍스트가 아닌 파일 처리(이미지, 동영상, PDF 등)는 바이너리 데이터를 이용한다.
- 바이너리 데이터 처리 시 바이너리 모드(`"rb"`, `"wb"`)
- 읽고 쓰는 데이터 단위: **바이트(bytes)** 단위 (문자열 X)

**예제: 바이너리 파일 읽기/쓰기**

```python
# 이미지 복사 예제
with open("image.jpg", "rb") as f_in:
    data = f_in.read()

with open("image_copy.jpg", "wb") as f_out:
    f_out.write(data)
```

- 바이너리 모드에서는 인코딩 관련 문제가 발생하지 않음
- 그대로 파일의 바이트를 복사할 수 있음

---

## 6. CSV 파일 처리 기본

- CSV 파일 : 쉼표(또는 다른 구분자)와 줄바꿈으로 구분된 텍스트 형태의 데이터
- 기본 파일 처리 방식으로도 CSV 파일을 읽고 쓸 수 있으나, `csv` 모듈을 사용하면 더 편리함


### 6.1 기본 텍스트 방식의 CSV 읽기

```python
with open("data.csv", "r", encoding="utf-8") as f:
    for line in f:
        columns = line.strip().split(",")
        print(columns)  # 각 열 데이터가 리스트로 분리됨
```


### 6.2 `csv` 모듈 소개

```python
import csv

with open("data.csv", "r", encoding="utf-8") as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)
```

`csv.writer()` : CSV 파일에 편리하게 데이터를 기록(쓰기) 가능

```python
import csv

with open("output.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.writer(f)
    writer.writerow(["이름", "나이", "국가"])
    writer.writerow(["Alice", 30, "USA"])
    writer.writerow(["Bob", 25, "UK"])
```

- `csv.reader()` `csv.writer()` => 열(column) 단위로 데이터 처리 가능
- 구분자(delimiter), 인용문자(quotechar) 등 다양한 옵션을 지정 가능


## 7 마치며
파이썬 입출력은 기본적으로 io 모듈을 통해 이루어진다.
모든 입력과 출력은 파일 객체를 통해 이루어진다.
1. 표준 입출력인 input(), print()는 io.TextIOWrapper이 기반인 sys.stdin, sys.stdout을 이용한다.(스트림)
2. io 모듈은 파일의 열기, 읽기, 쓰기, 수정을 지원하기 위한 다양한 클래스가 존재한다.(아래는 주요 클래스임)
    - io.TextIOWrapper: 텍스트 기반 파일 입출력.
    - io.BufferedReader, io.BufferedWriter: 바이너리 파일 입출력.
    - io.StringIO, io.BytesIO : 메모리 기반 스트림
3. os 수준 파일 입출력은 os 모듈을 이용한다.
    - os.open(), os.read(), os.write(), os.close(): 저수준 파일 조작
    - os.remove(), os.rename(): 파일 시스템 연산
4. 파일 및 디렉토리(path)를 객체지향적으로 관리하기 위한 pathlib 모듈이 있음
    - Path 객체:
        - Path.open(): 파일 열기.
        - Path.read_text(), Path.write_text(): 텍스트 읽기/쓰기.
        - Path.read_bytes(), Path.write_bytes(): 바이너리 읽기/쓰기.
    - 파일/디렉터리 조작:
        - Path.exists(), Path.is_file(), Path.is_dir().

### 추가 정보
상기 내용의 자세한 사항은 다음과 같은 문서를 참고해야한다.
공식 문서는 이해가 힘들 수 있다. 보통의 경우 아래의 이유 때문이다.
- 저수준의 동작이나 일부 자료구조들이 c언어로 작성되어 api 형태로 파이썬 인터프리터와 연동되어 있다.
- 파이썬 언어 자체가 매우 고수준의 언어이다. 사용자가 이용함에 있어 큰 이해는 필요없을지 모르지만 내부 동작에 추상화된 개념들은 상당하다.
- 라이브러리 코드가 매우 복잡하다. 매우 다양한 기능들이 그들을 위한 모듈과 라이브러리를 의존하거나 구현한다.
- ...

단순 기능에 대한 궁금증은 검색과 chatgpt를 활용하는 것을 추천한다.

복잡하거나 네이티브 등의 저수준에서의 문제는 전문가용 서적, 커뮤니티을 참고하는 것을 추천한다.
또는 자세하고 체계적인 프롬프트를 적용해 chatgpt에게 질문해 보는 것도 추천한다.

1. [파이썬 표준 라이브러리](https://docs.python.org/3/library/index.html)
2. [파이썬 파일 입출력 공식 튜토리얼](https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files)
3. [파이썬 IO 모듈](https://docs.python.org/3.12/library/io.html#module-io)
4. [파이썬 CSV 모듈](https://docs.python.org/ko/3.13/library/csv.html)
5. [파이썬 json 모듈](https://docs.python.org/ko/3.13/library/json.html#module-json)
6. [파이썬 pickle 모듈](https://docs.python.org/ko/3.13/library/pickle.html#module-pickle)
7. [파이썬 pathlib](https://docs.python.org/ko/3.13/library/pathlib.html)
8. [파이썬 os](https://docs.python.org/ko/3.13/library/os.html#module-os)
9. [파이썬 os.path](https://docs.python.org/ko/3.13/library/os.path.html)
10. [파이썬 fileinput](https://docs.python.org/ko/3.13/library/fileinput.html)
11. [파이썬 shutil](https://docs.python.org/ko/3.13/library/shutil.html)
