# 📄 Python 파일 입출력 (File I/O)

## 🔧 기본 개념

* **파이썬의 입출력 기본은 파일 입출력**이다.
* **C언어부터 시작된 전통**: 모든 장치의 입출력을 파일 I/O 방식으로 처리
* **파일과 연결**하는 작업이 필요 → `open()` 함수 사용

---

## 🗂️ `open()` 함수

```python
file = open("파일명", "모드")
```

### 📌 주요 매개변수

* **첫 번째 인자**: 파일명 (`경로/파일이름.txt`)

  * 경로를 생략하면 현재 작업 디렉토리에 생성
* **두 번째 인자**: 모드

  * `'w'`: 쓰기 (write) 모드

    * 파일이 없으면 생성
    * 파일이 있으면 기존 내용을 **모두 삭제**
  * `'r'`: 읽기 (read) 모드
  * `'a'`: 추가 (append) 모드

---

## 🧪 예제 1: 기본 쓰기

```python
file = open("데이터파일.txt", "w")
file.write("Hello")  # 문자열 작성
file.close()
```

---

## 📂 파일 경로 주의사항

| OS      | 경로 표기       | 예시                                              |
| ------- | ----------- | ----------------------------------------------- |
| Windows | `\` 또는 `\\` | `"C:\\test\\data.txt"` 또는 `r"C:\test\data.txt"` |
| Linux   | `/`         | `"/home/user/data.txt"`                         |

* `r"문자열"` 형태로 쓰면 \*\*이스케이프 문자()\*\*를 무시
* 경로는 **절대 경로**와 **상대 경로**로 구분

### 📍 경로의 종류

| 구분        | 예시                    | 설명          |
| --------- | --------------------- | ----------- |
| 상대 경로     | `"test.txt"`          | 현재 작업 폴더 기준 |
| 상대 경로(상위) | `"../test.txt"`       | 상위 폴더 기준    |
| 절대 경로     | `"C:\\test\\a.txt"`   | 루트부터 전체 경로  |
| 주의        | 절대경로는 폴더 구조가 바뀌면 동작 X |             |

---

## 🧪 예제 2: `print()`로 파일 쓰기

```python
f = open("데이터파일2.txt", "w")
for i in range(1, 11):
    print(f"i={i}", file=f)  # print 출력 대상을 파일로
f.close()
print("작업완료")
```

---

## 🧪 예제 3: `write()`로 문자열 직접 쓰기

```python
f = open("데이터파일3.txt", "w")
for i in range(1, 11):
    s = "i= %d\n" % i
    f.write(s)
f.close()
print("작업완료")
```

---

## 🧪 예제 4: `writelines()` 사용 (주의)

```python
f = open("/doit/데이터파일4.txt", "w")
for i in range(1, 11):
    s = "i= %d" % i  # 개행 문자 \n 없으면 줄바꿈 X
    f.writelines(s)  # writelines는 리스트 또는 반복 가능한 객체도 받음
f.close()
print("작업완료")
```

> ⚠ `writelines()`는 **자동 개행이 되지 않음**
> → `\n` 명시적으로 넣어줘야 줄바꿈됨

---

## 💡 Windows vs Linux 파일 시스템 차이

| 항목     | Windows           | Linux          |
| ------ | ----------------- | -------------- |
| 경로 구분자 | `\` (역슬래시)        | `/` (슬래시)      |
| 공백 허용  | 허용                | 비추천            |
| 대소문자   | 구분 안 함            | 구분함            |
| 드라이브명  | `C:\`, `D:\` 등 존재 | 없음 (루트 `/` 하나) |

---

## 🧾 명령어 팁 (Windows CMD 기준)

| 명령어         | 설명                  |
| ----------- | ------------------- |
| `dir *.txt` | `.txt` 확장자 파일 목록 조회 |
| `type 파일명`  | 파일 내용 출력            |

---

## ✅ 정리

* `open()`으로 파일 객체 생성 후, `write()`, `print(file=...)` 등으로 출력
* 작업 완료 후에는 반드시 `close()`로 파일 닫기
* 경로 처리에 주의 (특히 Windows vs Linux)
* 자동 개행은 `print()`는 O, `write()`는 X


# 파일 쓰기

In [None]:
# 파일 쓰기 예제 1: write() 사용
with open("../data/datafile1.txt", "w") as file:  # with문 사용으로 자동 close
    file.write("Hello")  # 문자열을 파일에 기록
print("작업완료")


작업완료


In [None]:
# 파일 쓰기 예제 2: print()의 file 파라미터 사용
with open("../data/datafile2.txt", "w") as f:
    for i in range(1, 11):
        print(f"i={i}", file=f)  # print의 출력을 파일로 보냄
print("작업완료")

작업완료


In [None]:
# 파일 쓰기 예제 3: write()로 직접 문자열 작성
with open("../data/datafile3.txt", "w") as f:
    for i in range(1, 11):
        s = "i= %d\n" % i  # 개행 문자 포함
        f.write(s)
print("작업완료")

작업완료


In [None]:
# 파일 쓰기 예제 4: writelines() 사용 (개행 문자 주의)
with open("../data/datafile4.txt", "w") as f:
    for i in range(1, 11):
        s = "i= %d" % i  # 개행 문자 없음 → 줄바꿈 안 됨
        f.writelines(s)
print("작업완료")

작업완료


# 파일 읽기

In [None]:
# 파일을 읽기로 열때는 파일이 존재해야 한다 
f = open("../data/datafile1.txt", "r")
data = f.read() # 파일 전체를 읽는다
print(data)
f.close() 

Hello


In [None]:
f = open("../data/datafile3.txt", "r")
data = f.read() # 파일을 통으로 읽는다, str 타입으로 
print( type(data))
f.close()  # 파일을 연다. 파일포인터 - 파일 읽을 위치값이 맨 뒤에 가 있다 

<class 'str'>


In [None]:
f = open("../data/datafile3.txt", "r")
data = f.readlines() # 반환값이 list타입이다 
print(type(data) )
print(data)
f.close() 

<class 'list'>
['i= 1\n', 'i= 2\n', 'i= 3\n', 'i= 4\n', 'i= 5\n', 'i= 6\n', 'i= 7\n', 'i= 8\n', 'i= 9\n', 'i= 10\n']


In [None]:
f = open("../data/datafile3.txt", "r")
line = f.readline() # 반환값이 list타입이다 
while line !="":
    print(type(line) )
    print(line)
    line = f.readline()
f.close() 

<class 'str'>
i= 1

<class 'str'>
i= 2

<class 'str'>
i= 3

<class 'str'>
i= 4

<class 'str'>
i= 5

<class 'str'>
i= 6

<class 'str'>
i= 7

<class 'str'>
i= 8

<class 'str'>
i= 9

<class 'str'>
i= 10



# with 구문

In [None]:
# mpg.csv 파일을 읽어서 처음 3줄만 출력하는 코드입니다.

# with문을 사용하면 파일을 자동으로 닫아줍니다.
with open("../data/mpg.csv", "r") as f:
    lines = f.readlines()  # 파일의 모든 줄을 리스트로 읽어옴
    print(lines[:3])       # 처음 3줄만 출력


['mpg,cylinders,displacement,horsepower,weight,acceleration,model_year,origin,name\n', '18.0,8,307.0,130.0,3504,12.0,70,usa,chevrolet chevelle malibu\n', '15.0,8,350.0,165.0,3693,11.5,70,usa,buick skylark 320\n']


# mpg.csv 읽기

In [None]:
# mpg.csv 파일에서 각 실린더(cylinders)별 개수를 세는 코드입니다.
with open("../data/mpg.csv", "r") as f:
    lines = f.readlines()

# 첫 줄(헤더)을 제외한 데이터만 사용합니다.
data_lines = lines[1:]  # 헤더를 제외한 데이터 부분

cylinder_count = {}  # 실린더별 개수를 저장할 딕셔너리

for line in data_lines:
    line = line.rstrip('\n')  # 줄 끝의 개행 문자 제거
    values = line.split(",")  # 콤마로 분리하여 리스트로 변환
    cyl = values[1]           # 두 번째 값이 실린더 수
    if cyl in cylinder_count:
        cylinder_count[cyl] += 1
    else:
        cylinder_count[cyl] = 1

print(cylinder_count)

{'8': 103, '4': 204, '6': 84, '3': 4, '5': 3}


# iris.csv 읽기

In [None]:
# iris.csv 파일을 읽어서 4개 컬럼의 평균을 구하는 코드입니다.
# 한글처리: cp949(윈도우) 또는 utf-8(표준, vscode는 utf-8)
irisList = []  # 각 행의 4개 수치 데이터가 들어갈 리스트

with open("../data/iris.csv", "r", encoding="utf-8") as f:
    lines = f.readlines()

# 첫 줄은 헤더이므로 1번 인덱스부터 반복
for i in range(1, len(lines)):
    line = lines[i].rstrip('\n')  # 개행 문자 제거
    print(i, line)
    values = line.split(",")
    # 앞의 4개 컬럼만 float 변환하여 리스트로 저장
    data = [float(values[0]), float(values[1]), float(values[2]), float(values[3])]
    irisList.append(data)

# 각 행 출력
for iris in irisList:
    print(iris)
# print(irisList)  # 전체 리스트 출력(주석 처리)

# 4개 컬럼별 합계 구하기
result = [0, 0, 0, 0]
for j in range(4):
    for i in range(len(irisList)):
        result[j] += irisList[i][j]

# 전체 평균 출력 (총 150개 데이터)
print(result[0]/150, result[1]/150, result[2]/150, result[3]/150)

# 소수점 2자리로 평균 출력 (탭 구분)
count = len(irisList)
for i in range(4):
    print(f"{result[i]/count:.2f}", end="\t")
print()

# mpg.csv파일 가져와서 실린더개수 8 6 4 종류별 카운트 하기

1 5.1,3.5,1.4,0.2,0
2 4.9,3.0,1.4,0.2,0
3 4.7,3.2,1.3,0.2,0
4 4.6,3.1,1.5,0.2,0
5 5.0,3.6,1.4,0.2,0
6 5.4,3.9,1.7,0.4,0
7 4.6,3.4,1.4,0.3,0
8 5.0,3.4,1.5,0.2,0
9 4.4,2.9,1.4,0.2,0
10 4.9,3.1,1.5,0.1,0
11 5.4,3.7,1.5,0.2,0
12 4.8,3.4,1.6,0.2,0
13 4.8,3.0,1.4,0.1,0
14 4.3,3.0,1.1,0.1,0
15 5.8,4.0,1.2,0.2,0
16 5.7,4.4,1.5,0.4,0
17 5.4,3.9,1.3,0.4,0
18 5.1,3.5,1.4,0.3,0
19 5.7,3.8,1.7,0.3,0
20 5.1,3.8,1.5,0.3,0
21 5.4,3.4,1.7,0.2,0
22 5.1,3.7,1.5,0.4,0
23 4.6,3.6,1.0,0.2,0
24 5.1,3.3,1.7,0.5,0
25 4.8,3.4,1.9,0.2,0
26 5.0,3.0,1.6,0.2,0
27 5.0,3.4,1.6,0.4,0
28 5.2,3.5,1.5,0.2,0
29 5.2,3.4,1.4,0.2,0
30 4.7,3.2,1.6,0.2,0
31 4.8,3.1,1.6,0.2,0
32 5.4,3.4,1.5,0.4,0
33 5.2,4.1,1.5,0.1,0
34 5.5,4.2,1.4,0.2,0
35 4.9,3.1,1.5,0.2,0
36 5.0,3.2,1.2,0.2,0
37 5.5,3.5,1.3,0.2,0
38 4.9,3.6,1.4,0.1,0
39 4.4,3.0,1.3,0.2,0
40 5.1,3.4,1.5,0.2,0
41 5.0,3.5,1.3,0.3,0
42 4.5,2.3,1.3,0.3,0
43 4.4,3.2,1.3,0.2,0
44 5.0,3.5,1.6,0.6,0
45 5.1,3.8,1.9,0.4,0
46 4.8,3.0,1.4,0.3,0
47 5.1,3.8,1.6,0.2,0
48 4.6,3.2,1.4,0.2,0
4

# 정수 파일 읽기

In [None]:
# 정수 파일을 읽어서 합계와 평균을 구하는 코드입니다.
with open("../data/integer.txt", "r") as f:
    lines = f.readlines()  # 파일의 모든 줄을 리스트로 읽음

total = 0  # 합계 저장 변수
for line in lines:
    line = line.strip()  # 개행 문자 등 양쪽 공백 제거
    print(line)          # 각 줄(정수) 출력
    total += int(line)   # 정수로 변환하여 합계에 더함

# 평균 계산 및 출력
print("평균", total / len(lines))

10
20
40
50
4
5
11
12
14
27
평균 19.3


# 성적 파일 읽기

In [1]:
# score.txt 파일을 읽어서 각 학생의 이름, 점수, 총점, 평균을 출력하는 코드입니다.
# 한글 인코딩: cp949(윈도우) 또는 utf-8(표준, vscode는 utf-8)
with open("../data/score.txt", "r", encoding="utf-8") as f:
    lines = f.readlines()  # 파일의 모든 줄을 리스트로 읽음

for line in lines:
    line = line.strip()  # 양쪽 공백 및 개행 문자 제거
    words = line.split(",")  # 콤마로 분리하여 리스트로 변환
    name = words[0]
    kor = int(words[1])
    eng = int(words[2])
    mat = int(words[3])
    total = kor + eng + mat  # 총점 계산
    avg = total / 3          # 평균 계산
    print(name, kor, eng, mat, total, avg)  # 결과 출력


홍길동 100 90 80 270 90.0
임꺽정 80 80 90 250 83.33333333333333
조승연 100 100 100 300 100.0
강형구 80 90 70 240 80.0
김정현 100 100 90 290 96.66666666666667
이정숙 90 80 60 230 76.66666666666667


# 직렬화
직렬화 - 객체 자체를 파일이나 네트워크로 메모리 그대로 저장한다. <br>
역직렬화 - 파일이나 네트워크로부터 객체를 읽어들인다. <br>

In [None]:
import pickle

# 직렬화할 데이터 생성
data = {
    'name': "홍길동",
    "age": 23,
    "phone": ["010-0000-0001", "010-0000-0002"]
}

# 데이터 직렬화(바이너리 파일로 저장)
with open("../data/data.bin", "wb") as f:
    pickle.dump(data, f)

# 파일에서 데이터 역직렬화(객체로 복원)
with open("../data/data.bin", "rb") as f:
    loaded_data = pickle.load(f)

print(loaded_data)

{'name': '홍길동', 'age': 23, 'phone': ['010-0000-0001', '010-0000-0002']}
