# 파일 입출력

In [None]:
# 텍스트 파일 쓰기
with open("abc/파일이름.txt", "w", encoding="utf-8") as f:
    f.write("저장할 내용")

# 텍스트 파일 읽기
with open("abc/파일이름.txt", "r", encoding="utf-8") as f:
    content = f.read()
    print("읽은 내용:", content)

# 바이너리 파일 쓰기 (예: 이미지, 오디오 저장할 때)
bytes_data = b'\x48\x69'  # 예시: 'Hi'
with open("abc/파일이름.txt", "wb") as f:
    f.write(bytes_data)

# 읽기 + 쓰기 모드
with open("abc/파일이름.txt", "r+", encoding="utf-8") as f:
    content = f.read()
    f.write("\n새로운 내용 추가됨")


# 파일 쓰기

In [None]:
#쓰기 모드: "a" (append)

with open("abc/파일이름.txt", "a", encoding="utf-8") as file:
    file.write("추가된 내용입니다.\n")

In [None]:
while True:
    text = input("파일에 저장할 내용을 입력하세요 (종료: exit): ")
    if text == "exit":
        break
    with open("abc/파일이름.txt", "a", encoding="utf-8") as f:
        f.write(text + "\n")


# write()


In [None]:
# write()


with open("abc/파일이름.txt", "w", encoding="utf-8") as file:
    file.write("반복문을 사용하여 파일에 데이터를 저장합니다.")

# - 파일을 열고 내용을 저장한 후 자동으로 닫힌다
# - open 함수에 with 문을 사용하면 파일 열고 닫기가 자동으로 처리 됨
# - 반복문을 활용하면 여러 줄도 효율적으로 저장 가능

### 반복문을 활용한 파일 쓰기

반복문을 활용하면 리스트나 다른 시퀀스 자료형의 데이터를 **한 줄씩 자동으로 파일에 저장**할 수 있다.

이는 대량의 데이터를 다룰 때 매우 효율적이다.

In [None]:
# 예제: 리스트의 데이터를 파일에 저장하기

lines = [
    "Python 파일 입출력\n",
    "반복문을 사용하여 데이터를 저장합니다.\n",
    "데이터 처리가 편리합니다.\n"
]

with open("abc/파일이름.txt", "w", encoding="utf-8") as file:
    for line in lines:
        file.write(line)


# - `lines`: 파일에 저장할 문자열이 담긴 리스트
# - `for line in lines`: 각 줄을 반복하면서
# - `file.write(line)`: 한 줄씩 파일에 저장함
# - `\n`: 줄바꿈 문자로, 줄 단위 저장을 가능하게 한다

# 이 방식은 파일을 한 번만 열고 여러 줄을 순차적으로 저장하므로 **성능과 안정성 면에서 효율적**이다.

# writelines()

writelines() 함수는 리스트나 반복 가능한 객체의 모든 요소를 파일에 한 번에 기록하는 메서드이다. 

각 요소는 자동으로 줄바꿈되지 않으므로, 필요한 경우 줄바꿈 문자를 직접 포함해야 한다.

In [None]:
lines = ["첫 번째 줄입니다.\n", "두 번째 줄입니다.\n", "세 번째 줄입니다.\n"]

with open('abc/파일이름.txt', 'w') as f:
    f.writelines(lines)


# 파일 읽기 
### read vs readline vs readlines 비교

| 함수명 | 설명 | 반환 형식 |
| --- | --- | --- |
| `read()` | 전체 내용을 한 문자열로 읽음 | 문자열(str) |
| `readline()` | 한 줄만 읽음 | 문자열(str) |
| `readlines()` | 전체 줄을 리스트로 반환 | 리스트(list) |

## read()

파일에 저장된 내용을 프로그램으로 불러오려면 `read()` 함수를 사용한다.

전체 내용을 **문자열 형태로 한 번에 읽는다.**

- `"r"` 모드는 읽기(read) 전용 모드이다
- `read()`는 전체 파일 내용을 한 번에 가져온다
- `with` 블록을 벗어나면 파일은 자동으로 닫힌다

- 파일이 존재하지 않으면 오류가 발생한다 (`FileNotFoundError`)
- 파일을 여러 번 읽으려면 포인터를 다시 처음으로 돌리거나 파일을 다시 열어야 한다

In [None]:
with open("abc/파일이름.txt", "r", encoding="utf-8") as file:
    content = file.read()
    print(content)

# 예제 실행 결과 (abc/파일이름.txt에 다음과 같은 내용이 있을 경우)

#  Python 파일 입출력
#  반복문을 사용하여 데이터를 저장합니다.
# 데이터 처리가 편리합니다.


# readline()

`readline()` 함수는 파일에서 **한 줄씩 순차적으로 읽을 수 있는 함수**이다.

한 줄만 읽기 때문에 **반복문과 함께 사용**하면 매우 유용하다.

- 첫 번째 줄만 읽어서 출력한다
- 반복해서 `readline()`을 호출하면 다음 줄을 차례로 읽는다

In [None]:
with open("abc/파일이름.txt", "r", encoding="utf-8") as file:
    line = file.readline()
    print(line)

- 반복문을 사용한 전체 줄 읽기

```python
with open("example.txt", "r", encoding="utf-8") as file:
    while True:
        line = file.readline()
        if not line:
            break
        print(line.strip())
```
  
    - `while True`: 무한 반복 시작
    - `readline()`: 한 줄씩 읽는다
    - `if not line`: 읽은 내용이 없으면 반복 종료
    - `strip()`: 줄바꿈 문자 제거
    
    ```
    Python 파일 입출력
    반복문을 사용하여 데이터를 저장합니다.
    데이터 처리가 편리합니다.
    ```
    

- 이 방식은 **줄 수가 정해지지 않은 텍스트 파일**을 처리할 때 유용하다.

In [28]:
with open("abc/파일이름.txt", "r", encoding="utf-8") as file:
    while True:
        line = file.readline()
        if not line:
            break
        print(line.strip())

Python 파일 입출력
반복문을 사용하여 데이터를 저장합니다.
데이터 처리가 편리합니다.


## readlines()

`readlines()` 함수는 파일 전체 내용을 **줄 단위로 나누어 리스트 형태로 읽는다.**

각 줄이 문자열 원소가 되어 리스트에 저장된다.

```python
with open("example.txt", "r", encoding="utf-8") as file:
    lines = file.readlines()

for line in lines:
    print(line.strip())
```

- `readlines()`: 파일 전체 내용을 한 줄씩 리스트로 반환한다
- `for line in lines`: 리스트의 각 줄을 반복해서 출력
- `strip()`: 줄바꿈 문자 제거

In [29]:
with open("abc/파일이름.txt", "r", encoding="utf-8") as file:
    lines = file.readlines()

for line in lines:
    print(line.strip())

Python 파일 입출력
반복문을 사용하여 데이터를 저장합니다.
데이터 처리가 편리합니다.


```python
with open("data.txt", "r", encoding="utf-8") as f:
    for line in f.readlines():
        print(line.upper().strip())

```

- 전체 파일을 읽고, 각 줄을 대문자로 변환한 후 출력한다

In [31]:
with open("abc/파일이름.txt", "r", encoding="utf-8") as f:
    for line in f.readlines():
        print(line.upper().strip())


PYTHON 파일 입출력
반복문을 사용하여 데이터를 저장합니다.
데이터 처리가 편리합니다.


# 피클, 직렬화 / 역직렬화

직렬화(Serialization)는 파이썬의 객체나 데이터 구조를 파일이나 네트워크로 전송할 수 있는 형식으로 변환하는 과정이다.
반대로 역직렬화(Deserialization)는 파일이나 네트워크에서 받은 데이터를 다시 파이썬 객체로 변환하는 과정을 말한다.

Python에서는 주로 `pickle` 모듈을 사용하여 직렬화와 역직렬화를 수행한다.

직렬화와 역직렬화의 주요 사용 사례는 다음과 같다:

- 객체의 영속성(persistence) 유지
- 네트워크를 통한 데이터 전송
- 복잡한 데이터 구조의 저장과 복원

### 다음은 pickle 모듈을 사용한 직렬화/역직렬화의 기본 예제

In [35]:
import pickle

# 직렬화할 데이터 딕셔너리
data = {
    'name': '홍길동',
    'age': 30,
    'scores': [90, 85, 88]
}

# 직렬화하여 파일에 저장
with open('abc\파일이름.pickle', 'wb') as f:
    pickle.dump(data, f)

# 파일에서 역직렬화하여 읽기
with open('abc\파일이름.pickle', 'rb') as f:
    loaded_data = pickle.load(f)

print(loaded_data)  # 원본 데이터가 그대로 복원됨

{'name': '홍길동', 'age': 30, 'scores': [90, 85, 88]}


위 예제에서 dictionary 객체를 pickle을 사용하여 파일에 저장하고, 다시 읽어오는 과정을 보여준다. 직렬화된 데이터는 바이너리 형태로 저장되므로, 파일을 열 때 'wb'(쓰기-바이너리) 또는 'rb'(읽기-바이너리) 모드를 사용해야 한다.

In [36]:
import json


In [39]:
# 직렬화하여 파일에 저장
with open('abc\파일이름.json', 'w') as f:
    json.dump(data, f, ensure_ascii=False)

In [38]:
with open('abc\파일이름.json', 'r') as f:
    loaded_txt = json.load(f)

print(loaded_txt)

{'name': '홍길동', 'age': 30, 'scores': [90, 85, 88]}


In [40]:
import csv
data = [['name','age'], ['bob', 20], ['alice', 15]]
data

[['name', 'age'], ['bob', 20], ['alice', 15]]

In [42]:
# 직렬화하여 파일에 저장
with open('abc/파일이름.csv', 'w') as f:
    wrt = csv.writer(f)
    wrt.writerows(data)

In [44]:
import pandas as pd

df = pd.DataFrame(data)
df.to_csv('abc/파일이름_df.csv')

In [47]:
pd.read_csv('abc/파일이름_df.csv')

Unnamed: 0.1,Unnamed: 0,0,1
0,0,name,age
1,1,bob,20
2,2,alice,15
