# 파일

## open()

파일은 open() 명령에서 `<MODE>` 값에 따라 읽고 쓴다. [Python builtin functions](https://docs.python.org/3/library/functions.html)
    
>open(file, mode='rb', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
  - mode는 파일에 대한 액션과 파일 형식을 지정한다: rb, wb, wr
     - 액션 : w(기록), a(추가), r(읽기:기본값)
     - 타입 : t(텍스트:기본값), b(2진 파일)
open 으로 열린 객체는 `.close()` 로 닫아 주어야 한다.

### 읽기 모드

`read()` 함수: 파일의 내용 전체를 문자열로 리턴한다. 

In [None]:
# 파일 열기 (open)
f = open("./samples/test.txt", "w", encoding="utf8")
size = f.write("Life is too short\n")
print(f"{size} 만큼 기록:"
size = f.write("You need Python.\n")
print("{size} 만큼 기록:")
f.close() # 사용후 반드시 닫는다.

읽기 모드로 텍스트 불러오면 파일 전체를 읽어온다 -> 파일이 클 경우 문제 발생 가능


In [None]:
f = open("./samples/test.txt", "rt", encoding="utf8")
text = f.read()
print("READ:", text)
f.close()

`readline()` 함수 이용하기

파일이 클 경우, 라인 단위로 파일을 읽는 것이 효율적

In [None]:
f = open("./samples/test.txt", "rt", encoding="utf8")
while True:
    line = f.readline()
    if not line:
        break
    line = line.strip() # 공백 문자 제거
    print(line)

f.close()

In [None]:
f = open(examfile, 'r')
line = f.readline()
print(line)
f.close()

### 내용 추가하기

`append` 모드는 파일이 있으면 뒤에 내용을 추가, `<MODE>`를 `a`로 제시하면 파일의 끝에 내용을 추가할 수 있다.



In [None]:
f = open('testfile.txt', 'a')
for i in range(11, 20):
    data = "%d번째 줄입니다.\n" % i
    f.write(data)
f.close()

### with ~ as
`with ~ as` 를 이용하면 파일 close 작업을 자동으로 수행 -> 안전하게 시스템 자원을 활용
즉 close() 메서드를 명시하지 않아도, 파일을 다 사용후에 닫아 준다.

`split()` 를 사용해 파일을 불러와서 개행문자 구분한 리스트로 반환

In [None]:
with open("./testfile.txt", "rt", encoding="utf8") as f:
    lines = f.readlines()
print("lines:", lines)

# 루프를 돌려 출력
for line in lines:
    print(line.strip())

### 쓰기 모드


In [None]:
# 파일 쓰기모드로 한 줄씩 쓰기
f = open( './samples/testwrite.txt', 'w')
for i in range(1, 11):
    data = "%d번째 줄입니다.\n" % i
    f.write(data)
f.close()

쓰기 모드에서 with 를 곁들여서 쓸 수 있다.

In [None]:
with open('./samples/testwrite.txt', 'w') as f:
    for i in range(1, 10):
        data = '%d번째 줄입니다.\n' % i
        f.write(data)

In [None]:
with open("./samples/testwrite.txt", "r", encoding="utf8") as f:
    lines = f.readlines()
print("lines:", lines)

### 리스트로 반환받기

보통 작은 파일을 다룰 때 리스트를 사용하기 좋다.

In [None]:
address = []
with open('address.txt') as file:
    for line in file: 
        line = line.strip() #or some other preprocessing
        address.append(line) #storing everything in memory

### 파일 실습

#### 문제 1

어떤 파일에 1부터 30까지의 숫자 중 홀수를 각 라인 단위로 
파일에 입력하는 프로그램을 작성하세요.
(생성되는 파일의 이름은 odd_number.txt입니다.)


#### 문제 2

어떤 파일에 1부터 30까지의 숫자 중 짝수를 각 라인 단위로 파일에 
입력하는 프로그램을 작성하세요.
(생성되는 파일의 이름은 even_number.txt입니다.)




#### 문제3

현재 사용하는 ipynb 파일을 읽어 파일에 있는 단어의 개수를 세는 프로그램을 작성하시오.

---

### 텍스트파일 encoding

- Linux: Unicoe
- Windows: CP949


In [None]:
with open('text_cp949.txt', 'w', encoding='cp949') as f:
    for i in range(1, 10):
        data = f'{i} 번째 줄입니다.\n'
        f.write(data)

In [None]:
with open('text_utf8.txt', 'w', encoding='utf8') as f:
    for i in range(1, 10):
        data = f'{i} 번째 줄입니다.\n'
        f.write(data)

cp949 바로 읽기

In [None]:
with open("text_cp949.txt", "r") as f:
    lines = f.readlines()

print("lines:", lines)

In [None]:
with open("text_cp949.txt", "r", encoding='cp949') as f:
    lines = f.readlines()

print("lines:", lines)

utf8 바로 읽기

In [None]:
with open("text_utf8.txt", "r") as f:
    lines = f.readlines()

print("lines:", lines)

In [None]:
with open("text_utf8.txt", "r", encoding='cp949') as f:
    lines = f.readlines()

print("lines:", lines)

## binary mode

바이너리 파일은 바이너리 모드로 작성해서 사용해야 한다. 

In [None]:
"""
바이너리 파일 생성
"""
print("====== binary file =====")
f = open("test.bin", "wb")

for i in range(0, 256):
    data = i.to_bytes(1, 'little')
    f.write(data)
f.close()

In [None]:
# with
print("====== with binary file =====")
with open("test.bin", "wb") as f:

    for i in range(0, 256):
        data = i.to_bytes(1, 'little')
        f.write(data)


with open("test.bin", "rb") as f:
    print("{0}".format(f.read()).encode())
#     print(f'{f.read()}'.encode()) # a byte string

#### 바이너리 파일 복사

바이너리 모드로 rose-flower.jpeg를 읽어 들여서, 바이너리 모드로 rose-flower-copy.jpeg로 저장해 보자.

In [None]:
with open("rose-flower.jpeg", "rb") as f:
    data = f.read()

print("읽은 데이터:", data)

# 저장
with open("rose-flower-copy.jpeg", "wb") as f:
    f.write(data)