# File의 Input/Output

* 파일에서 문자열을 읽거나 쓰는 방법과 파이썬 객체를 파일에 읽고 쓰기 위해서는 내장함수를 이용해서 처리한다.
  1. 파일 생성 및 열기를 위해서는 `open()`이라는 내장함수를 사용
  2. 기본문법
     >변수(파일객체) = open(파일이름, 열기모드, 인코딩)

## 1. file open mode
|모드|설명|
|:-----:|:----------------|
|r|읽기모드, 파일을 읽기만 허용|
|w|쓰기모드, 파일을 쓰기만 허용|
|a|추가모드, 파일의 맨 뒤에 새로운 내용을 추가|
|t|텍스트모드, 파일을 텍스트파일로 처리(기본값)|
|b|이진모드, 파일을 이진(바이너리)파일로 처리, 이미지등 멀티미디어파일 읽기|
|r+|읽기/쓰기모드, 파일을 읽거나 쓰기모드로 처리, 기존에 파일이 있다면 에러발생|
|w+|읽기/쓰기모드, 파일을 읽거나 쓰기모드로 처리, 기존파일을 삭제후 새로 생성|
|a+|읽기/쓰기모드, 파일을 쓰기모드로 처리, 파일의 맨 뒤에 텍스트내용을 추가|
|rb+|이진으로 읽기/쓰기모드, 기존파일이 있다면 에러|
|wb+|이진으로 읽기/쓰기모드, 기존파일삭제후 생성, 없다면 새로 생성후 쓰기|
|ab+|이진으로 추가모드|

><img src="./images/13.파일입출력_FileIO_01.png" width="300" height="200" >

## 2. 파일닫기

1. 파일을 열었다면 작업이 완료된 후에 `close()`함수를 호출해서 할당된 자원을 해제해야 한다.
2. close()를 호출하지 않으면 open된 파일객체가 다른 값을 치환되거나 프로그램이 종료가 될 때 자동으로 close함수가 호출된다.
3. 하지만, 명시적으로 close함수를 호출하는 것이 좋다.

## 3. 파일접근하기

1. 순차접근 : 기본값, 파일을 맨 처음부터 맨 끝까지 순차적으로 읽는 방법
2. 임의접근 : 파일내에 임의의 위치에서부터 파일을 읽거나 쓰는 방법
   a. seek(n) - 파일의 가장 첫 번째위치에서 n번째 바이트로 포인트를 이동
   b. tell()  - 파일내에서 현재의 포인터(위치)를 리턴

## 4. 파일관련메서드

|메서드|설명|
|:----------------|:--------------------------------|
|open()|파일열기|
|close()|파일닫기|
|read([size])|지정된 바이트수(size)만큼 파일에서 읽기, size미지정시 파일 전체 읽기|
|readline()|한 라인씩 읽기|
|readlines()|전체 파일을 readline을 이용해서 읽은 후에 list자료형으로 리턴|
|write(string)|문자열(string)을 파일에 쓰기|
|writeline(list)|문자열list를 파일에 쓰기, 주의할 점은 줄바꾸기가 되지 않는다.|
||줄바꾸기가 되지 않기 때문에 문장(라인)끝에 줄바꿈문자('\n\)를 추가해야 한다.|
|seek(offset[,whense])|whnse의 기본값은 0, whens(0=시작, 1=현재위치, 2=파일끝)|
||offset만큼 떨어진 위치에 포인터를 이동|
|tell()|파일의 현재 위치(포인터)를 리턴|
|flush()|buffer에 내용이 채워지지 않아도 내부 buffer의 전체내용을 파일에 전달|
|fileno()|파일객체의 파일기술자(File Descriptor, 정수값)를 리턴|

### 1. 파일읽기, 쓰기 기본문법

In [7]:
# 1. 파일읽기
# %pwd
# %mkdir data
# %ls
# open?
f = open('./data/newfile.txt', 'w')
print(type(f), f)
print(dir(f))
f.close()

<class '_io.TextIOWrapper'> <_io.TextIOWrapper name='./data/newfile.txt' mode='w' encoding='cp949'>
['_CHUNK_SIZE', '__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_checkClosed', '_checkReadable', '_checkSeekable', '_checkWritable', '_finalizing', 'buffer', 'close', 'closed', 'detach', 'encoding', 'errors', 'fileno', 'flush', 'isatty', 'line_buffering', 'mode', 'name', 'newlines', 'read', 'readable', 'readline', 'readlines', 'reconfigure', 'seek', 'seekable', 'tell', 'truncate', 'writable', 'write', 'write_through', 'writelines']


In [54]:
# write() - 파일을 쓰기모드로 열고 임의의 문자열을 쓰기
f = open('./data/newfile.txt', 'w', encoding='utf-8')
# f.write?
for i in range(1,11):
    data = '....... UTF-8 %2d번째 라인입니다.\n' % i
    result = f.write(data)
f.close()
print(result)

26


### 2. 파일읽기

In [19]:
# 1. 외부에 저장된 파일읽기(1) - readline()
# f.readline?
f = open('./data/newfile.txt', 'r', encoding='utf-8')

while True:
    line = f.readline()
    if not line: break
    print(type(line), line)

f.close()

<class 'str'> ....... UTF-8  1번째 라인입니다.

<class 'str'> ....... UTF-8  2번째 라인입니다.

<class 'str'> ....... UTF-8  3번째 라인입니다.

<class 'str'> ....... UTF-8  4번째 라인입니다.

<class 'str'> ....... UTF-8  5번째 라인입니다.

<class 'str'> ....... UTF-8  6번째 라인입니다.

<class 'str'> ....... UTF-8  7번째 라인입니다.

<class 'str'> ....... UTF-8  8번째 라인입니다.

<class 'str'> ....... UTF-8  9번째 라인입니다.

<class 'str'> ....... UTF-8 10번째 라인입니다.



In [21]:
# 2. 외부에 저장된 파일읽기(2) - readlines()
f = open('./data/newfile.txt', 'r', encoding='utf-8')
lines = f.readlines()
print(type(lines))
print(lines)
print()

for line in lines:
    print(line)

<class 'list'>
['....... UTF-8  1번째 라인입니다.\n', '....... UTF-8  2번째 라인입니다.\n', '....... UTF-8  3번째 라인입니다.\n', '....... UTF-8  4번째 라인입니다.\n', '....... UTF-8  5번째 라인입니다.\n', '....... UTF-8  6번째 라인입니다.\n', '....... UTF-8  7번째 라인입니다.\n', '....... UTF-8  8번째 라인입니다.\n', '....... UTF-8  9번째 라인입니다.\n', '....... UTF-8 10번째 라인입니다.\n']

....... UTF-8  1번째 라인입니다.

....... UTF-8  2번째 라인입니다.

....... UTF-8  3번째 라인입니다.

....... UTF-8  4번째 라인입니다.

....... UTF-8  5번째 라인입니다.

....... UTF-8  6번째 라인입니다.

....... UTF-8  7번째 라인입니다.

....... UTF-8  8번째 라인입니다.

....... UTF-8  9번째 라인입니다.

....... UTF-8 10번째 라인입니다.



In [34]:
# 3. 외부에 저장된 파일읽기(3) - read(문자단위의 길이)
# f.read?
f = open('./data/newfile.txt', 'r', encoding='utf-8')
data = f.read(20) 
f.close()
print(type(data))
print(data)

<class 'str'>
....... UTF-8  1번째 라


### 3. 파일쓰기

In [39]:
# 1. 추가모드(a): 기존 파일에 새로운 내용을 추가
f = open('./data/newfile.txt', 'a', encoding='utf-8')

for i in range(21, 31):
    data = f'append mode {i:2d}번째 라인입니다!!\n'
    f.write(data)
f.close()

In [43]:
# 2. wiht문을 사용 - 오픈된 파일을 자동으로 close
# with문은 python v2.5이상부터 사용가능
# %whos
# %reset -f
f_name = './data/newfile_01.txt'
with open(f_name, 'w', encoding='utf-8') as f:
    f.write('Hello Python!!')
%whos

Variable   Type             Data/Info
-------------------------------------
f          TextIOWrapper    <_io.TextIOWrapper name='<...>ode='w' encoding='utf-8'>
f_name     str              ./data/newfile_01.txt


### 4. 파일객체 접근함수

In [52]:
# seek, tell
# f.seek?
# f.tell?
# 1. f.seek(n) or f.seek(n, 0) : 파일의 맨 처음부터 n번째로 이동후 파일 읽기, 0=SEET_SET
# 2. f.seek(n, 1) : 현재위치, 1=SEEK_CUR
# 3. f.seek(n, 2) : 맨끝위치, 2=SEEK_END
# 4. f.tell() : 현재 포인터의 위치
f = open('./data/newfile_02.txt', 'w', encoding='utf-8')
f.write('Life is too short!')
f = open('./data/newfile_02.txt', 'r', encoding='utf-8')

for line in f:
    print(line)
print('----+'*5)
print(f'현재 포인터의 위치 = {f.tell()}')

f.seek(5, 0)
print(f'현재 포인터의 위치 = {f.tell()}')
print(f.readline())
print(f'현재 포인터의 위치 = {f.tell()}')

Life is too short!
----+----+----+----+----+
현재 포인터의 위치 = 18
현재 포인터의 위치 = 5
is too short!
현재 포인터의 위치 = 18


### 5. 파일저장하기

In [60]:
# 1. 파일의 내용을 list자료형으로 변환하기
f = open('./data/newfile.txt', 'r', encoding='utf-8')
print(type(f) ,f)

# a. list
l = list(f)
print(type(l) ,l, '\n')

# b. tuple
f.seek(0)  # 파일을 읽었기 때문에 현재 마지막 포인터를 맨 처음으로 이동
t = tuple(f)
print(type(t) ,t, '\n')


<class '_io.TextIOWrapper'> <_io.TextIOWrapper name='./data/newfile.txt' mode='r' encoding='utf-8'>
<class 'list'> ['....... UTF-8  1번째 라인입니다.\n', '....... UTF-8  2번째 라인입니다.\n', '....... UTF-8  3번째 라인입니다.\n', '....... UTF-8  4번째 라인입니다.\n', '....... UTF-8  5번째 라인입니다.\n', '....... UTF-8  6번째 라인입니다.\n', '....... UTF-8  7번째 라인입니다.\n', '....... UTF-8  8번째 라인입니다.\n', '....... UTF-8  9번째 라인입니다.\n', '....... UTF-8 10번째 라인입니다.\n'] 

<class 'tuple'> ('....... UTF-8  1번째 라인입니다.\n', '....... UTF-8  2번째 라인입니다.\n', '....... UTF-8  3번째 라인입니다.\n', '....... UTF-8  4번째 라인입니다.\n', '....... UTF-8  5번째 라인입니다.\n', '....... UTF-8  6번째 라인입니다.\n', '....... UTF-8  7번째 라인입니다.\n', '....... UTF-8  8번째 라인입니다.\n', '....... UTF-8  9번째 라인입니다.\n', '....... UTF-8 10번째 라인입니다.\n')


In [64]:
# 2. csv파일 형식으로 저장하기
nums = [1,2,3,4,5,6,7,8,9,10]
count = len(nums)
print(len(nums), '\n')

f_name = './data/result.csv'
f = open(f_name, 'a', encoding='utf-8')
for i in range(count):
    if i < count-1:
        f.write(str(nums[i]) + ',')
    else:
        f.write(str(nums[i]) + '\n')
f.close()
print('csv 파일을 성공적으로 저장했습니다!!')

10 

csv 파일을 성공적으로 저장했습니다!!


### 6. 파일객체를 파일로 저장, 읽어오기

#### 1. pickle모듈
1. 일반 텍스트를 저장할 경우에는 파일을 이용해서 저장한다.
2. 하지만, list, class(클래스)와 같은 텍스트가 아닌 자료형 or 객체는 일반적인 파일 입출력방법으로는 데이터를 저장하거나 읽을 수가 없다.
3. 파이썬에서는 텍스트이외의 자료를 저장하기 위해서는 `pickle모듈을 사용`한다.
4. pickle을 사용하기 위해서는 pickle모듈을 `import pickle`처럼 import해야 한다.
5. pickle을 이용하면 원하는 데이터를 자료형의 변경없이 파일로 저장하여 그대로 load를 할 수 있다.
6. pickle로 데이터를 저장하거나 읽기 위해서는 `바이트형식으로 처리`해야 한다. 즉, `rb, wb모드로 파일을 오픈`해야 한다.
7. wb로 데이터를 저장할 경우에는 관례적으로 `파일이름의 확장자를 bin`으로 사용한다.
8. 모든 파이썬의 데이터는 객체상태(이진파일)형태로 처리할 수가 있다.

#### 2. pickle모듈 사용하기
1. 쓰기 : pickle.dump(data, file)
2. 읽기 : pickle.load(file) or load()함수로 파일을 읽어 올 수 있다. 단, pickle.dump()로 저장된 파일만 읽을 수가 있다.

In [76]:
# 1. pickle모듈없이 바이너리파일로 저장하기
data = 1,2,3,4,5,6,7,8,9,10

# 1) 바이트파일로 쓰기
with open('./data/test.bin', 'wb') as f:
    # f.write(data)# TypeError: a bytes-like object is required, not 'tuple'
    # int(), float()처러 바이트변환함수 bytes()변환함수를 이용하여 이진데이터로 변환후에 저장
    # print(type(bytes(data)), bytes(data))
    f.write(bytes(data))
    
# 2) 바이트파일 읽기
with open('./data/test.bin', 'rb') as f:
    contents = f.read()
    print(type(contents), contents)
    for content in contents:
        print(content, end=",")

# 3) 객체를 파일로 저장
data = 1,2,3,4,5,6,7,8,9,10, print, '문자열'
with open('./data/test.bin', 'wb') as f:
    # f.write(bytes(data))  TypeError: 'builtin_function_or_method' object cannot be interpreted as an integer
    pass

<class 'bytes'> b'\x01\x02\x03\x04\x05\x06\x07\x08\t\n'
1,2,3,4,5,6,7,8,9,10,

In [90]:
# 2. pickle모듈을 사용해서 객체를 포함한 데이터를 바이너리파일로 저장하기

# 1) pickle 모듈 load하기
import pickle
# pickle?
# print(dir(pickle))

# 2) 객체를 바이너리파일로 저장
with open('./data/test.bin', 'wb') as f:
    pickle.dump('Hello Python', f) # 문자열객체
    pickle.dump(12345, f)          # int
    pickle.dump(3.141, f)          # float
    pickle.dump([1,2,3,[4,5,6], {}, (), '문자열'], f)      # list객체의 요소(다양한 데이터타입)저장
    pickle.dump({'name':'소향', 'job':'가수'}, f)          # object타입
    
# 3) pickle로 저장된 바이너리파일 읽기    
with open('./data/test.bin', 'rb') as f:
    data = pickle.load(f)
    print(type(data), data)
    data = pickle.load(f)
    print(type(data), data)
    data = pickle.load(f)
    print(type(data), data)
    data = pickle.load(f)
    print(type(data), data)
    data = pickle.load(f)
    print(type(data), data)

    # 더이상 꺼내올 자료가 없을 경우에는 에러가 발생
    #data = pickle.load(f) # EOFError: Ran out of input
    # print(type(data), data)   
print()

# 4) exception 처리
with open('./data/test.bin', 'rb') as f:
    while True:
        try:
            data = pickle.load(f)
            print(type(data), data)            
        except EOFError:
            break

<class 'str'> Hello Python
<class 'int'> 12345
<class 'float'> 3.141
<class 'list'> [1, 2, 3, [4, 5, 6], {}, (), '문자열']
<class 'dict'> {'name': '소향', 'job': '가수'}

<class 'str'> Hello Python
<class 'int'> 12345
<class 'float'> 3.141
<class 'list'> [1, 2, 3, [4, 5, 6], {}, (), '문자열']
<class 'dict'> {'name': '소향', 'job': '가수'}


In [94]:
# 3. pickle을 사용해서 파일객체로 저장하기
import pickle as p

name = '소향'
age = 45
addr = '서울'
scores = {'국어':100, '수학':80, '영어':99, '과학':92}

def add(x, y):
    return x+y

with open('./data/sohyan.bin', 'wb') as f:
    p.dump(name, f)
    p.dump(age, f)
    p.dump(addr, f)
    p.dump(scores, f)
    p.dump(add, f)


with open('./data/sohyan.bin', 'rb') as f:
    name = p.load(f)
    age  = p.load(f)
    addr = p.load(f)
    scores = p.load(f)
    add = p.load(f)
    print(name, age, addr, scores, add)
    
print("pickle로 저장된 객체의 add함수 = ", add(1000, 2000))  

소향 45 서울 {'국어': 100, '수학': 80, '영어': 99, '과학': 92} <function add at 0x000002B41E386020>
pickle로 저장된 객체의 add함수 =  3000


### 3. 파일압축하기

* gzip모듈을 이용하여 데이터를 압축, 해제하기
```python
import gzip
```

In [98]:
import pickle as p
import gzip
# gzip?
print(dir(gzip))

data = {
    'name': '소향',
    'age': 45,
    'addr': '서울',
    'scores': {'국어':100, '수학':80, '영어':99, '과학':92}
}

['BadGzipFile', 'FCOMMENT', 'FEXTRA', 'FHCRC', 'FNAME', 'FTEXT', 'GzipFile', 'READ', 'WRITE', '_COMPRESS_LEVEL_BEST', '_COMPRESS_LEVEL_FAST', '_COMPRESS_LEVEL_TRADEOFF', '_GzipReader', '_PaddedFile', '__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', '_compression', '_create_simple_gzip_header', '_read_exact', '_read_gzip_header', 'builtins', 'compress', 'decompress', 'io', 'main', 'open', 'os', 'struct', 'sys', 'time', 'write32u', 'zlib']


In [101]:
# 1) 쓰기와 압축
# gzip.GzipFile?
with gzip.open('./data/sohyang.bin', 'wb') as f:
    p.dump(data, f)
    # print(type(f), f) type = gzip.GzipFile

with gzip.open('./data/sohyang.bin', 'rb') as f:
    data = p.load(f)
    print(type(data), data)

<class 'dict'> {'name': '소향', 'age': 45, 'addr': '서울', 'scores': {'국어': 100, '수학': 80, '영어': 99, '과학': 92}}
