### File의 Input / Output

프로그램에서 중요한 처리중 하나인 파일에 대한 입출력이다. 파일에서 문자열을 읽고 쓰는 방법과
파이썬 객체를 파일에 읽고 쓰기 위해서는 내장된 함수를 이용해서 처리한다.

1. 파일을 생성하기 위해서는 open()이라는 내장함수를 이용한다.
2. 기본문법
>변수(파일객체) = open(파일이름, 열기모드, 인코딩)

##### 1. 열기모드

모드   설명<br>
------ ----------------------------------------------------------<br>
* r    읽기모드, 파일을 읽기만 허용
* w    쓰기모드, 파일을 쓰기만 허용
* a    추가모드, 파일의 맨 마지막에 새로운 내용을 추가
* t    텍스트모드, 테그트파일로 처리(기본값)
* b    이진모드, 이진(바이너리)파일로 처리

* r+   읽기/쓰기 모드
* w+   읽기/쓰기 모드 (기존파일 삭제)
* a+   파일 끝에 추가(읽기도 가능)

* rb+  이진파일로 읽고 쓰기
* wb+  이진파일로 읽고 쓰기(기존파일 삭제)
* ab+  이진파일 끝에 추가(읽기도 가능)

예) rb ->  읽기 전용모드이면서 이진모드로 일기
    w or wt -> 텍스트로 쓰기모드
    
(주의)
파일을 쓰기모드로 열게 되면 기존파일의 전체내용이 삭제가 되고 없을 경우에 새로운 파일이 생성된다.

<img src="./images/13.파일입출력_fileIO_01.png" width="600" height="400">

##### 2. 파일닫기

1. 파일열기를 했다면 작업이 끝난 후에 close()함수를 호출하여 작업 프로세스에 할당된 자원을 해제하여야 한다.
2. close()를 마지막에 호출하지 않으면 오픈된 파일객체가 다른 값으로 치환되거나 프로그램이 종료가 될 떄 자동으로 close()가 호출된다.
3. 하지만, 명시적으로 close()를 호출하는 것이 좋다.

##### 3. 파일접근방법

1. 순차접근(기본값) : 파일을 맨 처음부터 맨 끝까지 순차적으로 읽는 방법
2. 임의접근 : 파일내에 임의의 위치에서 파일의 내용을 읽거나 쓰는 방법
   <임의접근을 하기 위해서는 file객체관련 포인터(pointer)관련 메서드
   1) seek(n) : 파일의 가장 첫번째 위치에소 n번째 바이트로 포인터를 이동
   2) tell()  : 파일내에 현재 포인터의 위치를 리턴

##### 4. 파일객체관련 메서드

* open() : 파일열기
* close(): 파일닫기
* read([size]) : 지정된 바이트크기(size)수 만큼 파일에서 읽기, size를 지정하지 않으면 전체파일을 잃어 온다.
* readline() : 한 라인씩 읽기
* readlines(): 전체라인을 readline()를 이용하여 읽어온 후에 리스트자료형으로 리턴
* write(string) : 문자열(string)을 파일에 쓰기
* writeline(list) : 문자열리스트를 파일에 쓰기, 주의할 점은 줄바꾸기가 자동으로 되지 않기 때문에 줄바꾸기 문자인 "\n"을 라인 맨 끝에 추가해야 한다.
* seek(offset[,whense]) : whens의 기본값은 0(0=시작기준, 1=현재위치, 2=파일의 끝), offset만큼 떨어진 위치에서 파일의 포인터를 이동한다.
* tell() : 파일의 현재위치(포이터)를 리턴
* flush() : 버퍼에 내용이 채워지지 않았어도 내부 버퍼전체내용을 파일에 전달
* fileno() : 파일객체의 파일기술자(File Descriptor, 정수값)을 리턴

##### 1. 파일읽기, 쓰기 기본문법

In [8]:
# 파일열기
# 변수명 = open(파일명, 열기모드, 인코딩)
%pwd
f = open('../data/newfile.txt', 'w')
f.close()

In [10]:
# 파일을 쓰기모드로 열고 텍스트를 쓰기(write()메서드사용)
%pwd
f = open('../data/newfile.txt', 'w', encoding="utf-8")
for i in range(1, 11):
    data = 'UTF-8 %2d번째 라인 입니다....\n' % i
    f.write(data)
f.close()

##### 2. 파일읽기

In [11]:
# 1. 외부에서 저장된 파일읽기(1) : readline()
# f.readline?
f = open('../data/newfile.txt', 'r', encoding="utf-8")
line = f.readline()
f.close()
print(line)
print(type(f))
print(type(line))

UTF-8  1번째 라인 입니다....

<class '_io.TextIOWrapper'>
<class 'str'>


In [12]:
# 2. 외부에서 저장된 파일읽기(2) : readline() & while
f = open('../data/newfile.txt', 'r', encoding="utf-8")
while True:
    line = f.readline()
    if not line: break
    print(line)
f.close()

UTF-8  1번째 라인 입니다....

UTF-8  2번째 라인 입니다....

UTF-8  3번째 라인 입니다....

UTF-8  4번째 라인 입니다....

UTF-8  5번째 라인 입니다....

UTF-8  6번째 라인 입니다....

UTF-8  7번째 라인 입니다....

UTF-8  8번째 라인 입니다....

UTF-8  9번째 라인 입니다....

UTF-8 10번째 라인 입니다....



In [36]:
# 3. 외부에서 저장된 파일읽기(3) : readlines()
# f.readlines?
f = open('../data/newfile.txt', 'r', encoding="utf-8")
lines = f.readlines()
f.close()
# print(lines)
print(type(lines))

for line in lines:
    print(line)

<class 'list'>
UTF-8  1번째 라인 입니다....

UTF-8  2번째 라인 입니다....

UTF-8  3번째 라인 입니다....

UTF-8  4번째 라인 입니다....

UTF-8  5번째 라인 입니다....

UTF-8  6번째 라인 입니다....

UTF-8  7번째 라인 입니다....

UTF-8  8번째 라인 입니다....

UTF-8  9번째 라인 입니다....

UTF-8 10번째 라인 입니다....



In [14]:
# 4. 외부에서 저장된 파일읽기(4) : read()
# read()함수는 파일 내용전체를 문자열로 리턴하는 함수
f = open('../data/newfile.txt', 'r', encoding="utf-8")
data = f.read()
f.close()
print(data)
print(type(data))

UTF-8  1번째 라인 입니다....
UTF-8  2번째 라인 입니다....
UTF-8  3번째 라인 입니다....
UTF-8  4번째 라인 입니다....
UTF-8  5번째 라인 입니다....
UTF-8  6번째 라인 입니다....
UTF-8  7번째 라인 입니다....
UTF-8  8번째 라인 입니다....
UTF-8  9번째 라인 입니다....
UTF-8 10번째 라인 입니다....

<class 'str'>


##### 3. 파일쓰기

In [40]:
# 1. 추가모드(a) : 기존 파일에 새로운 내용을 추가, 파일이 없다면 생성한 후에 추가
f = open('../data/newfile.txt', 'a', encoding="utf-8")
for i in range(11, 21):
    data = "%2d 번째 라인입니다 \n" % i
    f.write(data)
f.close()

UTF-8  1번째 라인 입니다....
UTF-8  2번째 라인 입니다....
UTF-8  3번째 라인 입니다....
UTF-8  4번째 라인 입니다....
UTF-8  5번째 라인 입니다....
UTF-8  6번째 라인 입니다....
UTF-8  7번째 라인 입니다....
UTF-8  8번째 라인 입니다....
UTF-8  9번째 라인 입니다....
UTF-8 10번째 라인 입니다....
11 번째 라인입니다 
12 번째 라인입니다 
13 번째 라인입니다 
14 번째 라인입니다 
15 번째 라인입니다 
16 번째 라인입니다 
17 번째 라인입니다 
18 번째 라인입니다 
19 번째 라인입니다 
20 번째 라인입니다 
11 번째 라인입니다 
12 번째 라인입니다 
13 번째 라인입니다 
14 번째 라인입니다 
15 번째 라인입니다 
16 번째 라인입니다 
17 번째 라인입니다 
18 번째 라인입니다 
19 번째 라인입니다 
20 번째 라인입니다 
11 번째 라인입니다 
12 번째 라인입니다 
13 번째 라인입니다 
14 번째 라인입니다 
15 번째 라인입니다 
16 번째 라인입니다 
17 번째 라인입니다 
18 번째 라인입니다 
19 번째 라인입니다 
20 번째 라인입니다 
11 번째 라인입니다 
12 번째 라인입니다 
13 번째 라인입니다 
14 번째 라인입니다 
15 번째 라인입니다 
16 번째 라인입니다 
17 번째 라인입니다 
18 번째 라인입니다 
19 번째 라인입니다 
20 번째 라인입니다 



In [17]:
# 2. with문 사용 : 오픈된 파일을 자동으로 close하기
# with문은 v2.5부터 지원하는 함수
# 파일을 오픈하면 항상 close해주는 것이 좋다. 하지만 매번 열고 닫는 것을 자동으로
# 처리할 수 있는데 파이썬의 with문이 이런 역할을 해 준다.

filename = '../data/newfile1.txt'
with open(filename, 'w', encoding="utf-8") as f:
    f.write('안녕? 파이썬아?')

##### 4. 파일객체 관련 함수

In [16]:
# seek(), tell() : 임의접근 함수
# f.seek(n) or f.seek(n, 0) : 파일의 맨 처음위치에서 n번째로 이동후에 파일 읽기
# f.seek(n, 1) : 현재위치
# f.seek(n, 2) : 파일의 맨 끝
# f.tell()
f = open('../data/newfile.txt', 'r', encoding="utf-8")
for line in f:
    print(line, end='')
print()    
print('-'*70)   

print(len(line))
print(f.tell()) # 파일의 현재위치를 리턴

f.seek(5, 0)
line = f.readline()
print(line)
print(f.tell())

UTF-8  1번째 라인 입니다....
UTF-8  2번째 라인 입니다....
UTF-8  3번째 라인 입니다....
UTF-8  4번째 라인 입니다....
UTF-8  5번째 라인 입니다....
UTF-8  6번째 라인 입니다....
UTF-8  7번째 라인 입니다....
UTF-8  8번째 라인 입니다....
UTF-8  9번째 라인 입니다....
UTF-8 10번째 라인 입니다....

----------------------------------------------------------------------
22
370
  1번째 라인 입니다....

37


##### 5. 파일 저장하기

In [15]:
# 1. 파일의 내용을 list로 저장하는 방법
f = open('../data/newfile.txt', 'r', encoding="utf-8")
print(type(f))

# 자료변환 함수 : list, tuple, int()
f_list = list(f)
print(type(f_list))
print(f_list)
f.close()

<class '_io.TextIOWrapper'>
<class 'list'>
['UTF-8  1번째 라인 입니다....\n', 'UTF-8  2번째 라인 입니다....\n', 'UTF-8  3번째 라인 입니다....\n', 'UTF-8  4번째 라인 입니다....\n', 'UTF-8  5번째 라인 입니다....\n', 'UTF-8  6번째 라인 입니다....\n', 'UTF-8  7번째 라인 입니다....\n', 'UTF-8  8번째 라인 입니다....\n', 'UTF-8  9번째 라인 입니다....\n', 'UTF-8 10번째 라인 입니다....\n']


In [21]:
# 2. csv 파일로 저장하는 방법

# 실행할 때마다 텍스트파일에 내용을 추가
nums=[0,1,2,3,4,5,6,7,8,9]
count= len(nums)
print(count)

output_file ='../data/result.csv'
f = open(output_file, 'a', encoding='utf-8')
for i in range(count):
    if i < (count-1):
        f.write(str(nums[i])+',')
    else:
        f.write(str(nums[i])+'\n')
f.close()
print('csv 파일 추가 완료!!!')

10
csv 파일 추가 완료!!!


##### 6. 파이썬 객체를 파일에 저장하기, 불러오기

###### 1) pickle 모듈 

* 일반 텍스트를 저장할 경우에는 파일을 이용해서 저장한다.
* 하지만, list, 클래스(class)같은 텍스트가 아닌 자료형은 일반적인 파일 입출력방법으로는 데이터를 저장하거나불러올 수 없다.
* 파이썬에서는 이와 같은 텍스트 이외의 자료형을 파일로 저장하기 위하여 <code>pickle</code>이라는 모듈을 사용한다.
* pickle을 활용하여 데이터 입력 및 로드하기 위해서는 <code>import pickle</code>로 모듈을 import를 해야 한다.
* pickle을 이용하면 원하는 데이터를 자료형의 변경없이 파일로 저장하여 그대로 로드할 수가 있다.
* pickle로 데이터를 저장히거나 불러올 때는 파일을 <code>바이트형식</code>으로 읽거나 서야한다. 즉 <code>rb, wb</code>모드로 파일을 오픈해야 한다.
* <code>wb</code>로 데이터를 저장할 경우에는 관례적으로 확장자를 <code>bin</code>으로 사용한다.
* 모든 파이썬의 데이터 객체를 저장하거나 불러올 수 있다.

###### 2) pickle 모듈 사용하기

1. 쓰기 : pickle.dump(data, file)
2. 읽기 : pickle.load(file) or load() 함수로 파일을 불러오는데 파일의 내용을 읽어 오려면 pickle.dump()함수를 사용해서 생성된 파일이어야만 한다.

In [27]:
# 1. pickle사용없이 바이너리로 파일 쓰기
data = [1,2,3,4,5,6,7,8,9,10]

with open('../data/test.bin','wb') as f:
    f.write(bytes(data)) # bytes라는 함수는 특정 자료형을 이진 데이터로 변환해주는 함수
    
# 2) 바이너리 파일 읽기
with open('../data/test.bin','rb') as f:
    contents = f.read() # 파일 전체 일기
    print(type(contents))
    print(contents)
    for content in contents:
        print(content, end =',')
# 3) 객체를 파일로 저장
# data =[1,2,3,4,5,5,6,7,8,9,10,'strint','문자열']
# with open('../data/test.bin','rb') as f:
#     f.write(bytes(data))

<class 'bytes'>
b'\x01\x02\x03\x04\x05\x06\x07\x08\t\n'
1,2,3,4,5,6,7,8,9,10,

TypeError: 'str' object cannot be interpreted as an integer

In [42]:
# 2. pickle을 사용해서 파일 객체를 저장하기

# 1) pickle 모듈을 import
import pickle

# pickle?

# 2) 객체를 파일로 저장하기
with open('../data/pickle.bin','wb') as f:
    pickle.dump("hello,python",f) #string 객체를 파일에 저장(dump)
    pickle.dump(12345,f)# int(정수)객체를 덤프
    pickle.dump(3.141592,f) #float(실수) 객체 덤프
    pickle.dump([1,2,3,['x','y','z'],[4,5,6]], f) # list 객체 덤프
    pickle.dump({'name':'소향','age':41,'addr':'seoul'},f) # 딕셔너리객체 덤프

# 3) 파일로 저장된 객체를 읽기 ## 피클의 덤프가 끝날때까지 루핑을 돌려준다.
with open('../data/pickle.bin','rb') as f:
    data = pickle.load(f)
    print(type(data))
    print(data)
    data = pickle.load(f)
    print(type(data))
    print(data)
    data = pickle.load(f)
    print(type(data))
    print(data)
    data = pickle.load(f)
    print(type(data))
    print(data)
    data = pickle.load(f)
    print(type(data))
    print(data)
#     data = pickle.load(f)
#     print(type(data))
#     print(data) 더이상의 데이터가 없어 에러 발생

# 4) 파일로 저장된 객체를 읽기(exception 처리)
with open('../data/pickle.bin','rb') as f:
    while True:
        try:
            data = pickle.load(f)
            print(data)
        except EOFError:
            break

<class 'str'>
hello,python
<class 'int'>
12345
<class 'float'>
3.141592
<class 'list'>
[1, 2, 3, ['x', 'y', 'z'], [4, 5, 6]]
<class 'dict'>
{'name': '소향', 'age': 41, 'addr': 'seoul'}
hello,python
12345
3.141592
[1, 2, 3, ['x', 'y', 'z'], [4, 5, 6]]
{'name': '소향', 'age': 41, 'addr': 'seoul'}


In [49]:
# 3. pickle을 이용해서 파일 객체를 저장(2)
import pickle as p

name = '소향'
age = 41
addr = '송도'
scores={'kor':95,'eng':92,'mat':88,'sci':96}

def add(a,b):
    return a+b

with open('../data/sohyang.bin','wb') as f:
    p.dump(name ,f)
    p.dump(age,f)
    p.dump(addr ,f)
    p.dump(scores,f)
    p.dump(add(3,4),f)

with open('../data/sohyang.bin','rb') as f:
    name = p.load(f)
    age = p.load(f)
    addr = p.load(f)
    scores = p.load(f)
    add = p.load(f)
    print(name, end=',')
    print(age, end=',')
    print(addr, end=',')
    print(scores, end=',')
    print(add)
    

소향,41,송도,{'kor': 95, 'eng': 92, 'mat': 88, 'sci': 96},7


In [50]:
# gzip모듈을 이용하여 데이터를 압축하고 해제하기
import pickle as p
import gzip

data ={
    'name' : '소향',
    'age' : 41,
    'addr' : '송도',
    'scores':{'kor':95,'eng':92,'mat':88,'sci':96},
}

# 쓰기와 압축
with gzip.open('../data/sohyang_zip.bin','wb') as f:
    p.dump(data,f)
    

# 읽기와 압축해제
with gzip.open('../data/sohyang_zip.bin','rb') as f:
    data = p.load(f)
    print(data)

{'name': '소향', 'age': 41, 'addr': '송도', 'scores': {'kor': 95, 'eng': 92, 'mat': 88, 'sci': 96}}
