# 파일 입출력(IO)

외부자원(프로그램 외부의 파일, 넷, DB)을 읽고 쓰는 것

<img src="8_1.jpg">


### 1. 파일연결
`open(파일경로, 모드, 인코딩방식)`
- 연결된 파일과 입출력 메소드를 제공하는 객채인 TextIOWrapper 객체를 리턴. 
- 주요 매개변수
    - file
    - mode: `목적+대상` <br>
       *파일을 여는 목적*
        - r: 읽기
        - w: 새로쓰기
        - x: 연결하려는 파일이 있으면 에러, 없으면 만들어 줌
        - a: 이어쓰기<br>
      *대상의 종류*
        - b: binary (text를 제외한 나머지). 씌여있는 그대로 읽음
        - t: text (메모장으로 열 수 있는 파일들). text형식에 맞춰서 읽음. text가 기본
        - +: 읽기/쓰기 모드<br>
        모드는 조합할 수 잇다. 
        - e.g.) wb
        - rt가 기본값
        
    - `encoding=방식`  <-> decoding <br>
         Text를 기계어로 특정 방식에 따라 구현한 리스트. <br>
         방식은 다음의 둘 중 하나: <br>
         - UTF-8
         - CP949(euckr): 윈도우에서는 ANSI         
         - ASCII, UTF-8(현재 표준), unicode (2byte) 등의 방식이 있다

### 2. 입력/출력
입력(파일 읽기)
- `read()`: 전체읽기
- `readline()`: 한줄읽기
- `readlines()`: 한줄씩 리스트로 반환
- `for line in 파일명`: for문을 이용해 한줄씩 읽기

출력(파일쓰기)
- `write()`
- `writelines()`

### 3. 연결끊기
연결이 되어있는 상태에서는 파일을 지울 수 없음

CP949형식으로 텍스트 파일 새로쓰기(w)

In [52]:
fr = open("test_text.txt", "wt") #test_text.txt와 텍스트쓰기 모드로 연결
txt = """ 안녕하세요
라라라라
1231313
끗"""
# 
fr.write(txt)
fr.write("마지막 라인")
fr.write("새줄")
fr.close()

UTF-8형식으로 텍스트 파일 쓰기

In [57]:
fr = open("test_text.txt", "wt", encoding='UTF-8') #test_text.txt와 텍스트쓰기 모드로 연결
txt = """안녕하세요
라라라라
1231313
끗"""
# 
fr.write(txt)
fr.write("\n마지막 라인\n")
fr.write("새줄")
fr.close()

인코딩 지정하지 않는 경우 CP949로 읽음

In [58]:
f = open('test_text.txt','rt')
r_txt = f.read()                        #파일 전체 한번에 읽기
print(r_txt)

UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 0: illegal multibyte sequence

UTF-8으로 읽기

In [59]:
f = open('test_text.txt','rt',encoding="UTF-8")   #연결
r_txt = f.read()                           #파일 전체 한번에 읽기
print(r_txt)                                      #읽은 파일 프린트
f.close()                                         #연결끊기

안녕하세요
라라라라
1231313
끗
마지막 라인
새줄


이어쓰기 모드(a)로 파일 생성

In [75]:
fr = open("test_text.txt", "at", encoding="UTF-8") #test_text.txt와 텍스트쓰기 모드로 연결
txt = """ 안녕하세요
라라라라
1231313
끗"""
# 
fr.write(txt)
fr.write("마지막 라인")
fr.write("새줄")
fr.close()

`readline()`: 한줄읽기

In [61]:
f = open('test_text.txt','rt',encoding="UTF-8")   #연결
r_txt = f.readline()                           
print(r_txt)                                      #읽은 파일 프린트
f.close()     

안녕하세요



`readlines()`: 한줄씩읽어서 리스트로 반환
- 줄 단위로 처리해야 하는 데이터를 읽어야 할 때

In [64]:
f = open('test_text.txt','rt',encoding="UTF-8")   #연결
r_txt = f.readlines()                           
print(r_txt)                                      #읽은 파일 프린트
f.close()     

['안녕하세요\n', '라라라라\n', '1231313\n', '끗\n', '마지막 라인\n', '새줄 안녕하세요\n', '라라라라\n', '1231313\n', '끗마지막 라인새줄']


`for in`문 사용

In [71]:
f = open('test_text.txt','rt',encoding="UTF-8")   #연결
for row in f:                          
    print(row.strip())                                      #읽은 파일 프린트
f.close()     

안녕하세요
라라라라
1231313
끗
마지막 라인
새줄 안녕하세요
라라라라
1231313
끗마지막 라인새줄


`for in`문 사용, 라인번호 표시하기

In [73]:
f = open('test_text.txt','rt',encoding="UTF-8")   #연결
for idx, row in enumerate(f,start=1):                          
    print(idx, row.strip())                                      #읽은 파일 프린트
f.close()     

1 안녕하세요
2 라라라라
3 1231313
4 끗
5 마지막 라인
6 새줄 안녕하세요
7 라라라라
8 1231313
9 끗마지막 라인새줄


**NB)** read, write 같은 경우, 예외상황 발생 가능성이 있으므로 주로 `try`안에 넣어놓음

`finally`와 `.close()` 이용해서 무조건 연결을 끊도록 함

In [80]:
try:
    f = open('test_text.txt','rt',encoding="UTF-8")   #연결
    for idx, row in enumerate(f,start=1):         
        
except:
    print(idx, row.strip())

finally:
    print("finally")
    f.close()     

IndentationError: expected an indented block (<ipython-input-80-cc21f7441eb4>, line 5)

`witth`: 블록을 빠져나오면 자동으로 close()됨

In [81]:
with open("./test_text.txt", 'rt', encoding="utf-8") as fr:
    try:
        for s in fr:
            print(s.strip())
    except:
        print("오류처리")
        #with block을 빠져나오면 자동으로 close()됨
print("종료")

안녕하세요
라라라라
1231313
끗
마지막 라인
새줄 안녕하세요
라라라라
1231313
끗마지막 라인새줄 안녕하세요
라라라라
1231313
끗마지막 라인새줄
종료


## 자원(파일)경로

<img src="8_2.jpg">

- 절대경로: `c:\test\a.txt`
    - 시작 경로(Root)부터 쭉 나열하는 것
    
- 상대경로: `./../test/a.txt`
    - 현재 작업디렉토리(현재 패일이 있는 경로)부터 찾아 가는 방식.
    - `.`: 현재경로
    - `..`: 상위경로
    - `\`, `/`: 경로 구분자로 하위경로로 들어갈때 사용
    - 항상 `./`로 시작하기 때문에 생략하기도 한다
    

In [85]:
#현재 작업경로
# 보통 프로그램이 실행된 디렉토리가 작업 디렉토리가 됨: 파이썬의 디렉토리
import os
print(os.getcwd())

C:\Users\Playdata\Python기초


## pickle 모듈
- 모든 파이썬 객체(데이터)를 binary로 파일에 저장/읽기 하는 함수 제공
- 활용도 높음
- `dump(저장할객체,fw)` 파일에 쓰기 함수
- `load(fr)`: 파일로부터 읽는 함수
- 확장자 `.pkl`을 관례적으로 줌
- `open(파일이름,"wb"/"rb")`로 쓰거나 읽을 수 있음 

In [7]:
names = ["영수","영희","민수"]
ages = [12,32,34]
addresses = ["서울", "대전", "대구"]

In [2]:
import pickle

In [3]:
# 리스트를 기계어 형식(binary) 으로파일에 저장 
with open("names.pkl","wb") as fw:
    pickle.dump(names,fw)

In [None]:
#with open('names2.txt', 'wt') as fw2:
#    fw2.write(str(names))

In [4]:
# 리스트 그대로 읽기
with open("names.pkl", "rb") as fr:
    name2 = pickle.load(fr)

In [6]:
name2[0]

'영수'

In [25]:
with open("member.pkl","wb") as fw:
    pickle.dump(names, fw)
    pickle.dump(ages, fw)
    pickle.dump(addresses, fw)

dump 한 순서대로 읽음 

In [26]:
with open("member.pkl","rb") as fr:
    n = pickle.load(fr)
    a = pickle.load(fr)
    addr = pickle.load(fr)
print(n)
print(a)
print(addr)

['영수', '영희', '민수']
[12, 32, 34]
['서울', '대전', '대구']


EOFError: end of file error - 더이상 읽을 것이 없음

In [27]:
with open("member.pkl","rb") as fr:
    n = pickle.load(fr)
    a = pickle.load(fr)
    addr = pickle.load(fr)
    t = pickle.load(fr)
print(n)
print(a)
print(addr)

EOFError: Ran out of input

In [28]:
with open("member.pkl","rb") as fr:
    while True:
        try:
            print(pickle.load(fr))
        except:
            break
print ("종료")

['영수', '영희', '민수']
[12, 32, 34]
['서울', '대전', '대구']
종료


In [45]:
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
    def __str__(self):
        return '이름:{}, 나이:{}'.format(self.name, self.age)

In [55]:
Person

__main__.Person

In [62]:
p1 = (Person("영수",20))
p2 = (Person("영희",30))
p1

<__main__.Person at 0x1ddaf280be0>

In [63]:
with open("member1.pkl","wb") as fw:
    pickle.dump(p1, fw)
    pickle.dump(p2, fw)

In [64]:
with open("member1.pkl","rb") as fr:
    m1 = pickle.load(fr)
    m2 = pickle.load(fr)

In [66]:
m1.name


'영수'

In [58]:
#답)
p1 = Person("홍길동",20)

import pickle
with open("p.pkl","wb") as fw:
    pickle.dump(p1,fw)

In [59]:
import pickle
with open("p.pkl","rb") as fr:
    p1_copy = pickle.load(fr)

In [61]:
p1_copy.name

'홍길동'

여러사람들 한꺼번에 리스트로

In [67]:
p1 = Person("홍길동1",20)
p2 = Person("홍길동2",20)
p3 = Person("홍길동3",20)
p4 = Person("홍길동4",20)
p_list = [p1,p2,p3,p4]

In [69]:
import pickle
with open("p_list.pkl","wb") as fw:
    pickle.dump(p_list,fw)

In [71]:
import pickle
with open("p_list.pkl","rb") as fr:
    p_list_copy = pickle.load(fr)

In [76]:
str(p_list_copy[0])

'이름:홍길동1, 나이:20'

In [77]:
str(p_list_copy[0].name)

'홍길동1'