In [1]:
# 1. 텍스트 파일 쓰기 : write()
# write() 함수는 파일에 쓴 바이트수를 반환한다.
# 또한, print() 함수처럼 스페이스나 줄바꿈을 추가하지 않는다.
poem = '''There was a young lady named Bright,
        Whose speed was far faster than light;
        She started one day
        In a relative way
        And returned on the previous night.'''
len(poem)

181

In [2]:
fout = open("relativity", "wt")
fout.write(poem)
fout.close()

In [3]:
# print()함수를 이용한 텍스트 파일 만들기
fout = open("relativity1", "wt")
print(poem, file = fout)
fout.close()

In [6]:
# 파일에 쓸 문자열이 크면 특정 단위(chunk)로 나누어서 파일에 쓴다.
fout = open("relativity", "wt")
size = len(poem)
offset = 0
chunk = 100
while True:
    if offset > size:
        break
    fout.write(poem[offset : offset + chunk])
    offset += chunk

In [7]:
fout.close()

In [8]:
# 만약 relativity 파일이 중요하다면, 모드 x를 사용하여 파일을 덮어쓰지 않도록 한다.
fout = open("relativity", "xt")

FileExistsError: [Errno 17] File exists: 'relativity'

In [9]:
# 이를 다음과 같이 예외로 처리할 수 있다.
try:
    fout = open("relativity", "xt")
    fout.write("stomp stomp stomp")
except FileExistsError:
    print("relativity already exists!. That was a close one.")

relativity already exists!. That was a close one.


In [10]:
# 2. 텍스트 파일 읽기 : read(), readline(), readlines()
fin = open("relativity", "rt")
poem = fin.read()
fin.close()
len(poem)

181

In [11]:
# 한 번에 얼마만큼 읽을 것인지 크기를 제한할 수 있다.
# 파일을 다 읽고 끝에 도달하면, read() 함수는 빈 문자열('')을 반환한다.
poem = ''
fin = open("relativity", "rt")
chunk = 100
while True:
    fragment = fin.read(chunk)
    if not fragment:
        break
    poem += fragment
fin.close()
len(poem)

181

In [12]:
# readline() 함수를 사용하면 파일을 라인 단위로 읽을 수 있다.
# 다음 예제는 파일의 각 라인을 poem 문자열에 추가하여 원본 파일의 문자열을 모두 저장한다.
poem = ''
fin = open("relativity", "rt")
while True:
    line = fin.readline()
    if not line:
        break
    poem += line
fin.close()
len(poem)

# 텍스트 파일의 빈 라인의 길이는 1이고("\n"), 이것을 True로 인식한다.
# 파일 읽기의 끝에 도달했을때 readline()함수 또한 False로 간주하는 빈 문자열을 반환한다.

181

In [13]:
# 텍스트 파일을 가장 읽기 쉬운 방법은 이터레이터(iterator)이다.
# 이터레이터는 한 번에 한 라인씩 반환한다.
poem = ''
fin = open("relativity", 'rt')
for line in fin:
    poem += line
fin.close()
len(poem)

181

In [15]:
# readlines() 호출은 한 번에 모든 라인을 읽고, 한 라인으로 된 문자열들의 리스트를 반환한다.
fin = open("relativity", "rt")
lines = fin.readlines()
fin.close()
print(len(lines), "lines read")

5 lines read


In [16]:
for line in lines:
    print(line, end = '')

There was a young lady named Bright,
        Whose speed was far faster than light;
        She started one day
        In a relative way
        And returned on the previous night.

In [17]:
# 3. 이진 파일 쓰기 : write()
# 모드에 'b'를 포함시키면 파일을 이진 모드로 연다. 이 경우 바이트를 읽고 쓸 수 있다.
# 0 ~ 255까지의 256바이트 값을 생성한다.
bdata = bytes(range(0, 256))
len(bdata)

256

In [18]:
# 이진 모드로 파일을 열고 한 번에 데이터를 쓰기
fout = open("bfile", "wb")
fout.write(bdata)
fout.close()

In [19]:
# write() 함수는 파일에 쓴 바이트 수를 반환한다.
# 텍스트 파일처럼 특정 단위(chunk)로 이진 데이터를 쓸 수 있다.
fout = open('bfile', 'wb')
size = len(bdata)
offset = 0
chunk = 100
while True:
    if offset > size:
        break
    fout.write(bdata[offset : offset + chunk])
    offset += chunk
    
fout.close()

In [20]:
# 4. 이진 파일 읽기 : read()
fin = open('bfile', 'rb')
bdata = fin.read()
len(bdata)
fin.close()

In [21]:
# 5. 자동으로 파일 닫기 : with()
# 파이썬에는 파일을 여는 것과 같은 일을 수행하는 컨텍스트 매니저(context manager)가 있다.
with open("relativity2", "wt") as fout:
    fout.write(poem)

In [22]:
# 6. 자료구조를 파일로 저장하는 것을 직렬화(serialization)라고 한다.
# JSON과 같은 형식은 파이썬 프로그램에서 모든 데이터 타입을 직렬화하는 컨버터가 필요하다.
# 파이썬은 바이너리 형식으로 된 객체를 저장하고 복원할 수 있는 pickle 모듈을 제공한다.
import pickle
import datetime
now1 = datetime.datetime.utcnow()
pickled = pickle.dumps(now1)
now2 = pickle.loads(pickled)
now1

datetime.datetime(2019, 4, 5, 10, 20, 17, 10977)

In [23]:
now2

datetime.datetime(2019, 4, 5, 10, 20, 17, 10977)

In [24]:
# pickle은 우리가 만든 클래스와 객체에서도 작동한다. 
# 객체를 문자열로 취급할 때 "tiny" 문자열을 반환하는 Tiny 클래스를 정의
import pickle
class Tiny():
    def __str__(self):
        return 'tiny'
obj1 = Tiny()
obj1

<__main__.Tiny at 0x10c26ab38>

In [25]:
str(obj1)

'tiny'

In [26]:
# pickled는 직렬화된 obj1 객체의 이진 문자열이다.
pickled = pickle.dumps(obj1)
pickled

b'\x80\x03c__main__\nTiny\nq\x00)\x81q\x01.'

In [28]:
# obj1의 복사본을 만들기 위해 pickled를 다시 역직렬화하여 obj2 객체로 변환했다.
# 결국, dump()로 직렬화(pickle)하고, load()로 역직렬화(unpickle) 한다.
obj2 = pickle.loads(pickled)
obj2

<__main__.Tiny at 0x10c26a588>

In [29]:
str(obj2)

'tiny'