# Persistant

## flat file 

data files that contain records with no structured relationships between the records and there's also no structure for indexing. (txt, csv, tsv)
- text
  - the new line character (\n) is default EOL terminator.
- binary
  - no EOL character

## open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None) 

In [51]:
file = open('hello.txt', 'w')    
file.write('Hello, world!')      
file.close()               

| 파일 모드 	| 기능 	| 설명 	|
|-----------	|------------------------	|-------------------------------------------------------------------------------------------------------------------------------------------	|
| r 	| 읽기 전용 	| 파일을 읽기 전용으로 열기. 단, 파일이 반드시 있어야 하며 파일이 없으면 에러 발생 	|
| w 	| 쓰기 전용 	| 쓰기 전용으로 새 파일을 생성. 만약 파일이 있으면 내용을 덮어씀 	|
| a 	| 추가 	| 파일을 열어 파일 끝에 값을 이어 씀. 만약 파일이 없으면 파일을 생성 	|
| x 	| 배타적 생성(쓰기) 	| 파일을 쓰기 모드로 생성. 파일이 이미 있으면 에러 발생 	|
| r+ 	| 읽기/쓰기 	| 파일을 읽기/쓰기용으로 열기. 단, 파일이 반드시 있어야 하며 파일이 없으면 에러 발생 	|
| w+ 	| 읽기/쓰기 	| 파일을 읽기/쓰기용으로 열기. 파일이 없으면 파일을 생성하고, 파일이 있으면 내용을 덮어씀 	|
| a+ 	| 추가(읽기/쓰기) 	| 파일을 열어 파일 끝에 값을 이어 씀. 만약 파일이 없으면 파일을 생성. 읽기는 파일의 모든 구간에서 가능하지만, 쓰기는 파일의 끝에서만 가능함 	|
| x+ 	| 배타적 생성(읽기/쓰기) 	| 파일을 읽기/쓰기 모드로 생성. 파일이 이미 있으면 에러 발생 	|
| t 	| 텍스트 모드 	| 파일을 읽거나 쓸 때 개행 문자 \n과 \r\n을 서로 변환 	|
| b 	| 바이너리 모드 	| 파일의 내용을 그대로 읽고, 값을 그대로 씀 	|

In [28]:
file = open('hello2.txt', 'w')    
file.close() 
file.write('Hello, world!')      

ValueError: I/O operation on closed file.

In [29]:
file = open('hello.txt', 'r')    
s = file.read()                  
print(s)                         
file.close()                     

Hello, world!


In [30]:
file = open('hello.txt', 'r')    
file.close()                     
s = file.read()                  
print(s)                         

ValueError: I/O operation on closed file.

In [31]:
files = []
for _ in range(100000):
    files.append(open('foo.txt', 'w'))

ERROR:root:Internal Python error in the inspect module.
Below is the traceback from this internal error.



Traceback (most recent call last):
  File "/usr/local/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 2910, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "<ipython-input-31-bd12c407fa52>", line 3, in <module>
    files.append(open('foo.txt', 'w'))
OSError: [Errno 24] Too many open files: 'foo.txt'

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/usr/local/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 1828, in showtraceback
    stb = value._render_traceback_()
AttributeError: 'OSError' object has no attribute '_render_traceback_'

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/usr/local/lib/python3.6/site-packages/IPython/core/ultratb.py", line 1090, in get_records
  File "/usr/local/lib/python3.6/site-packages/IPython/core/ultratb.py", line 311, in wrapped
  File "/usr/local/lib/python3.6/

OSError: [Errno 24] Too many open files: 'foo.txt'

파이썬에는 사용이 끝난 메모리를 정리해주는 가비지 컬렉터가 있어서 파일을 닫지 않아도 가비지 컬렉터가 파일을 닫아줍니다. 하지만 프로그래머가 파일을 직접 닫아야 하는 이유는 다음과 같습니다.

- 너무 많은 파일을 열어 두면 그만큼 메모리 공간을 차지하므로 성능에 영향을 줄 수 있습니다.
- 파일을 닫지 않으면 데이터가 쓰기가 완료되지 않을 수도 있습니다. 운영체제는 파일을 처리할 때 성능을 위해서 데이터를 버퍼(임시 공간)에 저장한 뒤 파일에 씁니다. 때에 따라서는 파일이 닫히는 시점에 버퍼의 내용이 파일에 저장됩니다.
- 이론적으로 운영체제에서 열 수 있는 파일의 개수는 한계가 있습니다.
- 운영체제에 따라 파일을 열었을 때 파일을 잠금 상태로 처리하는 경우가 있습니다. 실질적으로 파일 처리가 끝났더라도 파일을 닫지 않으면 다른 프로그램에서 파일을 사용할 수 없는 상태가 됩니다.

보통은 파일을 닫지 않아도 큰 문제가 없습니다. 하지만 실무에서는 사소한 실수로도 큰 문제가 발생하는 경우가 있으므로 파일을 정확히 닫는 습관을 기르는 것이 좋습니다.

In [9]:
%%writefile sun.txt
When, in disgrace with fortune and men's eyes,
I all alone beweep my outcast state,
And trouble deaf heaven with my bootless cries,
And look upon myself and curse my fate,

Overwriting sun.txt


In [10]:
a = open('sun.txt') # generator

In [3]:
a.read()    

"When, in disgrace with fortune and men's eyes,\nI all alone beweep my outcast state,\nAnd trouble deaf heaven with my bootless cries,\nAnd look upon myself and curse my fate,"

In [13]:
# reline으로 파일 열면 file객체도 iterator임.

a.readline()

'And trouble deaf heaven with my bootless cries,\n'

In [5]:
a.readlines()

[]

In [7]:
b = open('sun.txt')

In [8]:
b.readline()

# \n은 개행문자. EOF의 개념임.
# \n 없애는 skill
# 1) ent

"When, in disgrace with fortune and men's eyes,\n"

## with

In [32]:
with open('sun.txt', 'r') as file:    
    s = file.read()                 
    print(s)      

When, in disgrace with fortune and men's eyes,
I all alone beweep my outcast state,
And trouble deaf heaven with my bootless cries,
And look upon myself and curse my fate,


In [33]:
with open('sun2.txt', 'w') as file: 
    for i in range(3):
        file.write('Hello, world! {0}\n'.format(i))

In [34]:
lines = ['문근영\n', 'only one.\n']
 
with open('moon.txt', 'w') as file: 
    file.writelines(lines)

In [35]:
with open('moon.txt', 'r') as file:    
    lines = file.readlines()
    print(lines)

['문근영\n', 'only one.\n']


In [37]:
with open('moon.txt', 'r') as file:    
    line = file.readline()
    print(line.strip('\n'))        
    while line != '':
        line = file.readline()
        print(line.strip('\n'))    

문근영
only one.



In [39]:
with open('moon.txt', 'r') as file:   
    for i in file:
        print(i, end='')

문근영
only one.


In [41]:
# with도 비슷한 구조. 이래서 자동으로 close()가 실행되기때문에. 에러가 안남.
# 가비지컬렉션이 자동으로 해주면 에러 안난것.

class File:
    def __init__(self, filename, mode):
        self.filename = filename
        self.mode = mode

    def __enter__(self):
        self.open_file = open(self.filename, self.mode)
        return self.open_file

    def __exit__(self, *args):
        self.open_file.close()

files = []
for _ in range(10000):
    with File('foo.txt', 'w') as infile:
        infile.write('foo')
        files.append(infile)

| 메서드 	| 설명 	|
|--------------------------	|------------------------------------------------------------------------	|
| read([n]) 	| 파일에서 문자열을 읽음 	|
| write(string or byte_string)	| 파일에 문자열을 씀 	|
| readline([n]) 	| 파일의 내용을 한 줄 읽음 	|
| readlines() 	| 파일의 내용을 한 줄씩 읽어서 리스트로 가져옴 	|
| writelines(문자열리스트) 	| 파일에 리스트의 문자열을 씀, 리스트의 각 문자열에는 \n을 붙여주어야 함 	|

## pickle

In [24]:
# 엄~~~청난 단점이 있음.
# 배열-> struct(자료구조.) -> 기본적으로 제공하는 자료구조가 풍부햇음. list, tuple, set, namedtuple, range, ...
# open을이용해서 열면 자료구조가 없어짐. 
# dict형태로 저장하고싶었는데, 자료구조는 없어지고 그냥 형태만 보존할 뿐..


# str형
name = '문근영'
# dict형
scores = {'korean': 90, 'english': 95, 'mathematics': 85, 'science': 82}

In [25]:
import pickle

file = open('0718(수)_오후3_open, with.ipynb')
file

# cPickle없어지고 _pickle이 생김. 속도빠름. 내부패키지가 되어
# json과 같이 생각하면됨.(JSON은 제일중요한 두가지 dump(), load())
# DUMP : 파이썬과 JSON 연결하는애.
# LOAD : 불러들이는애. 어떻게 디코딩할거냐할땐 LOAD를쓰면됨.
# pickle도 dump 와 load임. + dumps() 까지 세가지!
# json 은 open할때 
# ipython형태 자체가 json임.
# ipython형은 open이 가능할까????????해봐. 된대.근데난안되.

<_io.TextIOWrapper name='0718(수)_오후3_open, with.ipynb' mode='r' encoding='cp949'>

In [22]:
file.text

AttributeError: '_io.TextIOWrapper' object has no attribute 'text'

In [26]:
with open('moon.pickle', 'wb') as file:    # 확장자 마음대로
    pickle.dump(name, file)
    pickle.dump(scores, file)

# moon.

In [28]:
with open('moon.pickle', 'rb') as file:    
    name = pickle.load(file)
    scores = pickle.load(file)
    print(name)
    print(scores)

문근영
{'korean': 90, 'english': 95, 'mathematics': 85, 'science': 82}


In [31]:
# ㅠㅠ
# JAVA에선 Serialiable 상속받아서 직렬화싴킴
# Python은 multi지원다해줌.

_io.BufferedReader

In [29]:
# dump와 load가 순서가 달라지면 오류났던적도잇엇음.

with open('moon.pickle', 'rb') as file:    
    scores = pickle.load(file)
    name = pickle.load(file)
    print(name)
    print(scores)

{'korean': 90, 'english': 95, 'mathematics': 85, 'science': 82}
문근영


In [48]:
# 객체를 그대로 살릴 수 있다.
# Pandas와 Keras에서도 pickle사용해서 중간값 저장하고 많이사용한다.
# but, 문제가 있어서 Keras에선 JSON씀.

with open('moon.pickle', 'rb') as file:    
    scores = pickle.load(file)
    print(name)

{'korean': 90, 'english': 95, 'mathematics': 85, 'science': 82}


| 메서드 	| 설명 	|
|-----------------------------	|-----------------------------	|
| pickle.load(파일객체) 	| 파일에서 파이썬 객체를 읽음 	|
| pickle.dump(객체, 파일객체) 	| 파일에 파이썬 객체를 저장 	|

In [33]:
# "dump" + "s"(string) 임.
# 사람이 읽을수잇게 string형태로 dump한거임.
# serializable을 어떻게 할 것인가?
# 뭐가 더 안전할것같애?
# picke데이터 encoding이 뭘까???????????????????도전! 어떻게하면 디코드시킬수잇으까?!

todo = ['write blog post', 'reply to email', 'read in a book']
pickled_data = pickle.dumps(todo)
print(pickled_data)

b'\x80\x03]q\x00(X\x0f\x00\x00\x00write blog postq\x01X\x0e\x00\x00\x00reply to emailq\x02X\x0e\x00\x00\x00read in a bookq\x03e.'


In [34]:
import chardet

In [36]:
type(pickled_data)

bytes

In [35]:
chardet.detect(pickled_data.content)

AttributeError: 'bytes' object has no attribute 'content'

In [4]:
restored_data = pickle.loads(pickled_data)

In [5]:
restored_data

['write blog post', 'reply to email', 'read in a book']

In [46]:
# 1번) 마지막에 close()를 해줘야함.

import pickle
 
name = 'Abder'
website = 'http://abder.io'
english_french = {'paper':'papier', 'pen':'stylo', 'car':'voiture'} # dictionary
tup = (31,'abder',4.0) # tuple
 
pickled_file = open('pickled_file.pickle', 'wb')
pickle.dump(name, pickled_file)
pickle.dump(website, pickled_file)
pickle.dump(english_french, pickled_file)
pickle.dump(tup, pickled_file)

# pickle_file.close() 꼭해줘야함.

In [40]:
#2)

from pickle import Pickler
 
name = 'Abder'
website = 'http://abder.io'
english_french = {'paper':'papier', 'pen':'stylo', 'car':'voiture'} # dictionary
tup = (31,'abder',4.0) # tuple
 
pickled_file = open('pickled_file.pickle', 'wb')
p = Pickler(pickled_file)
p.dump(name); p.dump(website); p.dump(english_french); p.dump(tup)
pickled_file.close()

In [47]:
# 1번) 안해주면 연속하는 작업에서 에러를 발생시킬 수 있음.

import pickle
 
pickled_file = open('pickled_file.pickle', 'rb')
 
name = pickle.load(pickled_file)
website = pickle.load(pickled_file)
english_french = pickle.load(pickled_file)
tup = pickle.load(pickled_file)
 
print('Name: ')
print(name)
print('Website:')
print(website)
print('Englsh to French:')
print(english_french)
print('Tuple data:')
print(tup)

Name: 
Abder
Website:
http://abder.io
Englsh to French:
{'paper': 'papier', 'pen': 'stylo', 'car': 'voiture'}
Tuple data:
(31, 'abder', 4.0)


In [39]:
#2)

from pickle import Unpickler
 
pickled_file = open('pickled_file.pickle', 'rb')
u = Unpickler(pickled_file)
name = u.load(); website = u.load(); english_french = u.load(); tup = u.load()
 
print('Name: ')
print(name)
print('Website:')
print(website)
print('English to French:')
print(english_french)
print('Tuple data:')
print(tup)

Name: 
Abder
Website:
http://abder.io
English to French:
{'paper': 'papier', 'pen': 'stylo', 'car': 'voiture'}
Tuple data:
(31, 'abder', 4.0)


## 과제)
### - 이미지 크롤링 : 르누아르? 샤갈, 모딜리아니 이미지
### - 그림추천. 
### - sqlLite로 저장해오기.
### - 이미지 저장하는 blob필드말고 base64로 이미지 변환하는거 이용하기.!

In [48]:
import base64

In [56]:
#data = base64.encode('캡쳐.PNG')
data = base64.encodebytes('캡쳐.PNG')
data = base64.encodestring('캡쳐.PNG')

TypeError: expected bytes-like object, not str

In [57]:
data = open("캡처.PNG")

# byte형태로 열었을거야.