# 1. 파일 입출력 (I / O) 

* 파일 입출력이라는 개념을 먼저 알기전에 간단한 CS 지식을 살펴보겠습니다.
* 우리는 키보드로 입력하고 모니터로 입력한 정보를 출력하고 있습니다.
* 키보드의 전기신호가 CPU와 RAM에 의해 처리가 되어 출력장치인 모니터로 신호를 보내 우리가 화면을 볼 수 있습니다.
* 이러한 input / output을 도와주는것이 스트림 (Stream) 이라는 것 입니다.
* 스트림은 모든 입출력장치에 사용됩니다. 모니터 뿐만 아니라 프린터, 마우스, 네트워크, 메모리, 하드디스크 등등 많은 하드웨어 장치들이 스트림을 사용합니다.
* 이러한 스트림은 운영체제단에서 관리가 됩니다.

<img src='https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F9Mpj5%2FbtqzkQqkKMx%2FeB9hVJe6pyqkHMpe6avoJ0%2Fimg.png'>

* 우리가 파이썬에서 ```print()``` 코드를 작성하면, 데이터는 입력스트림에 의해 메모리에 저장이 되고, 출력스트림에 의해 모니터로 출력됩니다.
* 하지만 작성한 코드가 종료되면 ```print()``` 로 출력된 데이터는 사라지게 됩니다. (왤까요??)
* 즉 우리가 어떠한 데이터를 저장하고 싶으면 출력스트림을 저장소 (SSD, HDD)와 연결하여 데이터를 출력해야 합니다.
* 파이썬에서 이러한 스트림을 제어해주는 함수가 바로 ```open()```, ```close()``` 가 되겠습니다.

In [3]:
# 기본 아웃스트림 제어 (Output Stream)
text = 'Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.'
out_stream = open('./ipsum', 'w')
out_stream.write(text)
out_stream.close()

In [5]:
# 기본 인스트림 제어 (Input Stream)
in_stream = open('./ipsum', 'r')
data = in_stream.readline()
print(data)
in_stream.close()

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.


In [46]:
# 기본 아웃스트림 제어 2
text2 = [x for x in text.split(' ')]
out_stream = open('./ipsum2', 'w', newline='\n')
out_stream.writelines(text2)
out_stream.close()

In [44]:
# 기본 인스트림 제어 2
in_stream = open('./xfile', 'r')
data = in_stream.readlines()
print(data)
for datum in data:
    print(datum)
in_stream.close()

['x\n', 'xx\n', 'xxx\n', 'xxxx\n', 'xxxxx\n', 'xxxxxx\n', 'xxxxxxx']
x

xx

xxx

xxxx

xxxxx

xxxxxx

xxxxxxx


In [34]:
# 기본 스트림 제어 3
data = 'xxxxxxxX'
with open('./xfile', 'a') as f:
    f.write('\n')
    f.write(data)

In [52]:
# 다른 파일 형식의 스트림 제어
import csv
my_list = [1,2,3,4,5,6,6,7,8,9,10]
with open('./sample.csv', 'w') as f:
    head = csv.DictWriter(f, fieldnames=['data'])
    data = csv.writer(f, delimiter='\n')
    head.writeheader()
    data.writerow(my_list)

In [53]:
to_append = ['a','b','c','d','e','f','g']
with open('./sample.csv', 'a') as f:
    data = csv.writer(f, delimiter='\n')
    data.writerow(to_append)

In [65]:
# 다른 파일 형식의 스트림 제어 2
import json
your_dict = {'one':1, 'two':2, 'three':3}
with open('./sample.json', 'w') as f:
    json.dump(your_dict, f, indent=4)

In [81]:
import io
io.StringIO()
io.BytesIO()    

<_io.BytesIO at 0x7f777dc14ea0>

# 2. 버퍼

* 위에서 살펴 보앗듯이 아웃스트림을 이용해 외부기억장치에 저장된 데이터는 ```read()```를 이용해 불러 올 수 있었습니다.
* 파이썬은 아래 3개의 함수를 사용해 파일을 읽을 수 있습니다:
    1. ```read()``` 파일의 전체 내용을 읽어와 하나의 문자열로 사용한다.
    2. ```readlines()``` 파일의 전체 내용을 읽어와서 라인 단위로 잘라 문자열의 리스트로 만들 수 있다.
    3. ```readline()``` 파일의 내용을 한줄씩 읽어와 처리한다.
* 실제로는 ```readline()```을 제일 많이 사용하며, 대체적으로 ```for ... in ...``` 구문으로 한줄씩 데이터를 읽어드립니다.
* 이러면 한 줄 단위로 데이터가 처리되기 때문에 메모리 낭비가 없으며 메모리가 터질일이 없습니다.
* 하지만 읽어들이는 데이터가 내 컴퓨터의 메모리보다 크고 개행문자('\n') 가 없어서 한줄씩 읽을수가 없다면?
* 이러한 파일들은 한번에 처리할 수 없기때문에 일정 이상의 크기 (bytes, megabyte 등의 단위)로 잘라서 읽어야 합니다.
* 이렇게 데이터를 일정한 크기로 잘라내 임시로 보관하는것을 버퍼 (buffer) 라고 합니다.