# 5. I/O (Input / Output) 

## I/O란?


- 프로그램 입장에서 들어오는 모든 데이터를 input, 나가는 모든 데이터를 output이라고 한다.


- 사용자로 부터 키보드으로 입력받는 것을 stdin이라고 하며, 사용자에게 다시 모니터으로 출력되는 것을 stdout이라고 한다.

> 통상적으로는 Unix 환경(터미널 환경)에서 부르던 용어인데, 프로그래밍에 자주 등장하기 때문에 소개한다.


- 프로그램은 메인 메모리 상에 존재하기 때문에, 스토리지로부터 파일을 불러오는 것도 input이고, 프로그램의 결과를 스토리지에 저장하는 것도 output이다. 이러한 작업을 file I/O로 통칭한다.


- 파이썬에서 stdin/out을 사용하는 방법과 file I/O를 사용하는 방법에 대해 간단하게 알아본다.

## 5.1 STDIN / STDOUT (Standard IN, Standard OUT)

- 파이썬은 input()을 통해서 stdin을 사용자로부터 입력받을 수 있다.


- 파이썬은 print()를 통해서 stdout을 사용자에게 출력할 수 있다.

In [3]:
# a에 키보드로 입력받은 값을 할당하고 출력해본다.
a = input("사용자로 부터 입력을 받습니다 : ")
a

사용자로 부터 입력을 받습니다 : ㅇ라미ㅓ아리어ㅏㅇ리ㅓ미라


'ㅇ라미ㅓ아리어ㅏㅇ리ㅓ미라'

- 파이썬에서는 stdin은 무조건 문자열 타입으로 들어온다. 이를 type casting을 통해서 다른 데이터 타입으로 바꾸어 사용해야 한다.

In [4]:
a = int(input()) # 입력받는 값을 숫자라고 가정한 경우.
print(a)
print(type(a))

34
34
<class 'int'>


In [5]:
a = int(input()) # 입력받는 값을 숫자라고 가정했는데 문자열이 들어오면 에러가 난다. 이 경우는 type casting이 실패한 경우이다.
print(a)
print(type(a)) 

hello world


ValueError: invalid literal for int() with base 10: 'hello world'

- 입력이 문자열이기 때문에 fancy하게 input을 처리할 수 있는 방법이 있다.

#### Q. 만약에 stdin으로 여러 개의 숫자가 들어오는 경우, 입력의 format을 알고 있다고 가정했을 때, 이를 효과적으로 처리할 수 있을까?

In [14]:
# 이는 숫자를 2개로 가정한 경우
a, b = input("콤마를 기준으로 숫자 2개를 입력받습니다.").split(',')
print(a)
print(b)

콤마를 기준으로 숫자 2개를 입력받습니다.3,4
3
4


In [18]:
# 이와 같은 표현을 list comprehension이라고 한다.
[int(x) for x in input("콤마를 기준으로 숫자 여러 개를 입력받습니다.").split(',')]

콤마를 기준으로 숫자 여러 개를 입력받습니다.1,2,3,4,5,6,7,8,9


[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [20]:
# 위의 코드는 아래와 같다. 위의 코드가 훨씬 간단한 것을 확인할 수 있다. 익숙해져서 list comprehension을 사용하도록 하자.
L = []
data = input("콤마를 기준으로 숫자 여러 개를 입력받습니다.").split(',')
for number in data:
    L.append(int(number))
L

콤마를 기준으로 숫자 여러 개를 입력받습니다.1,2,3,4,5,6,7,8,9


[1, 2, 3, 4, 5, 6, 7, 8, 9]

## 5.2 File I/O

- 파이썬에서는 open()을 이용해서 파일을 손쉽게 열 수 있다.


- open()을 통해 파일을 열고 난뒤엔, close()를 통해서 닫아줘야 한다. ( close를 하지 않으면 jupyter가 계속해서 파일을 점유하고 있게 되어, 시스템 낭비가 일어난다. 자세한 얘기는 생략)


- open() 함수는 다양한 옵션을 제공하지만 기본적으로는 txt파일을 여는 것을 기본으로 가정한다.



- 다른 타입의 파일을 열기 위해선 다른 라이브러리들이 필요하다. 

e.g. csv, excel 파일을 열기 위해 pandas, csv, openpyxl 라이브러리를 사용할 수 있다.

e.g. png, jpg 파일을 열기 위해 PIL, opencv 라이브러리를 사용할 수 있다.

e.g. pk, pkl 파일을 열기 위해 pickle 라이브러리를 사용할 수 있다.

> 텍스트 파일을 여는 방법에는 read(), readline(), readlines(), for문을 이용한 방법이 있다. 코드를 통해 각 방법의 차이를 알아보자.

In [24]:
# f.read()를 통해 data 폴더안에 있는 test.txt를 read mode로 열어봅니다.
with open("data/test.txt", "r", encoding="utf-8") as f:
    data = f.read()
data

'아\n휴\n아이구\n아이쿠\n아이고\n어\n나\n우리\n저희\n따라\n의해\n을\n를\n에\n의\n가\n으로\n로\n에게\n뿐이다\n의거하여\n근거하여\n입각하여\n기준으로\n예하면\n예를 들면\n예를 들자면'

In [26]:
# f.readline()를 통해 data 폴더안에 있는 test.txt를 read mode로 열어봅니다.
with open("data/test.txt", "r", encoding="utf-8") as f:
    data = f.readline()
data

'아\n'

In [27]:
# f.readlines()를 통해 data 폴더안에 있는 test.txt를 read mode로 열어봅니다.
with open("data/test.txt", "r", encoding="utf-8") as f:
    data = f.readlines()
data

['아\n',
 '휴\n',
 '아이구\n',
 '아이쿠\n',
 '아이고\n',
 '어\n',
 '나\n',
 '우리\n',
 '저희\n',
 '따라\n',
 '의해\n',
 '을\n',
 '를\n',
 '에\n',
 '의\n',
 '가\n',
 '으로\n',
 '로\n',
 '에게\n',
 '뿐이다\n',
 '의거하여\n',
 '근거하여\n',
 '입각하여\n',
 '기준으로\n',
 '예하면\n',
 '예를 들면\n',
 '예를 들자면']

In [29]:
# for문을 통해 data 폴더안에 있는 test.txt를 read mode로 열어서 출력해봅니다.
data = []
with open("data/test.txt", "r", encoding="utf-8") as f:
    for line in f:
        data.append(line)
data

['아\n',
 '휴\n',
 '아이구\n',
 '아이쿠\n',
 '아이고\n',
 '어\n',
 '나\n',
 '우리\n',
 '저희\n',
 '따라\n',
 '의해\n',
 '을\n',
 '를\n',
 '에\n',
 '의\n',
 '가\n',
 '으로\n',
 '로\n',
 '에게\n',
 '뿐이다\n',
 '의거하여\n',
 '근거하여\n',
 '입각하여\n',
 '기준으로\n',
 '예하면\n',
 '예를 들면\n',
 '예를 들자면']

#### Q. test.txt를 열어서 한글자짜리를 다 지우고 다시 저장하고 싶다. 어떻게 해야할까?

In [59]:
output = []
# test.txt를 read mode로 열고 할 일이 끝나면 자동으로 닫는다.
with open("data/test.txt", 'r', encoding='utf-8') as f:
    for line in f:
        line = line.strip()
        if len(line) > 1:
            output.append(line)
    # 공백을 제거한 텍스트를 한 줄씩 output list에 저장한 뒤,

with open("data/result.txt", 'w') as f:
    for line in output:
        print(line, file=f)
# result.txt로 output list에 있는 내용을 저장하기 위해 write mode로 열었다.
    # f.write()도 있는데, \n에 대해서 추가적인 처리를 해야해서 쓰지 않았다.

In [61]:
data = []
with open("data/result.txt", 'r') as f:
    for line in f:
        data.append(line)
for line in data:
    print(line)

아이구

아이쿠

아이고

우리

저희

따라

의해

으로

에게

뿐이다

의거하여

근거하여

입각하여

기준으로

예하면

예를 들면

예를 들자면



### (OPTIONAL) pickle 라이브러리를 통해서 파이썬 object 자체를 저장하기

In [None]:
import pickle

with open("data/test.pk", "wb") as f:
    pickle.dump(output, f)
    
with open("data/test.pk", "rb") as f:
    output = pickle.load(f)

output