# 파일과 예외

프로그램에서 많은 데이터를 저장하고 로드하는 방법을 학습하고 프로그램 실행 중에 생기는 에러를 관리하는 객체인 예외에 대해서도 배우겠습니다.

## 파일로 부터 데이터 읽기

텍스트 파일에는 날씨 데이터나 교통 데이터, 사회 경제적 데이터, 문화작품 등 많은 데이터를 저장할 수 있습니다. 파일에 저장된 정보를 다루기 위해서는 먼저 파일의 데이터를 메모리로 읽어와야 합니다. 파일 전체 내용 혹은 라인단위로 읽어올 수 있습니다.

### 파일 전체 읽기
파일에 접근하기 위해서는 파이썬 내장함수인 open() 함수를 사용합니다. open() 함수는 파일을 열어서 파일의 시작 위치를 반환(파일객체에 접근)하므로 변수로 받아서 파일에 접근할 수 있습니다. 

파일 전체 데이터를 읽어오기 위해서는 파일객체의 메서드인 read() 메서드를 호출하면 됩니다.

주의할 것은 파일을 열고 작업을 마친후에는 파일 객체의 close() 메서드를 호출하여 반드시 닫아줘야 합니다. 열린 파일을 닫지 않으면 파일이 망가질수 있기 때문입니다. 

In [2]:
file_object = open('pi_digits.txt', 'r')
contents = file_object.read()

In [6]:
print(contents)
file_object.close()

3.1415986535
  8979323846
  2643383279  


with 블록을 사용하면 파이썬이 오픈한 파일을 알아서 닫아주므로 더 간편하고 안전하게 파일을 다룰 수 있습니다. 

In [8]:
with open('pi_digits.txt', 'r') as file_object:
    contents = file_object.read()

print(contents)

3.1415986535
  8979323846
  2643383279  


### 파일 경로 지정

open() 함수에 pi_digits.txt 같은 단순한 파일 이름만 전달하면 현재 실행중인 주피터 노트북 파일이 저장된 디렉터리에서 해당 파일을 찾습니다. 

가끔은 다른 디렉터리에서 파일을 찾아야 할 때도 있습니다. 현재 작업디렉토리에 text_files 폴더를 생성하고 numbers.txt 파일을 다음과 같이 생성하세요

100 200 300
400 500 600
700 800 900

이 경우 그냥 open() 함수에 파일 이름만 넘기면 파이썬이 현재 작업중인 디렉토리에서 파일을 찾게 되므로 파일을 찾을 수 없다는 경고가 발생합니다. 다음과 같이 파일이 들어 있는 상대경로를 적어서 파일을 오픈할 수 있습니다.

In [9]:
with open ('text_files/numbers.txt',) as file_object:
    contents = file_object.read()

print(contents)

100 200 300
400 500 600
700 800 900


상대경로는 현재 작업중인 디렉토리에 상대적인 위치를 찾는 것입니다. 이에 반해 절대 경로는 현재 작업중인 디렉토리에 상관없이 파일이 들어 있는 전체 경로를 적어주는 것을 말합니다. 
절대 경로는 보통 상대 경로보다 길기 때문에 변수에 할당하고 그 변수를 open()함수에 넘기는 방식으로 사용하는 것이 좋습니다. 

In [14]:
file_path = 'c:\\사용자\\admin\\Python_Day_10\\text_files\\numbers.txt'

with open(file_path) as file_object:
    contents = file_object.read()
print(contents)

FileNotFoundError: [Errno 2] No such file or directory: 'c:\\사용자\\admin\\Python_Day_10\\text_files\\numbers.txt'

### 파일에서 라인 단위로 데이터 읽어오기

파일의 정보를 찾아보거나 파일에 들어 있는 텍스트를 수정해야 하는 등 한 행씩 살펴봐야 할 때도 있습니다. 예를 들어 날씨 데이터가 들어있는 파일을 읽고 날씨 설명에 특정 문자가 포함된 행을 찾아 작업한다던지 뉴스 리포트에서 특정 태그가 있는 행을 다른 형식으로 변경해야 하는 경우 등 이런 경우는 자주 발생합니다.

파일 객체에 대해 for문을 사용하여 각 행을 한 번에 한 행씩 살펴볼 수 있습니다.

In [13]:
filename = 'pi_digits.txt'

with open(filename) as file_object:
    for line in file_object:
        print(line.rstrip())

3.1415986535
  8979323846
  2643383279


### 파일에서 행 단위로 데이터를 가져와 리스트에 저장하는 readlines()메서드 

with 문을 사용하여 파일을 열면 반환받은 파일 객체는 with 블록에서만 사용할 수 있습니다.
with 블록 밖에서도 파일 데이터에 접근하기 위해서는 블록 안에서 파일 행들을 리스트에 저장하고 그 리스트를 통해 작업해야 합니다.

In [16]:
filename = 'pi_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()

print(lines)

for line in lines:
    print(line.rstrip())

['3.1415986535\n', '  8979323846\n', '  2643383279  ']
3.1415986535
  8979323846
  2643383279


### 파일 데이터 사용

파일의 데이터를 메모리에 읽어 들이면 데이터를 사용할 수 있습니다. 위에서 읽어들인 파이값에 대해 숫자를 공백 없이 단 하나의 문자열로 만들어 보겠습니다.

In [20]:
filename = 'pi_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()

# 연결한 문자열을 저장할 빈 문자열을 생성합니다.
pi_string = ''
for line in lines:
    pi_string += line.rstrip()

print(pi_string)


3.1415986535  8979323846  2643383279


문제:

좋아하는 노래의 가사를 웹에서 검색하여 복사한후 favorite_song.txt 라는 파일을 생성하여 붙여 넣고 저장하세요. 이 파일을 open 함수를 사용하여 여세요. 만약 한글이 깨지는 등 문제가 발생하면 open(filename, encoding='utf-8')과 같은 옵션을 주세요. 파일 내용을 읽어서 세 번 출력하는 프로그램을 작성하세요. 한 번은 파일 전체를 출력하는 방법, 한 번은 파일 객체에 루프를 적용하여 출력하는 방법, 한번은 리스트에 저장하고 with 블록 밖에서 출력하는 방법을 사용하세요.

In [25]:
file_name = 'favorite_song.txt'

print("--- 파일 전체 출력: \n")
with open(file_name, encoding = 'utf-8') as file_object:
    contents = file_object.read()

print(contents)

print("\n--- 파일 객체에 루프를 사용하여 출력: \n")
with open(file_name, encoding = 'utf-8') as file_object:
    for line in file_object:
        print(line.rstrip())

print("\n--- 리스트에 저장하고 with 블록 밖에서 출력: \n")
with open(file_name, encoding = 'utf-8') as file_object:
    lines = file_object.readlines()

for line in lines:
    print(line.rstrip())

--- 파일 전체 출력: 

何処に行けばいい 貴方と離れて
今は過ぎ去った 時間に問い掛けて
長すぎた夜に 旅立ちを夢見た
異国の空見つめて 孤独を抱きしめた
流れる涙を 時間の風に重ねて
終わらない貴方の 吐息を感じて
Dry your tears with love
Dry your tears with love
Loneliness your silent whisper
Fills a river of tears through the night
Memory you never let me cry
And you, you never said good-bye
Sometimes our tears blinded the love
We lost our dreams along the way
But I never thought you'd trade your soul to the fates
Never thought you'd leave me alone
Time through the rain has set me free
Sands of time will keep your memory
Love everlasting fades away
Alive within your beatless heart
Dry your tears with love
Dry your tears with love
流れる涙を 時代の風に重ねて
終わらない悲しみを 青い薔薇に変えて
Dry your tears with love
Dry your tears with love
流れる涙を 時代の風に重ねて
終わらない貴方の 吐息を感じて
Dry your tears with love
Dry your tears with love
Dry your tears with love
Dry your tears with love
If you could have told me everything
You would have found what love is
If you could have told me what was on your mind
I would have shown you th

## 파일에 데이터 저장

데이터를 저장하면 프로그램을 종료해도 여전히 데이터를 이용할 수 있습니다. 프로그램의 실행결과를 살펴보거나 다른 사람과 파일을 공유할 수도 있습니다.

### 파일에 데이터 쓰기(write())

데이터를 파일에 저장하기 위해서는 open() 함수의 두 번째 매개변수로 쓰기 모드('w')를 지정하면 됩니다. 

파일을 쓰기모드로 지정하면 파일이 존재하지 않는 경우 새로 파일을 생성하여 데이터를 저장하고 이미 존재하는 경우에는 파일 내용을 덮어씁니다. 

In [26]:
filename = 'programming.txt'

with open(filename, 'w') as file_object:
    file_object.write("I love programming.")

이전 데이터를 삭제하는 경우

In [27]:
filename = 'programming.txt'

with open(filename, 'w') as file_object:
    file_object.write("Python is cool!")

open()을 호출할 때 실인자 두 개를 넘겼습니다. 첫 번째는 파일 이름이고 두 번째는 'w' 라는 쓰기 모드 옵션입니다.

파일을 열 때 설정가능한 모드는 네 가지이며 읽기 모드('r'), 쓰기 모드('w'), 이어 붙이기 모드('a': append), 읽고 쓰기 모드('r+')를 사용할 수 있습니다. 모드 매개변수를 생략하면 기본이 읽기 전용 모드입니다.

파이썬은 텍스트 파일에 문자열만 저장할 수 있으므로 숫자형 데이터를 텍스트 파일에 저장하기 위해서는 먼저 str() 함수를 사용하여 숫자를 문자열로 변경한 후 저장해야 합니다.

In [29]:
filename = 'numeric.txt'

with open(filename, 'w') as file_object:
    file_object.write(str(10))

### 파일에 여러줄 저장

write() 함수는 텍스트에 줄바꿈 문자를 추가하지 않습니다. 두 행 이상을 저장하기 위해서는 줄바꿈 문자를 같이 저장해야 합니다.

In [31]:
filename = 'programming.txt'

with open(filename, 'w', encoding = 'utf-8') as file_object: 
    file_object.write('나는 프로그래밍을 좋아합니다.\n')
    file_object.write('그 중에서도 특별히 파이썬을 좋아합니다.\n')

### 파일에 새로운 내용 추가(append mode)

파일에 데이터를 쓸 때 기존 내용을 덮어쓰지 않고 파일 데이터의 끝에 새로운 데이터를 추가하기 위해서는 파일을 열 때 이어붙이기 모드(append)로 열면 됩니다. 파일을 이어 붙이기 모드로 열면 파일 객체의 내용을 삭제하지 않고 기존 데이터에 추가후 반환합니다. 만약 파일이 존재하지 않으면 새로운 파일을 생성합니다. 

In [32]:
filename = 'programming.txt'

with open(filename, 'a', encoding = 'utf-8') as file_object: 
    file_object.write('게임개발이 관심분야입니다.\n')
    file_object.write('인공 지능에도 도전해 보고 싶습니다.\n')

문제:

사용자에게 이름을 묻는 while 루프를 만드세요. 사용자가 이름 대신 'quit'을 입력하면 while문을 벗어나 프로그램을 종료시키세요. 사용자가 이름을 입력하면 화면에 환영 인사를 출력하고 그들이 방문했다는 내용을 guest_book.txt 파일에 한 행씩 기록하세요. 각 이름마다 한 행씩 저장되었는지 확인하세요. 

In [33]:
filename = 'guest_book.txt'

print('종료하려면 "quit"을 입력하세요.')
while True:
    name = input("\n이름을 입력하세요: ")
    if name == 'quit':
        break
    else:
        print(f"안녕하세요. {name}님 반갑습니다!")
        with open(filename, 'a', encoding = 'utf-8') as file_object:
            file_object.write(f"{name}\n")

종료하려면 "quit"을 입력하세요.



이름을 입력하세요:  홍길동


안녕하세요. 홍길동님 반갑습니다!



이름을 입력하세요:  김건희


안녕하세요. 김건희님 반갑습니다!



이름을 입력하세요:  윤석열


안녕하세요. 윤석열님 반갑습니다!



이름을 입력하세요:  quit


## 예외 (exception)

파이썬은 프로그램 실행중 일어나는 에러를 적절히 관리할 수 있는 객체인 예외 객체를 제공합니다. 파이썬은 다음 할 일을 정확히 판단할 수 없는 경우 에러가 발생하며 이를 예외라고 부릅니다. 예외가 발생하면 프로그램을 멈추고 트레이스백을 출력하여 알립니다.

예외는 try-except 블록에서 처리할 수 있습니다. try 블록에 수행할 동작을 작성하고 except 블록에 예외 상화시 처리할 내용을 작성합니다. try-except 블록을 사용하면 프로그램을 멈추지 않고 적절히 대응할 수 있습니다.

### 0으로 나누기 예외(divide zero exception)

숫자를 0으로 나눌 때 발생하는 예외

In [38]:
print(5/0)

ZeroDivisionError: division by zero

### try-except 블록

예외를 안전하게 처리할 수 있는 방법은 try-except 블록을 사용하는 것입니다. 예외가 발생할 가능성이 있는 코드 블록을 try절로 둘러싸고 처리 내용은 except로 둘러쌉니다. 

In [42]:
try:
    print(5/0)
except ZeroDivisionError:
    print("숫자를 0으로 나눌 수 없습니다.")

숫자를 0으로 나눌 수 없습니다.


### 예외를 써서 에러 회피

에러 처리는 에러 발생후 프로그램이 할 일이 더 남아 있을 때 중요합니다. 사용자 입력을 받는 프로그램에서 이런 상황이 자주 발생합니다. 사용자가 잘못된 입력을 했을 경우 에러 처리를 적절히 해주면 에러를 일으키지 않고 올바른 입력을 요청할 수 있습니다.

예외에 대해 알아보기 위해 나눗셈만 하는 단순한 계산기 프로그램을 작성해보겠습니다.

In [51]:
print('숫자 두 개를 입력하면 나눗셈을 수행합니다.')
print("종료하려면 'q'를 입력하세요")

while True:
    first_number = input("\n첫 번째 숫자 : ")
    # 입력한 값에 대해 종료 체크
    if first_number == 'q':
        break
    second_number = input("\n두 번째 숫자: ")
    if second_number == 'q':
        break
    try:
        answer = int(first_number) / int(second_number)
    except ZeroDivisionError:    # try 블록에서 예외가 발생된 경우 수행될 부분 
        print("어떤 수를 0으로 나눌 수 없습니다.")
    else:  # try 절이 정상적으로 작동한 경우 수행할 명령을 else 블록에 작성합니다.
        print(answer)

숫자 두 개를 입력하면 나눗셈을 수행합니다.
종료하려면 'q'를 입력하세요



첫 번째 숫자 :  q


### FileNotFoundError

파일로 작업시 흔히 발생하는 문제가 열려고 하는 파일이 없는 경우에 발생하는 오류입니다. 원하는 파일이 다른 위치에 있거나 파일 이름에 오타가 있을 수 있습니다. 혹은 아예 존재하지 않는 경우도 있습니다. 이런 경우 발생하는 예외가 FileNotFoundError입니다.

다음과 같이 존재하지 않는 파일을 열어보겠습니다.

In [52]:
filename = 'unexist.txt'

with open(filename, encoding='utf-8') as file_object:
    contents = file_object.read()

print(contents)

FileNotFoundError: [Errno 2] No such file or directory: 'unexist.txt'

In [56]:
filename = 'unexist.txt'
try:
    with open(filename, encoding='utf-8') as file_object:
        contents = file_object.read()

except FileNotFoundError:
    print(f"{filename}이 현재 디렉토리에 존재하지 않습니다.")



unexist.txt이 현재 디렉토리에 존재하지 않습니다.


### 텍스트 분석

책 전체가 들어 있는 텍스트 파일을 가져와서 단어의 갯수를 알아봅니다. 사용할 텍스트는 구텐베르크 프로젝트(http://gutenberg.org)라는 사이트에서 가져옵니다. 구텐베르크 프로젝트는 공개된 문학 작품을 모아 관리하고 있습니다.

'이상한 나라의 앨리스'의 텍스트를 가져와서 텍스트에 있는 단어 수를 카운팅하겠습니다. 문자열에서 단어 리스트를 만드는 문자열의 메서드 split()를 사용하여 리스트에 문자들을 저장한후 len() 함수로 단어수를 계산하겠습니다.

In [63]:
filename = 'alice.txt'

try:
    with open(filename, encoding='utf-8') as file_object:
        contents = file_object.read()

except FileNotFoundError:
    print(f"{filename}이 현재 디렉토리에 존재하지 않습니다.")

else: # 정상적으로 파일을 열었을 때 처리할 내용을 작성
    words = contents.split()
    num_words = len(words)
    print(f"{filename}에는 {num_words}개의 단어가 있습니다.") 

alice.txt에는 1616개의 단어가 있습니다.


In [59]:
title = 'Alice in wonderland'
words = title.split()  # 공백을 기준으로 단어를 나누어 리스트에 저장합니다. (split())

print(words)
# 리스트 항목 갯수 카운팅
print(len(words))

for word in words:
    print(word)

['Alice', 'in', 'wonderland']
3
Alice
in
wonderland


### 여러 파일 다루기

위 코드를 함수로 옮기면 책의 단어수를 세기가 쉽습니다.

In [68]:
def count_words(filename):
    try:
        with open(filename, encoding='utf-8') as file_object:
            contents = file_object.read()

    except FileNotFoundError:
        print(f"{filename}이 현재 디렉토리에 존재하지 않습니다.")

    else: # 정상적으로 파일을 열었을 때 처리할 내용을 작성
        words = contents.split()
        num_words = len(words)
        print(f"{filename}에는 {num_words}개의 단어가 있습니다.") 

In [69]:
filename = 'alice.txt'
count_words(filename)

alice.txt에는 1616개의 단어가 있습니다.


In [None]:
def count_words(filename):
    try:
        with open(filename, encoding='utf-8') as file_object:
            contents = file_object.read()

    except FileNotFoundError:
        print(f"{filename}이 현재 디렉토리에 존재하지 않습니다.")

    else: # 정상적으로 파일을 열었을 때 처리할 내용을 작성
        words = contents.split()
        num_words = len(words)
        print(f"{filename}에는 {num_words}개의 단어가 있습니다.") 

In [70]:
count_words('alice.txt')
count_words('mobydick.txt')
count_words('little_women.txt')

alice.txt에는 1616개의 단어가 있습니다.
mobydick.txt에는 3405개의 단어가 있습니다.
little_women.txt에는 4019개의 단어가 있습니다.


In [71]:
filenames = ['alice.txt', 'mobydick.txt', 'little_women.txt']

for filename in filenames:
    count_words(filename)

alice.txt에는 1616개의 단어가 있습니다.
mobydick.txt에는 3405개의 단어가 있습니다.
little_women.txt에는 4019개의 단어가 있습니다.


### 조용히 예외 처리하기

사용자에게 모든 예외를 보고할 필요는 없습니다. 가끔은 예외가 발생한 사실을 알리지 않고 처리하기 원하는 경우도 있습니다. 프로그램을 조용히 실패시키기 위해서는 try 블록을 기존대로 작성하고, except 블록에서는 아무일도 하지 않게 pass 키워드로 처리할 수 있습니다. 

In [None]:
def count_words(filename):
    try:
        with open(filename, encoding='utf-8') as file_object:
            contents = file_object.read()

    except FileNotFoundError:
        pass   
    else: # 정상적으로 파일을 열었을 때 처리할 내용을 작성
        words = contents.split()
        num_words = len(words)
        print(f"{filename}에는 {num_words}개의 단어가 있습니다.") 

문제:

soccer_players.txt, baseball_players.txt 두 파일을 만드세요. 첫 번째 파일에는 축구선수 이름을 적어도 세 명, 두 번째는 야구선수 이름을 적어도 세 명 저장하세요. 이 파일들을 읽고 파일의 내용을 화면체 출력하세요. 코드는 try-except 블록으로 감싸서 FileNotFound 예외를 처리하고, 파일이 존재하지 않으면 알맞은 메시지를 출력하세요. 파일 중 하나를 다른 디렉토리에 옮기고 except 블록이 제대로 작동하는지 확인하세요.

In [73]:
filenames = ['soccer_player.txt', 'baseball_players.txt']

for filename in filenames:
    try: 
        with open(filename, encoding='utf-8') as file_object:
            contents = file_object.read()
            print(contents)
    except FileNotFoundError:
        print("파일을 열수 없습니다.")
    print()
        

파일을 열수 없습니다.

파일을 열수 없습니다.



## 데이터 저장

프로그램 중에는 사용자에게 정보 입력을 요구하는 프로그램이 많습니다. 게임 설정을 저장하거나 시각화에 사용할 데이터를 받을 수도 있습니다. 사용자가 제공한 정보를 리스트나 딕셔너리 같은 자료구조에 저장할 것입니다. 사용자가 프로그램을 닫으면 파일에 저장하지 않은 데이터는 사라집니다. 파일에 데이터를 저장하는 방법중 하나로 json 모듈을 사용할 수 있습니다. 

json 모듈을 쓰면 단순한 파이썬 자료구조를 파일에 저장하고, 다음에 프로그램을 실행할 때 그 파일에서 데이터를 읽어올 수 있습니다. json은 여러가지 프로그래밍 언어에서 널리 쓰이는 형식입니다. 

### json.dump()와 json.load()

다음 프로그램은 json.dump()를 호출하여 숫자들을 저장합니다. 
json.dump() 함수는 저장할 데이터와 file을 가리키는 변수명 두 가지를 입력받습니다.

In [76]:
import json

# 저장할 데이터들
numbers = [1, 2, 3, 4, 5, 6, 7]

filename = 'numbers.json'
with open(filename, 'w') as file_object:
    json.dump(numbers, file_object)


### load 메서드를 사용하여 데이터 불러오기

json.load() 함수는 함수의 입력값으로 파일 객체를 지정하면 됩니다.

In [77]:
import json

filename = 'numbers.json'
with open(filename,'r') as file_object:
    numbers = json.load(file_object)

print(numbers)

[1, 2, 3, 4, 5, 6, 7]


In [78]:
import json

colors = ['빨강', '노랑', '파랑']

filename = 'colors.json'
with open(filename, 'w') as file_object:
    json.dump(colors, file_object)

### 사용자가 생성한 데이터 저장하고 읽기

사용자의 정보를 어떤 형태로든 저장하지 않으면 프로그램이 멈출 때 데이터도 읽게 되니 사용자가 생성한 데이터를 다룰 때 json으로 데이터를 저장해 보겠습니다.

프로그램은 사용자의 이름을 묻고 저장한 후 프로그램을 다시 실행했을 때 그 이름을 불러들여 출력합니다.

먼저 사용자 이름을 저장해보겠습니다.

In [79]:
import json

username = input("이름을 입력하세요")

filename = 'usernames.json'
with open(filename, 'w') as file_object:
    json.dump(username, file_object)
    print(f"{username}님, 다음번에 다시 방문할 때 기억하겠습니다.")

이름을 입력하세요 둘리


둘리님, 다음번에 다시 방문할 때 기억하겠습니다.


In [81]:
import json

filename = 'usernames.json'

with open(filename) as file_object:
    username = json.load(file_object)
    print(f"{username}님 환영합니다!!")

둘리님 환영합니다!!


두 프로그램을 하나로 결합하고 예외 처리도 하겠습니다.

In [82]:
import json

filename = 'usernames.json'

# 이름이 있는지 일단 읽기 모드로 열어봅니다.
try:
    with open(filename) as file_object:
        username = json.load(file_object)
# 처음 방문하는 경우
except FileNotFoundError:
    username = input("이름을 입력하세요: ")
    with open(filename, 'w') as file_object:
        json.dump(username, file_object)
        print(f"{username}님 다음에 오시면 기억하겠습니다.")
else:
    print(f"{username}님 환영합니다!!")

둘리님 환영합니다!!
