### 5.4 파일(File)

- 파일에 텍스트 쓰기

In [1]:
file = open('data/basic.txt', 'w')      # data/basic.txt를 쓰기 모드로 open
file.write('Hello World!!!')
file.close()

- 파이썬 스타일: with 구문

In [3]:
# with 구문을 벗어나면 파일이 자동적으로 close 됨
# 'w' 모드는 기존 데이터를 overwrite
# write 할 경우 new line을 입력하지 않았으므로 한 줄의 데이터가 됨
with open('data/basic.txt', 'w') as file:
    file.write('This is Python Style!!!')
    file.write('This is Python Style!!!')

In [4]:
with open('data/basic.txt', 'w') as file:
    file.write('Hello World!!!\n')
    file.write('This is Python Style!!!')

- 텍스트 읽기

In [5]:
with open('data/basic.txt', 'r') as file:
    content = file.read()                   # 파일 안에 있는 텍스트를 모두 읽음
print(content)

Hello World!!!
This is Python Style!!!


In [6]:
with open('data/basic.txt') as file:    # 읽기 모드가 디폴트이므로 'r' 생략 가능
    content = file.read(20)             # 파일 안에 있는 텍스트 20자를 읽음
print(content)

Hello World!!!
This 


- 한글 텍스트 쓰기/읽기

In [8]:
# encoding을 지정하지 않으면 'utf-8'로 인코딩
with open('data/한글.txt', 'w') as file:
    file.write('안녕하세요?\n')
    file.write('파이썬 세계에 오신 것을 환영합니다.')

In [9]:
# EUC-KR로 인코딩
with open('data/한글.txt', 'w', encoding='CP949') as file:
    file.write('안녕하세요?\n')
    file.write('파이썬 세계에 오신 것을 환영합니다.')

In [10]:
# EUC-KR로 읽기
with open('data/한글.txt', encoding='cp949') as file:
    content = file.read()
print(content)

안녕하세요?
파이썬 세계에 오신 것을 환영합니다.


In [11]:
# EUC-KR로 10글자 읽기
with open('data/한글.txt', encoding='EUC-KR') as file:
    content = file.read(10)
print(content)

안녕하세요?
파이썬


- 여러줄 쓰기/읽기

In [13]:
fruits = ['apple', 'banana', 'cherry']
with open('data/fruits.txt', 'w') as file:
    for fruit in fruits:
        file.write(fruit + '\n')

In [14]:
with open('data/fruits.txt', 'w') as file:
    file.writelines(fruits)                 # 리스트를 쓰게 해줌

In [15]:
with open('data/fruits.txt', 'w') as file:
    file.writelines(map(lambda x: x + '\n', fruits))

In [16]:
with open('data/fruits.txt') as file:
    line = file.readline()              # 한 줄 읽기, 문자열
    print(line)

apple



In [17]:
with open('data/fruits.txt') as file:
    lines = file.readlines()             # 모든 줄 읽기, 리스트
    print(lines)

['apple\n', 'banana\n', 'cherry\n']


In [20]:
# 줄 단위로 작업
for line in lines:
    print(line.strip())

apple
banana
cherry


In [24]:
# 데이터가 몇줄 있는지 모르는 상황에서 아래와 같은 코드는 사용하지 말아야 함
with open('data/fruits.txt') as file:
    line = file.readline()              # 한 줄 읽기, 문자열
    print(line.strip())
    line = file.readline()              # 한 줄 읽기, 문자열
    print(line.strip())
    line = file.readline()              # 한 줄 읽기, 문자열
    print(line.strip())
    line = file.readline()              # 한 줄 읽기, 문자열
    print(line.strip())

apple
banana
cherry



In [25]:
with open('data/fruits.txt') as file:
    while True:
        line = file.readline()
        if not line:                # '' 일때 break, if line == '' 과 같이 써도 무방
            break
        print(line.strip())

apple
banana
cherry


- append mode

In [26]:
with open('data/fruits.txt', 'a') as file:
    file.write('strawbery\n')
    file.write('pineapple\n')

- 패스워드 처리
    - github를 사용하는 경우 패스워드가 노출되면 안됨
    - 패스워드를 파일에 보관하고, 파일을 .gitignore 파일에 등록
    - 패스워드 파일은 개인 메일에 보관

In [27]:
with open('data/password.txt') as file:
    password = file.read()
# 이 이후에 password를 출력하지 않고 사용하면 됨

- 파이썬 객체 저장/로드

In [28]:
james = {'name': 'James', 'age': 27, 'addr': '서울시 영등포구 여의도동'}

In [29]:
# 파일에 저장
import joblib
joblib.dump(james, 'data/person.jl')

['data/person.jl']

In [30]:
# 파일에서 읽기
person = joblib.load('data/person.jl')
person

{'name': 'James', 'age': 27, 'addr': '서울시 영등포구 여의도동'}