### 파일과 디렉터리
- 파일: 컴퓨터를 실행하는 기본 단위
    - 파일명과 확장자로 이루어진다
        - 확장자: 파일의 쓰임을 구분하는 글자
        - pdf, xlsx, txt, ...
    - 파일의 종류
        - 바이너리 파일
            - 이진정보로 저장된다
            - 내용을 확인할 수 없다
            - 내용을 확인하려면 해당 확장자를 열 수 있는 프로그램이 필요하다 (엑셀, 워드, pdf, ...)
            - 이진정보로 저장되어 효율적이지만 사람에게는 사용이 불편하다
        - 텍스트 파일
            - 사람이 이해할 수 있는 문자열로 저장된다 (메모장, html, py, ...)
            - 컴퓨터 내에서는 문자열이 바이너리로 변환되어 인식된다
            - 문자열로 변경하는 기준은 아스키코드, 유니코드 등이 있다
            - utf-8, cp494 등의 표준에 맞춰 저장하는 행위를 인코딩(encoding)이라고 한다
            
            
- 디렉터리: 폴더의 다른말로, 파일이 논리적으로 묶인 단위

### 파일 열기
- open(파일명, 모드)
- 모드
    - r: read (기본값이다)
    - w: write (파일이 있으면 덮어쓰고, 없으면 생성한다)
    - x (파일이 없을 때만 생성한다)
    - a (파일이 있으면 마지막 라인에 추가한다)
- 추가모드
    - b: 바이너리파일
    - t: 텍스트파일 (기본값이다)

In [12]:
# 파일 열기
file = 'test.txt'
f = open(file, 'r')
f

<_io.TextIOWrapper name='test.txt' mode='r' encoding='UTF-8'>

### 파일 읽기
- 포인터가 있으니 주의
- read(): 전체를 하나의 문자열로 가져온다
- readline(): 한줄만 문자열로 가져온다
- readlines(): 전체를 리스트로 가져온다, 각 줄이 하나의 문자열이 된다

In [2]:
# 파일 읽기
f.read()

"Hello, world!\nI'm learning Python.\nI'm reading a book.\n"

In [3]:
f.read() # 이미 한번 다 읽어서 포인터가 끝에 있으므로 다시 read하면 읽을 문자열이 없다

''

In [5]:
# 파일을 다시 연 후

f.read(5) # 몇 글자까지 read할지 설정이 가능하다

'Hello'

In [11]:
# 파일을 다시 연 후

f.readline() # 한 줄만 문자열로 가져오기

'Hello, world!\n'

In [13]:
# 파일을 다시 연 후

f.readlines() # 전체를 리스트로 가져온다, 각 줄이 하나의 문자열

['Hello, world!\n', "I'm learning Python.\n", "I'm reading a book.\n"]

In [14]:
f = open(file, 'r')
sents = f.readlines()
sents = [s.strip() for s in sents] # 텍스트 정제
f.close()

sents

['Hello, world!', "I'm learning Python.", "I'm reading a book."]

### 파일 닫기
- 파일은 여는 즉시 닫아야한다

In [15]:
with open(file, 'r') as f:
    # open()이 적용되는 블럭
    content = f.read()
# 파일이 자동으로 닫힌다

content

"Hello, world!\nI'm learning Python.\nI'm reading a book.\n"

In [16]:
# while을 사용해서 readline으로 한 줄씩 읽고 strip()한 뒤 리스트에 반환하는 함수 만들기
file = 'test.txt'
with open(file, 'r') as f:
    lines = []
    while True:
        sent = f.readline()
        if not sent:
            break
        lines.append(sent.strip())
print(lines)

['Hello, world!', "I'm learning Python.", "I'm reading a book."]


### 다른 디렉터리의 파일 접근
- . : 현재 경로
- .. : 상위 경로

In [17]:
file = './folder/test.txt'

with open(file) as f:
    print(f.read())

Hello, world!
I'm learning Python.
I'm reading a book.



### 파일 쓰기
- 인코딩에 유의해야한다

In [18]:
with open('test2.txt', 'w', encoding='utf-8') as f:
    for i in range(10):
        data = f'{i}번째 줄입니다.\n'
        f.write(data)

In [19]:
# print()를 사용하여 쓰기
file_out = open('test2.txt', 'a', encoding='utf-8')
print('한 줄 추가했습니다.', file=file_out)
file_out.close()

In [21]:
# folder를 만들어서 추가하는 방법
# 먼저 폴더를 만들고 접근해야한다

import os
os.mkdir('new folder') # mkdir = make directory 폴더 생성

In [22]:
with open('./new folder/test.txt', 'w', encoding='utf-8') as f:
    for i in range(10):
        data = f'{i}번째 줄입니다.\n'
        f.write(data)

In [24]:
# 폴더가 있는지 확인하기
# os.isdir(폴더 이름)

path = 'new folder'

# 폴더가 없으면 만들어라
if not os.path.isdir(path):
    os.mkdir(path)
    
dir_name = os.path.join(path, 'test.txt')

# 파일이 없으면 써라
# 덮어쓸 가능성을 배제한다
if not os.path.exists(dir_name):
    with open('test.txt', 'w', encoding='utf-8') as f:
        for i in range(10):
            data = f'{i}번째 줄입니다.\n'
            f.write(data)

In [25]:
# 파일 지우기
os.remove('test.txt')

# 폴더 지우기
# 폴더 안에 파일이 있으면 삭제할 수 없다
os.rmdir('new folder')

OSError: [Errno 66] Directory not empty: 'new folder'

In [26]:
import shutil
# remove tree
# 폴더 안에 파일이 있어도 강제로 전부 삭제한다
shutil.rmtree('new folder')

In [27]:
# 폴더 새로 만들고
# 파일에 내용 쓰고
# 파일 열기

path = 'new folder'

if not os.path.isdir(path):
    os.mkdir(path)
    
dir_name = os.path.join(path, 'test.txt')

if not os.path.exists(dir_name):
    with open('test.txt', 'w', encoding='utf-8') as f:
        for i in range(10):
            data = f'{i}번째 줄입니다.\n'
            f.write(data)

In [28]:
# 현재 디렉터리 위치 반환
# get current working directory
os.getcwd()

'/Users/yong/Desktop/2022년도 1학기/고급파이썬프로그래밍/복습/week_15'

In [29]:
# 디렉터리 위치 바꾸기
# change directory
os.chdir('..')

### pickle
- 객체를 파일로 저장하는 기능을 제공한다

In [30]:
import pickle

nums = list(range(10))

with open('test.pickle', 'wb') as f: # wb = write binary
    pickle.dump(nums, f)

In [31]:
with open('test.pickle', 'rb') as f: # rb = read binary
    number = pickle.load(f)

number

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]