### 파일 디렉터리
- 디렉터리 : 폴더의 다른 말. 파일이 논리적으로 묶인 단위 
- 파일 : 컴퓨터를 실행하는 기본 단위
    - 파일을 기준으로 작업이 이루어짐.
    - 파일명 + 확장자
    - 확장자 : 파일의 쓰임을 구분하는 글자
        - .pdf, .xlsx, .txt, ..
    - 종류 : 바이너리 파일, 텍스트 파일
        - 바이너리 : 이진 정보로 저장됨
            - 내용 확인 못 함.
            - 해당 확장자를 열 수 있는 프로그램이 필요함.
        - 텍스트 : 사람이 이해할 수 있는 문자열로 저장됨
            - 메모장, html, python
            - 변경 기준 : 아스키코드, 유니코드
            - 인코딩 (encoding) : 변경 기준에 맞춰서 변경 후 저장하는 행위를 뜻함
            - utf-8
            - cp494

### 파일 열기
- open(파일명, 모드)
- 모드
    - r : read
    - w : write - 파일이 있으면 덮어쓰고, 없으면 생성
    - x : 파일이 없을 때만 생성
    - a : 있을 때 마지막 라인에 추가(=adding)
    
    추가 모드
    - b : binary
    - t : text (default)
    
    'rb', 'rt'

In [1]:
# 파일 열기
file  = 'test.txt'
f = open(file, 'r')

In [2]:
f

<_io.TextIOWrapper name='test.txt' mode='r' encoding='cp949'>

### 파일 읽기
- read() : 전체를 하나의 str
    - 포인터
- readline() : 한줄만 str
- readlines() : 전체를 list, 각 줄이 한 str

In [3]:
# 파일 읽기
f.read(5) #파일을 읽을 때 뭐가 나왔을 때 while-break로 멈추기 할 때 유용


'Hello'

In [4]:
# 한줄씩만 # 개행을 기준으로
f.readline()

', world?\n'

In [5]:
# 전체 다 읽기
f.readlines()

["I'm reading a book."]

In [6]:
f = open(file, 'r')
sents = f.readlines()
sents = [s.strip() for s in sents] #텍스트 정제
f.close()

In [7]:
sents

['Hello, world?', "I'm reading a book."]

#### 파일 닫기
- 파일 여는 즉시 닫기
- 자원 해제

In [8]:
with open(file, 'r') as f: # file
    # open() 적용되는 블럭
    content = f.read()

#파일 자동으로 닫힘

In [9]:
content

"Hello, world?\nI'm reading a book."

### read 함수
- read : 파일을 읽어서 문자열로 반환한다.
- readline : 파일의 한 줄을 읽어서 문자열로 반환한다.
- readlines : 파일의 모든 줄을 읽어서 문자열 리스트로 반환한다.

In [10]:
with open('test.txt', 'r') as f:
    data = f.readlines()
    data = [line.strip() for line in data]

data

['Hello, world?', "I'm reading a book."]

### 파일을 열 때 유의점
- 같은 위치에 있는 파일을 읽을 때에는 파일의 위치를 지정하지 않아도 된다.
- 다른 위치에 있는 파일을 읽을 때에는 파일의 위치를 지정해야 한다.
    - ./ : 현재 위치
    - ../ : 상위 디렉터리

### 파일 쓰기

In [11]:
file = 'test2'

f = open(file, 'w', encoding='utf-8')

In [12]:
for i in range(10):
    data = f'{i}번째 줄입니다. \n'
    f.write(data)

f.close()

In [13]:
# print 함수를 이용한 쓰기
f = open(file, 'a')
print('새로운 줄 추가', file = f)

f.close()

### 다른 디렉터리에 파일 쓰기
- os 활용

In [14]:
import os

In [15]:
# 폴더 만들기
os.mkdir('folder1')

FileExistsError: [WinError 183] 파일이 이미 있으므로 만들 수 없습니다: 'folder1'

In [16]:
file = '.folder1/test3.txt'
f = open(file, 'w', encoding='utf-8')

FileNotFoundError: [Errno 2] No such file or directory: '.folder1/test3.txt'

In [17]:
#파일 쓰기
file = './folder1/test3.txt'
f = open(file, 'w', encoding='utf-8')
f.close()

In [18]:
# 폴더가 없을 때에만 만들게 하는법
if not os.path.isdir('folder1'):
    os.mkdir('folder1')

In [19]:
os.path.exists(file) # like assert...

True

###  파일, 폴더 지우기
- os.remove(file_name)
- os.rmdir(dir_name)

### 이래도 안된다 => 강제삭제!
- import shutil
- shutil.rmtree('folder1')

### 상위폴더에 쓰고싶다
- os.getcwd()
- os.chdir('..')

### 실습
폴더 새로 만들고
파일 쓰고 (내용은 아무거나)
열기

In [20]:
# 폴더 생성
if not os.path.isdir('folder2'):
    os.mkdir('folder2')

# 파일 작성
file = './folder2/test4.txt'
f = open(file, 'w', encoding= 'utf-8')
print('고급파이썬프로그래밍', file = f)

f.close()

# 파일 읽기
with open('folder2/test4.txt', 'r') as f:
    data = f.readlines()
    data = [line.strip() for line in data]

data

UnicodeDecodeError: 'cp949' codec can't decode byte 0xed in position 6: illegal multibyte sequence

### pickle
- 객체를 파일에 저장하고 불러오는 기능
- 저장: pickle.dump(변수, 파일명)
- 불러오기: 변수명 = pickle.load(파일명)

In [21]:
num = list(range(10))

import pickle

f = open('test.pickle', 'wb')
pickle.dump(num, f)
f.close

with open('test.pickle', 'rb') as f:
    number = pickle.load(f)