### 파일과 디렉터리
- 디렉터리: 폴더의 다른 말. 파일이 논리적으로 묶인 단위
- 파일: 컴퓨터를 실행하는 기본 단위
    - 파일명 + 확장자
    - 확장자: 파일의 쓰임을 구분하는 글자
        - .pdf, .xlsx, .txt, ...
    - 종류: 바이너리 파일, 텍스트 파일
        - 바이너리: 이진 정보로 저장됨
            - 내용을 확인 못 함.
            - 해당 확장자를 열 수 있는 프로그램이 필요함.
        - 텍스트: 사람이 이해할 수 있는 문자열로 저장됨
            - 메모장, html, py
            - 변경 기준: 아스키코드, 유니코드
            - 인코딩 (encoding)
            - utf-8
            - cp949

#### 파일 열기
- open(파일명, 모드)
- 모드
    1. 읽기
    - r: read (default)
    
    2.쓰기
    - w: write - 파일이 있으면 덮어쓰고, 없으면 생성
    - x: 파일이 없을 때만 생성
    - a: 있을 때 마지막 라인에 추가
    
    추가 모드
    - b: binary
    - t: text
    'rb','rt'

In [31]:
# 파일 열기
file = 'test.txt'
f = open(file, 'r')

In [32]:
f

<_io.TextIOWrapper name='test.txt' mode='r' encoding='cp949'>

#### 파일 읽기
- read(): 전체를 하나의 str
    - 포인터
    - 파일이 엄청 클 때, 전체를 다 읽으면 시간이 오래 걸림 -> 유용
- readline(): 한줄만 str
- readlines(): 전체를 list, 각 줄이 한 str

In [33]:
# 파일 읽기
f.read(5)

'hello'

In [26]:
f.close()

In [34]:
f.readline()

' world\n'

In [35]:
f.readlines()

["I'm reading a book."]

In [36]:
f = open(file, 'r')
sents = f.readlines()
sents = [s.strip() for s in sents] # 텍스트 정제
f.close()

In [37]:
sents

['hello world', "I'm reading a book."]

#### 파일 닫기
- 파일 여는 즉시 닫기
- 자원 해제
- 여는 것보다 닫는 것을 더 신경써야 함
- 메모리 절약, 에러가 날 수도 있음

In [38]:
with open(file, 'r') as f: # file
    # open() 적용되는 블럭
    content = f.read()
# 파일 자동으로 닫힘

In [39]:
content

"hello world\nI'm reading a book."

In [None]:
# readline 파일 읽는데, while 사용해서 한줄씩 읽고 strop()해서 리스트에 반환하는 함수 만들기

In [65]:
sents = []
with open(file, 'r') as f:
    while True:
        line = f.readline()
        if not line:
            break
        sent = line.strip()
        sents.append(sent)

In [66]:
sents

['hello world', "I'm reading a book."]

#### 경로가 달라질 때
- . : 현재경로
- .. : 상위 경로

In [68]:
file = './test.txt'

with open(file) as f:
    print(f.read())

hello world
I'm reading a book.


#### 쓰기
- 인코딩 유의

In [71]:
with open('test2.txt', 'w', encoding='utf-8') as f:
    for i in range(10):
        data = f'{i}번째 줄입니다.\n'
        f.write(data)

In [1]:
# print
file_out = open('test2.txt', 'a', encoding='utf-8')
print('한 줄 추가했습니다.', file=file_out)
file_out.close() # 닫아주는 것 중요

#### folder 만들어서 추가하는 방법
- 폴더 만들어야 함
- 접근

In [80]:
with open('./abc/test2.txt', 'w', encoding='utf-8') as f:
    for i in range(10):
        data = f'{i}번째 줄입니다.\n'
        f.write(data)

In [81]:
import os

In [82]:
os.mkdir('abc')

FileExistsError: [WinError 183] 파일이 이미 있으므로 만들 수 없습니다: 'abc'

In [84]:
path = 'abc'
# 있는지 확인i하기
if not os.isdir('abc'):
    os.mkdir('abc')
    
#dir_name = './abc/test2.txt'
dir_name = os.path.join(path, 'test2.txt')

# 재확인
if not os.path.exists(dir_name):
    with open(dir_name, 'w') as f: # 덮어쓸 가능성 배제
        # ... 

IndentationError: expected an indented block (Temp/ipykernel_12368/375395202.py, line 11)

In [77]:
os.remove(file_name)
os.rmdir(dir_name) # 폴더 안에 파일이 있으면 삭제 못함

NameError: name 'file_name' is not defined

In [78]:
import shutil
shutil.rmtree(dir_name) # 강제로 전부 삭제

NameError: name 'dir_name' is not defined

In [79]:
# folder 새로 만들어서
# 파일에 내용 쓰기
# 파일 열기

In [87]:
path = 'new_file'
if not os.isdir('new_file'):
    os.mkdir('new_file')

AttributeError: module 'os' has no attribute 'isdir'

In [88]:
os.getcwd()

'C:\\Users\\jiin'

In [89]:
os.chdir('..')

#### pickle
- 객체를 파일로 저장하는 기능 제공
- 확장자: .pickle
- 바이너리로 써야 함 (wb, rb)
- 예약어
    - 넘길 때 dump
    - 읽을 때 load

In [98]:
import pickle

In [99]:
nums = list(range(10))

In [100]:
with open('test.pickle', 'wb') as f:
    pickle.dump(nums, f)

PermissionError: [Errno 13] Permission denied: 'test.pickle'

In [94]:
with open('test.pickle', 'rb') as f:
    number = pickle.dump(nums, f)

FileNotFoundError: [Errno 2] No such file or directory: 'test.pickle'

In [95]:
number

NameError: name 'number' is not defined

In [96]:
a = Product()

NameError: name 'Product' is not defined