## 파일과 디렉터리
- 디렉터리: 폴더의 다른 말로, 파일이 논리적으로 묶인 단위
- 파일: 컴퓨터를 실행하는 기본 단위
    - 파일명 + 확장자
    - 확장자는 파일의 쓰임을 구분
        - ex) .pdf, .xlxs, .txt
    - 파일의 종류
        1. 바이너리: 이진 정보로 저장되어있는 파일
            - ex) pdf, xlsx, ...
            - 사용자가 내용을 확인할 수 없음
            - 확인하기 위해서는 해당 확장자를 열 수 있는 프로그램이 필요함
            - 따라서 효율적이지만, 사용자에게는 살짝 불편
        2. 텍스트: 사람이 이해할수 있는 문자열로 저장됨
            - ex) txt, html, py
            - 변경 기준은 아스키코드 or 유니코드
            - 위와 같이 표준에 맞취 저장을 하는 것이 인코딩(encoding)
                - utf-8
                - cp949

#### 파일 열기
- open(파일명, 모드)
- 모드
    1. 읽기
        - r: read(default)
    2. 쓰기
        - w: 파일이 있으면 덮어쓰고, 없으면 생성
        - x: 파일이 없을때만 생성(기존의 데이터를 날릴 위험 없음)
        - a: 파일이 있을 때 마지막 라인에 추가하는 기능(adding)
- 추가 모드
    1. b: binary
    2. t: text(default)
    - rb: 바이너리, rt: 텍스트

In [2]:
# 1. 파일이 같은 directory 안에 있는 경우
file = 'text.txt'
f = open(file, 'r')

f

<_io.TextIOWrapper name='text.txt' mode='r' encoding='UTF-8'>

### 파일 읽기
- read(n): 전체를 하나의 str
    - n: 개수
- readline(): 한줄만 str
- readlines(): 각 줄이 한 str으로 들어간 전체를 list
- read의 특성
    1. read는 포인터가 있음
    2. 파일이 클 경우, 전체를 다 읽으려면 시간이 오래 걸림(유용)

In [3]:
print(f.read(5))

hello


In [4]:
f.close()

In [6]:
file = 'text.txt'
f = open(file, 'r')
f.readline()

'hello world\n'

In [7]:
f.close()

In [8]:
file = 'text.txt'
f = open(file, 'r')
f.readlines()

['hello world\n', "I'm reading a book.\n"]

In [9]:
f.close()

#### 파일 닫기
- 파일 여는 즉시 닫기
- 여는 것보다 닫는 것을 더 신경 써야 함
- 자원 해제
- 메모리 절약, 에러가 날 수도 있음

In [10]:
f = open(file, 'r')

sents = f.readlines()
sents = [s.strip() for s in sents]
f.close()

In [11]:
sents

['hello world', "I'm reading a book."]

In [12]:
# 파일 닫는 것이 귀찮을 때
with open (file, 'r') as f:
    # open()이 적용되는 블록
    content = f.read()
# close 하지 않아도 파일이 자동으로 닫힘

In [13]:
print(content)

hello world
I'm reading a book.



#### 실습
readline 파일 읽는데, while 사용해서 한줄씩 읽고 strip()해서 리스트로 반환하는 함수 만들기

In [15]:
def make_readlines(file):
    sent = []
    with open(file, 'r') as f:
        while content := f.readline().strip():
            sent.append(content)
            
    return sent

make_readlines('text.txt')

['hello world', "I'm reading a book."]

#### 쓰기
- 인코딩 유의

In [16]:
with open('text2.txt', 'w', encoding = 'utf-8') as f:
    for i in range(1, 11):
        data = f'{i}번째 줄입니다.\n'
        f.write(data)

In [17]:
# print 함수로 파일에 저장하는 방법
file_out = open('text.txt', 'a', encoding = 'utf-8')

# 파일을 열어서 print할 때, 파일에 print
print('한 줄 추가했습니다.', file = file_out)

file_out.close()

In [26]:
# 하위 폴더를 만들어서 추가하는 방법
# 폴더를 만들어야 함
# 그 다음에 접근

import os
os.mkdir('folder2')

with open('./folder2/text2.txt', 'w', encoding = 'utf-8') as f:
    for i in range(1, 11):
        data = f'{i}번째 줄입니다.\n'
        f.write(data)

In [27]:
path = 'folder2'

# 확인
if not os.path.isdir(path): # 있는지 확인
    os.mkdir(path)
    
dir_name = os.path.join(path, 'text2.txt')

if not os.path.exists(dir_name):
    with open(dir_name, 'w') as f: # 덮어쓸 가능성 배제
        f.write('한 줄 더 추가')

#### 지우기
- os
    1. 파일 지우기 remove
    2. 폴더 지우기 rmdir(단, 이 경우 폴더 안에 파일이 있으면 삭제 못함)
- shutil
    - 강제로 전부 삭제

In [28]:
os.remove('text.txt') # 파일 삭제

FileNotFoundError: [Errno 2] No such file or directory: 'text.txt'

In [29]:
# 폴더 안에 파일이 있는 경우, 삭제 못함
# OSError: [Errno 66] Directory not empty: 'folder2'
os.rmdir('folder2')

OSError: [Errno 66] Directory not empty: 'folder2'

In [30]:
import shutil

shutil.rmtree('folder2') # 강제로 삭제

#### 실습2
1. 폴더를 새로 만들어서
2. 파일에 내용 쓰기(있으면 쓰고, 없으면 만들어라: w)
3. 파일 열기(파일을 쓴 다음에 닫고, 다시 접근할 수 있는지 확인)

In [34]:
# 1. 
path = 'folder'
if not os.path.isdir(path):
    os.mkdir(path)
    
# 2. 
my_test = os.path.join(path, 'my_test.txt')
with open(my_test, 'w', encoding = 'utf-8') as f:
    while sent := input():
        f.write(sent + '\n')
        
# 3. 
with open(my_test, 'r', encoding = 'utf-8') as f:
    final_test = f.read
    
print(final_test)

 hello
 how are you
 bye
 


<built-in method read of _io.TextIOWrapper object at 0x7fb8f2be7110>


#### os 기능
- os.getcwd(): 내가 있는 dir 확인 가능
- os.chdir('..'): dir 상위로 올라가기

### pickle
- 객체를 파일로 저장하는 기능 제공
    - 리스트, 클래스 등
- 어떤 작업을 많이 했을 때, 중간에 사용했던 각각의 변수를 저장해서 쓰고 싶을 때 사용
- 확장자: .pickle
- 바이너리로 써야 함(wb, rb)
- 예약어
    1. dump: 넘길 때
    2. load: 읽을 때

In [37]:
import pickle

nums = list(range(27))
nums # 리스트 객체

with open('test.pickle', 'wb') as f:
    pickle.dump(nums, f)

In [38]:
with open('test.pickle', 'rb') as f:
    number = pickle.load(f)
    
number

[0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 25,
 26]