# 파일과 디렉터리
- 디렉터리 : 폴더의 다른 말. 파일이 논리적으로 (비슷한 것들로) 묶인 단위
- 파일 : 컴퓨터를 실행하는 기본 단위
- 파일명 + 확장자
    - 확장자: 파일의 쓰임을 구분하는 것 ex) pdf, .xlsx, .txt, ...
- 종류: 바이너리 파일, 텍스트 파일
- 바이너리: 이진 정보로 저장되어 있음
    - 그래서 내용을 확인할 수 없음
    - 해당 확장자를 열 수 있는 프로그램이 필요함
    - 이진 정보로 저장되어 있어 효율적이지만 우리에겐 불편
- 텍스트: 사람이 이해할 수 있는 문자열로 저장됨
    - 컴퓨터에서는 다시 바이너리로 바뀌어서 인식
    - 메모장, html, py
    - 글자로 변경하는 기준: 아스키 코드, 유니코드
    - 표준에 맞춰서 저장하는 것 => 인코딩(encoding)
    - 제일 많이 사용하는 것 utf-8, 윈도우에서는 cp949

---

## 1. 파일 열기
- open(파일명, 모드)
- 모드
    - r: read (default)
    - w: write - 파일이 있으면 덮어쓰고, 없으면 생성
    - x: write - 파일이 없을 때만 생성
    - a: write - 파일이 있을 때 마지막 라인에 추가 (adding)  
- 추가모드 
    - b: binary
    - t: text (default)  
- 'rb', 'rt'

In [23]:
# 같은 디텍터리 안에 있는 파일 열기
file = 'test.txt'
# 주로 f로 받음
f = open(file, 'r')
f

<_io.TextIOWrapper name='test.txt' mode='r' encoding='cp949'>

---

## 2. 파일 읽기
- read(): 전체를 하나의 str
    - read(n) 어디까지 읽을 지 정할 수 있음
    - 포인터: 양이 많을 때 부분 읽기에 유용
- readline(): 한줄만 str, 기준: 개행
- readlines(): 전체를 list, 각 줄이 한 str

In [3]:
# read()
f.read()

"hello world\nI'm reading a book.\nI'm reading a book.\nI'm reading a book.\nI'm reading a book."

In [4]:
# 포인터
# read()를 한 번 더 하면 마지막으로 포인터가 가 있기 때문에 아무것도 뜨지 않는 것
f.read()

''

In [22]:
# 다시 읽으려면 닫고 다시 읽어야함
f.close()

In [None]:
# n 값지정 가능 => 포인터가 n에 가는 것
f.read(5)

'hello'

In [14]:
# readline() 한 줄만 읽기
f.readline()

'hello world\n'

In [17]:
# readlines() 한 줄씩 리스트에 담기
f.readlines()

['hello world\n',
 "I'm reading a book.\n",
 "I'm reading a book.\n",
 "I'm reading a book.\n",
 "I'm reading a book."]

In [24]:
# readlines() 열면서 텍스트 정제하기
sents = f.readlines()
sents = [s.strip() for s in sents]
sents

['hello world',
 "I'm reading a book.",
 "I'm reading a book.",
 "I'm reading a book.",
 "I'm reading a book."]

---

## 3. 파일 닫기
- 파일을 여는 즉시 닫아야 함
- **자원 해제**라고 함
- 닫아도 변수에 담아놓은 것을 사용할 수 있음

In [26]:
# close() 생략하여 닫는 방법
# 돌리는 순간 열리면서 닫힘
with open(file, 'r') as f: 
    # open()이 적용되는 블럭
    content = f.read()
# 파일이 자동으로 닫힘

In [28]:
# 원하는 정보는 가져오고 닫음
content 

"hello world\nI'm reading a book.\nI'm reading a book.\nI'm reading a book.\nI'm reading a book."

---

## 실습
- readline 파일을 읽는데, while을 사용해서 한 줄씩 읽고 strip()해서 리스트에 반환하는 함수 만들기

In [32]:
def read_lines(file):
    sents = []
    with open(file, 'r') as f:
        while True:
            line = f.readline()
            if not line:
                break
            sent = line.strip()
            sents.append(sent)
    return sents

In [33]:
read_lines(file)

['hello world',
 "I'm reading a book.",
 "I'm reading a book.",
 "I'm reading a book.",
 "I'm reading a book."]

---

디렉터리가 다를 때 파일 열기
- . : 현재 디렉터리
- ..: 상위 디렉터리

In [34]:
file = './folder/test.txt'

with open(file) as f:
    print(f.read())

hello world
I'm reading a book.
I'm reading a book.
I'm reading a book.
I'm reading a book.


---

## 4. 파일 쓰기
- 인코딩 유의
- 'w', encoding='utf-8'

In [50]:
# 방법 1
with open('test2.txt', 'w', encoding='utf-8') as f:
    for i in range(10):
        data = f'{i}번째 줄입니다.\n'
        f.write(data)

In [62]:
# 방법 2
# print()를 이용해서 추가
file_out = open('test2.txt', 'a', encoding='utf-8')
print('한 줄 추가했습니다.', file=file_out)
file_out.close()

In [63]:
file = 'test2.txt'
with open(file, 'r', encoding='utf-8') as f: 
    print(f.read())

0번째 줄입니다.
1번째 줄입니다.
2번째 줄입니다.
3번째 줄입니다.
4번째 줄입니다.
5번째 줄입니다.
6번째 줄입니다.
7번째 줄입니다.
8번째 줄입니다.
9번째 줄입니다.
한 줄 추가했습니다.
한 줄 추가했습니다.



In [65]:
# 방법 3
# folder 만들어서 추가
# 폴더를 만들고 추가해야 함
import os
os.mkdir('abc')

In [66]:
with open('./abc/test2.txt', 'w', encoding='utf-8') as f:
    for i in range(10):
        data = f'{i}번째 줄입니다.\n'
        f.write(data)

In [None]:
# 디렉토리(폴더)가 있는지 확인하기
path = 'abc'

# 'abc'가 없으면 만들어라
if not os.isdir(path):
    os.mkdir(path)
    
# dir_name = './abc/test2.txt'
dir_name = os.path.join(pate, 'test2.txt')

# 재확인
if not os.path.exists(dir_name):
    with open(dir_name, 'w') as f:
        #...
# 없으면 열어서 쓰는 거니까 덮어쓸 가능성 배제

---

## 5. 지우기
- os.remove(파일 이름)
- os.rmdir(폴더 이름)
    - 폴더 안에 파일이 있으면 삭제 불가

In [None]:
# 폴더 안에 파일이 있어도 삭제
import shutil
shutil.rmtree(dir_name)

---

## 실습
- 폴더 없으면 만들고 있으면 써라
- 파일에 내용 쓰기
- 파일 열기

In [73]:
import os
path = 'hufs'

if not os.path.isdir(path):
    os.mkdir(path)
    
with open('./hufs/test3.txt', 'w', encoding='utf-8') as f:
        data = 'come to hufs, meet the world'
        f.write(data)

In [74]:
file = './hufs/test3.txt'
with open(file, 'r', encoding='utf-8') as f:
    print(f.read())

come to hufs, meet the world


---

## 6. os

In [75]:
# 현재 디렉터리 확인
os.getcwd()

'C:\\Users\\KBS\\고급파이썬\\1. 복습'

In [None]:
# 상위로 가고 싶은 경우
# 디렉터리를 체인지하면 됨
os.chdir('..')

---

## 7. pickle
- 텍스트만 파일에 저장했다면 객체(리스트, 클래스 다 됨)를 파일로 저장하는 기능 제공
- 확장자가 다름
- 바이너리로 써야함


In [77]:
import pickle

nums = list(range(10))

# 위 리스트 담기
with open('test.pickle', 'wb') as f:
    pickle.dump(nums, f)

In [78]:
# 읽기
with open('test.pickle', 'rb') as f:
    number = pickle.load(f)

In [79]:
number

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]