# 파일 입-출력

## 파이썬 기본 입출력
1. open()
    - open() 함수의 결과는 파일 객체가 된다.
    - f = open(파일명, 모드)
    - 모드
        - r: read-only(기본값)
        - w: write
        - a: append
        - t: text mode
        - b: 이진 모드
2. 인코딩과 디코딩
    - 미리 정의된 특정 문자열 집합을 사용하여 저장함(인코딩)
    - 파일을 읽을 때는 어떤 문자열 집합을 사용했는지 알려주어야 함(디코딩)
    - 파일의 인코딩은 메모장을 통해서 간단히 알 수 있음.
    - 인코딩은 크게 ANSI or utf-8 두 가지로 나눌 수 있음.
    - ANSI는 euc-kr을 의미함.
    
3. 인코딩 종류
    - euc-kr: 11,172개의 한글 문자를 인코딩.
    - cp949: euc-kr에서 특수문자를 조금 더 보완한 것. 사소한 내용이라 무시할 정도인데.
    - utf-8
    - 컴퓨터가 보기에는 utf-8가 좋고, 사람이 보기에는 euc-kr이 좋다.
    - 컴퓨터 중간처리 등은 utf-8 인코딩이 낫다.

4. utf 이야기
    - 원래 utf-32에서 출발하였는데 이는 너무 크고 방대한 것이라 비효율적임.
    - 그래서 utf-16, utf-8로 축소했는데, utf-8로도 충분함.
    
5. for mac
    - 해보니까, 맥에서는 utf-8이 더 맞는거 같다. 
    - cp949로 인코딩하니까, encoding='cp949'를 계속 지정해 줘야 한다.
    - 지금은 공부하는 단계니까 귀찮더라도 시험해서 익히도록 하자.

# 새로운 디렉토리, 파일 만들고 확인하기 - 이어지는 내용임.

## 1. 새로운 디렉토리(폴더, directory) 만들기

In [1]:
import os

cwd = os.getcwd()

newdir_name = 'filetest/'

if not os.path.exists(os.path.join(cwd, newdir_name)):
    os.mkdir(os.path.join(cwd,newdir_name))

os.chdir(os.path.join(cwd, newdir_name))
!ls -al

total 4
drwxr-xr-x   3 jsha  staff   96 Sep  6 12:55 [1m[36m.[m[m
drwxr-xr-x  13 jsha  staff  416 Sep  6 14:19 [1m[36m..[m[m
-rw-r--r--   1 jsha  staff   26 Sep  6 12:55 myfile.txt


## 2. 새로운 파일 만들기

In [2]:
import os
import chardet

file_name = 'myfile.txt'

if not os.path.exists(file_name):
    f = open(file_name, 'w')
    f.write('hello my world \n')
    f.write('go forward')
    f.close()
    
if os.path.exists(file_name):
    print(f'yes, {file_name} exist!!')

yes, myfile.txt exist!!


## 3. 인코딩 종류 확인하기 - chrdet

In [21]:
import os
import chardet

f = open(file_name, 'br').read()
chardet.detect(f)

{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}

## 4. 파일 쓰기
 - 파일객체 = open(파일명, 'w')
 - 파일객체.write(문자열)
 - 파일객체.writelines(문자열 리스트)

In [33]:
with open('writetest.txt', 'w', encoding='cp949') as f:
    text_list = ['나는 오늘 행복합니다.', '코딩은 재미있습니다.', '저는 3년 안에 원하는 목표를 이루겠습니다.\n']
    f.writelines(text_list)
# !cat writetest.txt

with open('writetest.txt', 'a', encoding='cp949') as f:
    text_list = ['나는 오늘 행복합니다.\n', '코딩은 재미있습니다.\n', '저는 3년 안에 원하는 목표를 이루겠습니다.']    
    f.writelines(text_list)
!cat writetest.txt

���� ���� �ູ�մϴ�.�ڵ��� ����ֽ��ϴ�.���� 3�� �ȿ� ���ϴ� ��ǥ�� �̷�ڽ��ϴ�.
���� ���� �ູ�մϴ�.
�ڵ��� ����ֽ��ϴ�.
���� 3�� �ȿ� ���ϴ� ��ǥ�� �̷�ڽ��ϴ�.

## 5. 여러 줄 한꺼번에 읽기 + encoding

In [37]:
f = open('writetest.txt', 'r')
# f = open('writetest.txt', 'r', encoding='cp949')
text = f.read()
print(text)

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 0: invalid start byte

## 6. 파일객체 자체를 이용한 한줄 씩 읽기
 - 파일 객체를 for문 안에 넣어 iteration 시키면, 따로 read() 하지 않아도 문자열로 나온다. 
 - 파일 내용 확인할 때 편하게 할 수 있다.

In [54]:
f = open('writetest.txt', 'r', encoding='cp949')
for line in f:
    print(line)
f.close()

나는 오늘 행복합니다.코딩은 재미있습니다.저는 3년 안에 원하는 목표를 이루겠습니다.

나는 오늘 행복합니다.

코딩은 재미있습니다.

저는 3년 안에 원하는 목표를 이루겠습니다.


## 7. 파일객체 메소드 readlines() 
- 파일객체 전체를 줄단위로 읽어서 문자열 리스트로 반환한다.
- 파일의 내용을 출력하기 위해서 이걸 쓰진 않는다. 그냥 파일객체를 for문 안에 넣는게 더 간단하니까.
- 이건 파일객체의 내용을 line별로 문자열로 담아서 리스트에 넣어서 사용할 때 편리하게 만들 수 있겠다.

In [42]:
f = open('writetest.txt', 'r', encoding='cp949')
line_list = f.readlines()
print(line_list)
for line in line_list:
    print(line)

['나는 오늘 행복합니다.코딩은 재미있습니다.저는 3년 안에 원하는 목표를 이루겠습니다.\n', '나는 오늘 행복합니다.\n', '코딩은 재미있습니다.\n', '저는 3년 안에 원하는 목표를 이루겠습니다.']
나는 오늘 행복합니다.코딩은 재미있습니다.저는 3년 안에 원하는 목표를 이루겠습니다.

나는 오늘 행복합니다.

코딩은 재미있습니다.

저는 3년 안에 원하는 목표를 이루겠습니다.


## 8. 파일객체 메소드 read()
 - 파일 객체 전체 내용을 읽어 하나의 문자열로 반환한다.

In [51]:
f = open('writetest.txt', 'r', encoding='cp949')
f.read()

'나는 오늘 행복합니다.코딩은 재미있습니다.저는 3년 안에 원하는 목표를 이루겠습니다.\n나는 오늘 행복합니다.\n코딩은 재미있습니다.\n저는 3년 안에 원하는 목표를 이루겠습니다.'