# Path (경로)

- **경로(Path)**
    - 프로그램에서 사용할 **자원의 위치를 path(경로)** 라고 한다.
    - **파일 시스템**에서는 파일이나 디렉토리가 있는 위치의 경로를 말한다.
    - 계층구조 : Tree 구조, 최상위 directory는 하나이다 : Root directory
    

누구, 어떤것을 읽을꺼야? -> 파일 경로 :
디렉토리 / 파일명 

- **절대경로**
    - 자원의 전체 경로를 표현하는 방식
    - 시작 경로부터 자원(파일, 디렉토리)이 있는 위치까지 표현한다.
        - 시작 경로: Root Path
            - windows: `c:`, `d:`
            - Unix, Linux: `/`

- **상대경로**
    - 현재 작업 경로(위치)에서 부터 자원이 있는 위치까지 표현한다.
        - 시작 경로: 현재 작업경로
    - 구문
        - `.` : 현재 디렉토리
        - `..`: 상위 디렉토리
        - `/` : 경로 구분자,  상위경로/하위경로

- ./..  : 현재위치(.)에서 이전폴더로 나가라(..)
- ./C : 현재위치(.)에서 c위치를 찾아라(c)
- ./B/C : 현재위치(.)에서 B폴더에서 C를 찾아라
- ./는 생략가능

- 운영체제(O/S)별 경로구분자
    - 윈도우즈: `\` (역슬래쉬)
    - 리눅스/유닉스: `/` (슬래쉬)

In [6]:
# 현재 디렉토리(working directory) 확인 -> 프로그램을 실행시킨 디렉토리.
import os
os.getcwd()   # cwd : current working diectory

'C:\\Users\\Playdata\\Documents\\MyRepo\\02_Python'

In [2]:
# working directory 를 변경.
os.chdir("./mypackage")

In [3]:
os.getcwd()

'C:\\Users\\Playdata\\Documents\\MyRepo\\02_Python\\mypackage'

### 절대 경로 및 상대 경로 구분해서 사용 
- 현재 위치에서 비슷한 위치일땐, ./ or ../로 파일경로 지정이 편함 -> 상대경로 
- 만약 상위 폴더로 이동해서 파일 경로 지정해야한다면 -> 절대경로 

In [7]:
os.mkdir("new_dir")   # dir 생성 = 파일경로/파일명 -> "./"가 생략되어있는 모습 , 상대경로 

In [8]:
os.rmdir("new_dir")

# 입출력 (IO)

## 입출력이란
- 프로그램이 사용하려는 외부 자원을 연결하여 데이터를 입력 받거나 출력하는 작업을 IO라고 한다.
- 외부 자원
    - 파일, 원격지 컴퓨터(Network으로 연결된 컴퓨터의 자원), 데이터베이스 등.
- **Stream**
    - 입출력 시 **데이터의 흐름을 stream** 이라고 한다.
- InputStream 
    - Program이 외부로 부터 데이터를 읽어 들이는 흐름.
- OutputStream 
    - Program이 외부로 데이터를 써주는 흐름.


![io](images/ch09_01.png)

외부 -> (입력) P/g -> 외부 (출력)

## IO 코딩 순서
![순서](images/ch09_02.png)

### 파일 열기(연결)
- open() 함수 사용
    - 연결된 파일과 입출력 메소드를 제공하는 객체(Stream)를 리턴
- 구문
    - `open(file, mode='r', encoding=None)`
    - 함수 주요 매개변수
        - file : 연결할 파일 경로
        - mode : 열기 모드
            - mode는 목적, 데이터종류를 조합한 문자열을 사용한다.
        - encoding : 데이터를 특정 형식으로 변환
            - 입출력 대상이 **텍스트 파일일 경우** 인코딩 방식 설정
            - 생략하면  **os 기본 encoding방식을 따른다.**      
                - Windows: cp949/euckr
                - Linux, Unix: utf-8
|mode타입|mode문자|설명|
|:-|-|-|
|목적|r|읽기 모드-목적의 기본 모드|
||w|새로 쓰기 모드|
||a|이어 쓰기 모드|
||x|새로 쓰기모드-연결하려는 파일이 있으면 Exception발생|
|데이터종류|b|binary 모드|
||t|Text모드-text데이터 입출력시 사용|
    

※ mode
- Text 모드 : 일반적인 문서 파일 (.txt, .csv, .json)
- binary 모드 : 이미지, 오디오, 동영상, 실행 파일 (.jpg, .mp3, .mp4, .exe)

### 출력 메소드

- write(출력할 Data)
    - 연결된 파일에 `출력할 Data` 출력한다.
- writelines(문자열을 가진 컬렉션)
    - 리스트, 튜플, 집합이 원소로 가진 문자열들을 한번에 출력한다.
    - text 출력일 경우에만 사용가능.
    - 원소에 문자열 이외의 타입의 값이 있을 경우 TypeError 발생
- "r"는 읽기전용모드이므로 출력 불가 

### 입력 메소드
- read() : 문자열(text mode), bytes(binary mode) 
    - 연결된 파일의 내용을 한번에 모두 읽어 들인다.
- readline() : 문자열(text mode), bytes(binary mode)
    - 한 줄만 읽는다.
    - text 입력일 경우만 사용가능
    - 읽은 라인이 없으면 **빈문자열**을 리턴한다.
- readlines() : 리스트
    - 한번에 다 읽은 뒤 각각의 라인을 리스트에 원소로 담아 반환한다.
- Text Input Stream (TextIOWrapper, BufferedReader)은 Iterable 타입.
    - for문을 이용한 라인단위 순차 조회할 수 있다.

In [12]:
# a.txt파일에 문자열을 출력하는 코드.
# 1. 연결  
fw = open("./a.txt",mode="wt",encoding='utf-8')    # mode 중, default가 r+t
print(type(fw))
# 2. 출력(쓰기)
fw.write("안녕하세요!\n")
fw.write("Hello World!")
# 3. 연결 닫기 : 연결을 끊어야 자유롭게 파일 변경 및 삭제 가능 
fw.close()

<class '_io.TextIOWrapper'>


In [14]:
text_list = ["안녕하세요.\n","반갑습니다.\n","날씨가 좋아요."]
fw2 = open("./b.txt",mode="wt",encoding='utf-8')   # 연결      # 만약 절대경로로 하고싶다면 -> r"C:\temp\b.txt"
# for txt in text_list:  # 쓰기 
#     fw2.write(txt)
fw2.writelines(text_list)      # 반복문 코드와 같은 결과 
fw2.close()  # 연결닫기 

In [17]:
# a.txt의 내용을 읽기 
fr = open("./a.txt","rt")    # 연결 
txt = fr.read()         # 이전에 메모 작성할때는 utf-8로 작성하였음, 그러나 open할때 encoding 정해주지않아 window default인 cp949로 읽으려고 했다가 error 발생 
fr.close()      # 연결 닫기 

UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 0: illegal multibyte sequence

In [20]:
fr = open("./a.txt","rt",encoding= "utf-8")      # 연결 - encodig: utf-8, cp949
txt = fr.read()
fr.close()    # 연결닫기 

In [21]:
txt

'안녕하세요!\nHello World!'

In [23]:
fr2 = open("./b.txt", mode="rt", encoding="utf-8")
txt = fr2.read()    # 한번에 다 읽기
print(txt)

fr2.close()

안녕하세요.
반갑습니다.
날씨가 좋아요.


In [24]:
fr2 = open("./b.txt", mode="rt", encoding="utf-8")
txt = fr2.readlines() 
print(txt)

fr2.close()

['안녕하세요.\n', '반갑습니다.\n', '날씨가 좋아요.']


In [26]:
fr3 = open("./b.txt", mode="rt", encoding="utf-8")

print(fr3.readline())   # 한줄 read
print(fr3.readline())   # (다음) 한줄을 read
print(fr3.readline())   # (다음) 한줄을 read  -> 읽을 것이 없으면 None 반환.

fr3.close()

안녕하세요.

반갑습니다.

날씨가 좋아요.


In [27]:
fr4 = open("./b.txt",'rt',encoding='utf-8')

for num, line in enumerate(fr4,start=1):
    print(num,line.strip())

fr4.close()

1 안녕하세요.
2 반갑습니다.
3 날씨가 좋아요.


## with block

파일과 입출력 작업이 다 끝나면 반드시 연결을 닫아야 한다. 매번 연결을 닫는 작업을 하는 것이 번거롭고 실수로 안 닫을 경우 문제가 생길 수 있다. **with block은 block을 벗어나면 자동으로 연결을 닫아 준다.** 그래서 연결을 닫는 코드를 생략할 수 있다.

- 구문
```python
with open() as 변수: # `변수`는 open()이 반환하는 Stream객체를 참조한다.
    입출력 작업      # 변수를 이용해 입출력 작업을 처리한다.
# with block을 빠져 나오면 close()가 자동으로 실행된다.
```

In [28]:
fr = open("./a.txt","rt",encoding= "utf-8")      # 연결 - encodig: utf-8, cp949
txt = fr.read()
fr.close()    # 연결닫기 

In [29]:
# with block을 이용할 수 있는 객체를 context manager라고 한다.
with open("./a.txt", "rt", encoding="utf-8") as fr:
    txt = fr.read()
    print(txt)
# with block이 끝나면 io.close()가 자동으로 실행된다. 
print("종료") 

안녕하세요!
Hello World!
종료


- 가 -> 2진수  : encoding
- 가 <- 2진수  : decoding

- binary(이미지,동영상,음악...) -> 2진수  : encoding        
- binary(이미지,동영상,음악...) <- 2진수  : decoding
- ※ 과연 각각 다른 형식의 파일을 encoding-decoding 하는 방법이 같을까 , 다름
- a = open(파일경로, "rb") , a.read():bytes
- a = open(파일경로,"wb") , a.write(bytes)


# Binary Data 입출력

## `bytes` type
binary 데이터를 입출력하기 위한 타입.  
파이썬의 하나의 출력함수로 다양한 데이터타입의 값을 출력하기 위해 **bytes 타입으로 변환** 해야 한다. 
또 binary 데이터를 읽을 경우 **bytes 타입**으로 반환한다. 이것을 저장 전 원래 타입으로 쓰기 위해서는 bytes에서 원래 타입으로 변환하는 작업이 필요하다.   

## pickle 모듈을 이용한 객체 직렬화
- pickle 모듈: binary data 입출력을 도와주는 표준 라이브러리.

### 객체 직렬화(Object Serialization) : dump()
- 객체의 속성값들을 bytes로 변환해 출력하는 것을 객체 직렬화(Object Serialization) 이라고 한다.
- bytes로 출력된 데이터를 읽어 객체화 하는 것을 객체 역직렬화(Object Deserialization) 이라고 한다.

### pickle 모듈
- binary 모드로 출력하거나 입력받을 경우 **bytes**  타입으로 입출력을 진행한다.
    - 그런데 각각의 타입이 변환하는 방식이 다르기때문에 입출력 코드가 복잡해 지는 문제가 있다. 이것을 추상화해서 binary 데이터 입출력을 쉽게 처리할 수 있게하는 표준모듈이 pickle이다.
    - 파이썬의 모든 값은 객체 이므로 pickle은 객체 직렬화, 역직렬화를 위한 파이썬 표준모듈이다.

- 저장시 파일 확장자는 보통 `pkl` 이나 `pickle` 로 한다.
- ex)
```python
#### binary mode로 설정한다.
fw = open("data.pkl", "wb") # 객체를 pickle에 저장하기 위한 output stream 생성
fr = open("data.pkl", "rb") # 파일에 저장된 객체를 읽어오기 위한 input stream 생성
```
- **메소드**
    - dump(저장할 객체, fw) : 출력
    - load(fr): 입력 - 읽은 객체를 반환한다.

In [37]:
import pickle
num = 10   # int 
with open("int_data.pkl","wb") as fo:    # int_data.pickle
    # 피클로 저장(출력) -> dump(값, 출력stream)   dump 통해서 직렬화(->bytes변환)
    pickle.dump(num,fo)
    # num(int) -> bytes 변환 -> fo.write(byte)

In [48]:
# 읽기 
with open("int_data.pkl","rb") as fi :
    result = pickle.load(fi) # 읽기 -> load(입력stream)
    # fi.read(): 반환-bytes -> 원래타입(int)로 변환해서 반환.

In [49]:
type(result),result

(int, 10)

In [50]:
fo.write?

[31mSignature:[39m fo.write(buffer, /)
[31mDocstring:[39m
Write buffer b to the IO stream.

Return the number of bytes written, which is always
the length of b in bytes.

Raise BlockingIOError if the buffer is full and the
underlying raw stream cannot accept more data at the moment.
[31mType:[39m      builtin_function_or_method

In [None]:
d = {
    "이름" : '구자현',
    "나이" : "27",
    "주소" : "경기도",
    "취미" : ["게임","운동"],
    "특기" : ("발표","글쓰기"),
    "결혼여부" : True
}

In [67]:
class Person:

    def __init__(self,name,age):
        self.name = name
        self.age = age
    def __str__(self):
        return f"이름: {self.name}, 나이:{self.age}"

d = Person("구자현", 27)
print(d)

이름: 구자현, 나이:27


In [68]:
with open("info.pickle","wb") as fo:
    pickle.dump(d,fo)

In [69]:
with open("info.pickle","rb") as fi:
    saved_info = pickle.load(fi)
    print(type(saved_info))

<class '__main__.Person'>


In [66]:
with open("info.pickle","wb") as fo:
    pickle.dump(d, fo)

In [62]:
d

{'이름': '구자현',
 '나이': '27',
 '주소': '경기도',
 '취미': ['게임', '운동'],
 '특기': ('발표', '글쓰기'),
 '결혼여부': True}

In [63]:
with open("info.pickle","rb") as fi:
    saved_info = pickle.load(fi)
    print(type(saved_info))

<class 'dict'>


In [64]:
saved_info

{'이름': '구자현',
 '나이': '27',
 '주소': '경기도',
 '취미': ['게임', '운동'],
 '특기': ('발표', '글쓰기'),
 '결혼여부': True}

In [65]:
saved_info["취미"]

['게임', '운동']

# TODO

- ## 간단한 CLI 기반 메모장
    1. 사용자로부터 파일명을 입력받는다.
    2. 사용자로부터 파일에 저장할 문장을 입력받아서 파일에 저장한다.
        - 한줄씩 입력받는다.
        - 사용자가 !q 를 입력하면 저장후 종료한다.
    3. 사용자가 저장한 파일을 읽어서 출력한다.


- 입력 : input()
- !q 전까지 계속 입력받아서 저장 - 반복문(while, 조건이 !q아닐때까지)  while True ~ if () == !q ~~
- 저장 : "wt"

In [78]:
# 내가 짠 코드 
filename = input("파일명:")
open(f"./{filename}.txt",mode="wt",encoding='utf-8')

while True:
    q = input("저장할 문장:")
    fw = open(f"./{filename}.txt",mode="wt",encoding='utf-8')
    fw.write(q)
    if q == "!q":
        print("종료~")
        break
fw.close()

파일명: zvzxvxz
저장할 문장: aa
저장할 문장: a
저장할 문장: !q


종료~


In [83]:
%%writefile simple_memo.py
# cmd -> python simple_memo.py    , CLI메모장

#강사님


print("==================CLI메모장=========================")
file_path = input("저장할 파일경로:")
with open(file_path, "wt", encoding="utf-8") as fw:
    print("==================저장할 내용을 한줄씩 입력하세요.=============")
    while True:
        txt = input(">>")
        if txt == '!q':
            break
        fw.write(txt+"\n")
        
print("==============저장되었습니다.===============")

Overwriting simple_memo.py
