# Path (경로)

- **경로(Path)**
    - 프로그램에서 사용할 **자원의 위치를 path(경로)** 라고 한다.
    - **파일 시스템**에서는 파일이나 디렉토리가 있는 위치의 경로를 말한다.
    

- **절대경로**
    - 자원의 전체 경로를 표현하는 방식
    - 시작 경로부터 자원(파일, 디렉토리)이 있는 위치까지 표현한다.
        - 시작 경로: Root Path
            - windows: `c:`, `d:` (이런 문자로 시작하지 않았으면 다 상대경로)
            - Unix, Linux: `/`

- **상대경로**
    - 현재 작업 경로(위치)에서 부터 자원이 있는 위치까지 표현한다.
        - 시작 경로: 현재 작업경로
    - 구문
        - `.` : 현재 디렉토리
        - `..`: 상위 디렉토리
        - `/` : 경로 구분자,  상위경로/하위경로

- 운영체제(O/S)별 경로구분자
    - 윈도우즈: `\` (역슬래쉬)
    - 리눅스/유닉스: `/` (슬래쉬)

In [1]:
# 경로를 문자열로 표시
file_path1 = "c:\\tlasses\\01_python\\calculater.py"  #절대경로
file_path2 = r"c:\tlasses\01_python\calculater.py"  #r-string: escape 문자 처리를 안함.
print(file_path1)
print(file_path2)

c:\tlasses\01_python\calculater.py
c:\tlasses\01_python\calculater.py


In [2]:
file_path3 = "/src/python/a.py" #  절대경로
file_path4 = "./python/a.py"  # 상대경로. 
file_path5 = "python/a.py"  # 상대경로.   시작의 `./`는 생략 가능
file_path6 = "calculater.py" 
# 상대경로 -> ./calculater.py에서 `./`를 생략. 현재 디렉토리에 있는 calculater.py

In [3]:
# 현재 경로 -> working directory
## => 현재 실행중인 프로그램의 위치
###  주피터노트북-> 노트북파일의 위치
### script 파일 실행 -> script 파일의 위치

In [1]:
# 현재 working directory 조회
import os
cwd = os.getcwd() #get current work directory
print(type(cwd), cwd)

<class 'str'> C:\Users\User\부트캠프 강의-파이썬


In [5]:
#path 함수를 쓰는 방법
#뭐 그래도 쓸 구석은 꽤 있는것 같다.
root = os.getcwd()
src_file = os.path.join(root,"src","abc.py")
print(src_file)

C:\Users\User\부트캠프 강의-파이썬\src\abc.py


In [5]:
# f_path = "./calculater.py"
f_path = "calculater.py"
# 파일이 있는지 여부 조회
os.path.isfile(f_path)  # f_path에 파일이 있는지 여부

True

In [6]:
# 현재 working directory를 변경
os.chdir(r"c:\User_manual")  # ./ => c:\User_manual로 변경
print(os.getcwd())

FileNotFoundError: [WinError 2] 지정된 파일을 찾을 수 없습니다: 'c:\\User_manual'

In [7]:
os.path.isfile(f_path)

True

In [9]:
# os 모듈의 파일/디렉토리 관련 함수들
# 디렉토리 생성
try:
    os.mkdir(r"c:\classes\source") 
    # source디렉토리를 c:\classes 하위에 생성
    ## 이미 디렉토가 있거나, 생성하려는 디렉토리(c:\classes)가 없으면 Exception 발생.
except FileExistsError:  # 이미 있는 디렉토리
    print("생성못함")
    pass
except FileNotFoundError:  # 생성하려는 상위디렉토리가 없어서 발생
    print("상위디렉토리를 먼저 생성")

생성못함


In [6]:
#  exist_ok=False(기본) 이미 있는 디렉토리면 Exception 발생
#  exist_ok=True: 디렉토리가 있으면 무시
#exist_ok같은 옵션이 꽤 중요한듯.

os.makedirs(r"c:\class\source", exist_ok=True)
# 상위 디렉토리가 없으면 상위디렉토리도 만들어준다.

In [7]:
# 디렉토리 삭제 -> 빈 디렉토리만 삭제 가능.
# os.rmdir(r"c:\class")
os.rmdir(r"c:\class\source")

In [8]:
os.rmdir(r"c:\class")

In [9]:
# 파일 삭제
os.remove(r"c:\classes\아나콘다_주피터노트북_설치.pdf")
# 경로: 상대/절대 모두 가능.

FileNotFoundError: [WinError 2] 지정된 파일을 찾을 수 없습니다: 'c:\\classes\\아나콘다_주피터노트북_설치.pdf'

In [10]:
file_list = os.listdir(r"C:\classes\01_Python") 
#지정한 디렉토리의 하위요소들의 이름 문자열을 리스트에 담아 반환.

In [11]:
file_list

['files']

In [12]:
os.path.join("a", "b", "c", "d")

'a\\b\\c\\d'

In [13]:
root_path = r"c:\classes\01_Python"
for file in file_list:
    file_path = os.path.join(root_path, file)
#     print(file_path)
#     break
    if os.path.isfile(file_path):
        print("File-", file)
    elif os.path.isdir(file_path):
        print("Dir-", file)

Dir- files


# 입출력 (IO)

## 입출력이란
- 프로그램이 사용하려는 외부 자원을 연결하여 데이터를 입력 받거나 출력하는 작업을 IO라고 한다.
- 외부 자원
    - 파일, 원격지 컴퓨터(Network으로 연결된 컴퓨터의 자원), 데이터베이스 등.
- **Stream**
    - 입출력 시 **데이터의 흐름을 stream** 이라고 한다.'
    - 참고로 stream은 '강물','계곡' 등으로 해석할 수 있다.
    - 이러한 것들은 class를 통해 구현을 할 수 있다.
- InputStream 
    - Program이 외부로 부터 데이터를 읽어 들이는 흐름.
- OutputStream 
    - Program이 외부로 데이터를 써주는 흐름.


![io](images/ch09_01.png)

## IO 코딩 순서
![순서](images/ch09_02.png)

### 파일 열기(연결)
- open() 함수 사용
    - 연결된 파일과 입출력 메소드를 제공하는 객체(Stream)를 리턴
- 구문
    - `open(file, mode='r', encoding=None)`
    - 함수 주요 매개변수
        - file : 연결할 파일 경로
        - mode : 열기 모드
            - mode는 목적, 데이터종류를 조합한 문자열을 사용한다.
        - encoding 
            - 텍스트 파일일 경우 인코딩 방식
            - None 또는 생략하면  os 기본 encoding방식을 따른다.
                - Windows: cp949/euckr
                - Linux, Unix: utf-8
|mode타입|mode문자|설명|
|:-|-|-|
|목적|r|읽기 모드-목적의 기본 모드|
||w|새로 쓰기 모드|
||a|이어 쓰기 모드|
||x|새로 쓰기모드-연결하려는 파일이 있으면 Exception발생|
|데이터종류|b|binary 모드|
||t|Text모드-text데이터 입출력시 사용|
    

### 출력 메소드

- write(출력할 Data)
    - 연결된 파일에 `출력할 Data` 출력한다.
- writelines(문자열을 가진 컬렉션)
    - 리스트, 튜플, 집합이 원소로 가진 문자열들을 한번에 출력한다.
    - text 출력일 경우에만 사용가능.
    - 원소에 문자열 이외의 타입의 값이 있을 경우 TypeError 발생

In [19]:
import os
os.chdir(r"c:\classes\01_python") 
print(os.getcwd())

c:\classes\01_python


In [20]:
# 출력할 파일들을 저장할 디렉토리를 생성
os.makedirs("files", exist_ok=True)
# 1. 출력할 파일과 연결
fw = open("files/test.txt", #연결할 파일의 경로
          mode="wt", # w: 출력(파일이 없으면 만들어서 연결, 있으면 연결후에 파일내용을 삭제), t: text -> 생략가능.
          encoding="utf-8" # 문자열 인코딩 방식. 생략: os의 기본 인코딩방식(win:cp949, mac: utf-8)
         )
print(type(fw))
# 2. 출력(Output) 작업
fw.write("안녕하세요.\n")
fw.write("반갑습니다.\n")
fw.write("Hello World")

# 3. 파일과 연결 닫기
fw.close()

<class '_io.TextIOWrapper'>


In [21]:
# 1. 출력할 파일과 연결
fw = open("files/test2.txt", #연결할 파일의 경로
          mode="at", # a: 출력-이어쓰기, t: text -> 생략가능.
          encoding="utf-8" # 문자열 인코딩 방식. 생략: os의 기본 인코딩방식(win:cp949, mac: utf-8)
         )
print(type(fw))
# 2. 출력(Output) 작업
fw.write("안녕하세요.\n")
fw.write("반갑습니다.\n")
fw.write("Hello World")

# 3. 파일과 연결 닫기
fw.close()

<class '_io.TextIOWrapper'>


In [23]:
# 연결
fw = open("files/test4.txt", "wt", encoding="utf-8")
txt = ["aaaaaa", "1111111", '가가가가가가가', "3333333", "ggggggg"]
# 출력
# for t in txt:
#     fw.write(t)
fw.writelines(txt)  # 엔터를 자동으로 넣어주지 않음.

# 연결닫기
fw.close()

In [24]:
#### TextIOWrapper (fw) 의 속성 조회 => 연결 Stream 정보
print(fw.mode, fw.encoding, fw.name)
print("연결 여부를 확인: ", fw.closed)
"연결닫힘" if fw.closed else "연결중임"

wt utf-8 files/test4.txt
연결 여부를 확인:  True


'연결닫힘'

In [25]:
fw = open("files/test4.txt", "wt")
print(fw.closed)

False


In [26]:
fw.close()

### 입력 메소드
- read() : 문자열(text mode), bytes(binary mode) 
    - 연결된 파일의 내용을 한번에 모두 읽어 들인다.
- readline() : 문자열(text mode), bytes(binary mode)
    - 한 줄만 읽는다.
    - text 입력일 경우만 사용가능
    - 읽은 라인이 없으면 `빈문자열`을 리턴한다.
- readlines() : 리스트
    - 한번에 다 읽은 뒤 각각의 라인을 리스트에 원소로 담아 반환한다.
- Input Stream (TextIOWrapper, BufferedReader)는 Iterable 타입
    - for문을 이용한 라인단위 순차 조회할 수 있다.

In [28]:
# 읽기
## 1. 연결
fr = open("files/test.txt", mode="rt", # r: 기본, t: 기본 (rt일 경우는 생략가능.)
         encoding="utf-8")
## 2. 읽기
read_txt = fr.read() # 전체를 한번에 읽어온다.
print(read_txt)

## 3. 연결닫기
fr.close()

안녕하세요.
반갑습니다.
Hello World


In [29]:
## 1. 연결
fr = open("files/test.txt", mode="rt", # r: 기본, t: 기본 (rt일 경우는 생략가능.)
         encoding="utf-8")
## 2. 읽기
# read_txt = fr.readline()  #  한줄만 읽는다. ........\n (엔터 까지만 읽는다.)
# print(read_txt)
# read_txt = fr.readline()
# print(read_txt)
read_txt = fr.readline() # 한줄 읽은 것이 없으면 빈문자열 반환.
while read_txt:
    print(read_txt, end="")
    read_txt = fr.readline()


## 3. 연결닫기
fr.close()

안녕하세요.
반갑습니다.
Hello World

In [30]:
fr = open("files/test.txt", mode="rt", encoding="utf-8")
txt_list = fr.readlines()
fr.close()

print(txt_list)

['안녕하세요.\n', '반갑습니다.\n', 'Hello World']


In [31]:
for line_no, txt in enumerate(txt_list, start=1):
    print(f"{line_no}. {txt.strip()}")

1. 안녕하세요.
2. 반갑습니다.
3. Hello World


In [32]:
fr = open("files/test.txt", mode="rt", encoding="utf-8")
# Text입력 Stream (TextIOWrapper) ==> Iterable 타입 ===> for in 문으로 사용가능
## ===> 한번 반복할 때마다 한줄 읽은 것을 반환.

for ln, txt in enumerate(fr, start=1):
    print(ln, txt.strip())

fr.close()

1 안녕하세요.
2 반갑습니다.
3 Hello World


In [33]:
# 앞의 2줄만 읽기
fr = open("files/test.txt", mode="rt", encoding="utf-8")
for _ in range(2):
    print(fr.readline())
fr.close()

안녕하세요.

반갑습니다.



## with block

파일과 입출력 작업이 다 끝나면 반드시 연결을 닫아야 한다. 매번 연결을 닫는 작업을 하는 것이 번거롭고 실수로 안 닫을 경우 문제가 생길 수 있다. **with block은 block을 벗어나면 자동으로 연결을 닫아 준다.** 그래서 연결을 닫는 코드를 생략할 수 있다.

- 구문
```python
with open() as 변수: # `변수`는 open()이 반환하는 Stream객체를 참조한다.
    입출력 작업      # 변수를 이용해 입출력 작업을 처리한다.
# with block을 빠져 나오면 close()가 자동으로 실행된다.
```

In [34]:
fr = open("files/test.txt", "rt", encoding="utf-8") 

In [35]:
with open("files/test.txt", "rt", encoding="utf-8") as fr:
    txt = fr.read()
#     print(10/0)

# with block을 빠져 나옴. => 자동을 stream이 close 된다.
print(txt)
print(f"fr 연결여부: {fr.closed}")


안녕하세요.
반갑습니다.
Hello World
fr 연결여부: True


In [17]:
#todo---->1.파일명 입력, 2.연결 3.!q가 입력될 때까지 출력 4.close

#이 코드를 적으면 좋다.

"""
os.makedirs("files",exist_ok=True)
"""


#시간이 나면 강의 자료를 참고해 보아도 좋다.
#강의 자료에는 다른 방법들도 있다.

name = input("파일 이름을 입력하세요.") #파일명 입력
print(name)
file = open(f"files/{name}.txt","wt",encoding="utf-8")  #연결


statement = str(input("파일에 적고 싶은 내용을 입력하세요."))   #!q가 입력될 때까지 출력

while(statement!="!q"): #언제 끝이 날지 모르니 계속하는 것.
    file.write(f"{statement}\n")
    statement = str(input("파일에 적고 싶은 내용을 입력하세요."))
    #file.flush()  ---------> buffer의 내용을 연결된 자원에 출력
    #flush를 사용하면 close를 사용하지 않더라도 내용 저장 가능.
    #close
print("!q를 입력하셨습니다. 프로세스를 종료합니다.")
file.close() #이거 안하면 안된다.



#일시적으로 filenotfounderror가 난 것은 현재 디렉토리를 원하는 대로 
#설정하지 않았기 때문이다.

파일 이름을 입력하세요.scatman john
scatman john


FileNotFoundError: [Errno 2] No such file or directory: 'files/scatman john.txt'

In [None]:
try:
    연결
    입/출력
except:
    예외처리
finally:
    fr.close()

In [None]:
#이런 식으로도 todo문제를 해결할 수 있다.

with open(file_path,'wt',encoding="utf-8")as fw:
    print(" 저장랑 내용을 입력하세요.")
    while True:
        #한 줄 읽기
        line_txt = input(">>>")
        #!q 입력됐으면 종료
        if line_txt == "!q":
            break
            #파일 출력
        fw.write(line_txt+"\n")
        
#with block 종료시 close는 자동을 처리
print("종료")

# binary 데이터 입출력
binary data ->  텍스트 인코딩을 하지 않고 입출력하는 데이터
binary data를 출력을 할 때 bytes라는 타입으로 변환 후 출력을 한다. 타입마다 출력하려는 형식이 약간씩은 다르다보니 그렇게 받는 것이다. 

그냥 bytes 타입으로 통일을 혔다! 이렇게 보시면 되겠다.


(bytes 타입은 어렵게 생각하지 말고, 그냥 2진수라고 보면 된다.)

그래서 binary의 타입의 bytes이다. 그래. 데이터 타입이 약간 특이하지.

binary data를 입력을 받으면, 'bytes' 타입으로 반환한다.


그래서 각 타입을 출력시 bytes 타입으로 변환해야 하고,

입력을 받을 때는 bytes를 각 타입으로 변환해야 한다.



그래서, 이런 작업을 해 주는 것이 바로 pickle이다.



In [None]:
#예시----그냥 코드만 봐라. 자세히는 몰라도 되긴 하는데......ㅎㅎㅎ
#binary data로 출/입력
#정수 i를 bytes 타입을 변환
#(크기======>(1바이트,2바이트,4바이트,8바이트,16바이트), 구성방식(0을 앞에 둘 것인가 뒤에 둘 것인가), 부호 있는지의 여부)
#byteorder - little: 유효숫자이외의 0을 앞에 채움 big: 유효 숫자 이외의 0을 뒤에 채움.(10000000)
#저장할 때와 읽어들일 때의 byteorder를 맞추기만 하면 된다.
#signed = True는 부호를 따로 거시기하지 않는다.


i=10
i_bytes = i.to_bytes(1,byteorder="little",signed=True) #'이런 식으로 변환을 하는구나'라고 생각을 하면 되겠다.
with open("files/data.txt",'wt') as fr:
    #text mode로 출력. str 타입만 가능.
    fw.write(i_bytes) #이렇게 하면 우리가 원하는 이진 데이터의 형식으로 저장을 한다.
    
    

In [None]:
with open("files/data2.data","rb") as fi:
    value =fi.read() #이렇게 데이터를 불러오면 type으 bytes가 나온다.

In [None]:
#bytes--->int 변환

i_value =int.from_bytes(value,byteorder="little",singed=True)
print(i_value + 50)

In [23]:
#출력:int(원래 타입)--------------출력하기 위해서 bytes로 변환---------------------그런 다음 출력---------->저장--------->입력 받음
#위와 같은 과정을 거친 다음에 비로소 원래 타입인 ,int로 바꾼다.


#근데 이렇게 변환하는 방식이 type마다 다르다.
#그거를 해주는게 pickle이다. 이거를 쓰면 복잡하게 할 필요가 없다.



In [None]:
with open("files/data.txt",'rt') as fr:
    a = fr.read()

print(int(a)+20)

In [None]:
i = 10
#binary data로 출/입력

with open("file/data2.dat","wb") as fo:
    #print(type(fo)) #wb는 binary이고, 그렇기 때문에 type 형이 다르다.
    fo.write(i) 

# pickle 모듈을 이용한 객체 직렬화

## 객체 직렬화(Object Serialization)
- 객체의 속성값들을 bytes로 변환해 출력하는 것을 객체 직렬화(Object Serialization) 이라고 한다.
- bytes로 출력된 데이터를 읽어 객체화 하는 것을 객체 역직렬화(Object Deserialization) 이라고 한다.

### pickle
- 객체 파일 입출력을 위한 파이썬 모듈
- open() 시 **binary mode**로 설정한다.
- 저장시 파일 확장자는 보통 `pkl` 이나 `pickle` 로 한다.
- ex)
```python
fw = open("data.pkl", "wb") # 객체를 pickle에 저장하기 위한 output stream 생성
fr = open("data.pkl", "rb") # 파일에 저장된 객체를 읽어오기 위한 input stream 생성
```
- **메소드**
    - dump(저장할 객체, fw) : 출력
    - load(fr): 입력 - 읽은 객체를 반환한다.

In [38]:
#예시
#이것도 그렇게까지 막 중요하진 않다.

i = 10

import pickle
#출력---->직렬화

with open("int_data.pickle","wb") as fo: #객체를 pickle에 저장하기 위해!!
    pickle.dump(i,fo)



In [39]:
#입력----->역직렬화

with open("int_data.pickle","rb") as fi:
    r_value = pickle.load(fi)

In [40]:
#출력

type(r_value),r_value

(int, 10)

In [None]:
from my_package import test_module as tm
p  = tm.Person("홍길동",20)
print(p)

In [None]:
f_name = "files/person.pickle"
with open(f_name,"wb") as fo:
    pickle.dump(p,fo) #저장하기 위한 메소드

In [None]:
with open(f_name,"rb") as fi:
    r_person = pickle.load(fi)#load하기 위한 메소드

In [None]:
type(r_person)
print(r_person)

# TODO

- 간단한 터미널 기반 메모장
    1. 사용자로부터 파일명을 입력받는다.
    2. 사용자로부터 파일에 저장할 문장을 입력받아서 파일에 저장한다.
        - 한줄씩 입력받는다.
        - 사용자가 !q 를 입력하면 저장후 종료한다.
    3. 사용자가 저장한 파일을 읽어서 출력한다.


In [None]:
# 1. 파일명 입력

# 2. 연결

# 3. !q가 입력될때까지 출력

# 4. close (종료)

- member.csv 파일을 읽어서 각 열의 값을 배열에 담는다.    
이름,나이,주소  형태의 csv를 읽어    
```python
names = []
ages =[]
addresses =[]    
```
리스트에 넣는다. 
- 단 첫줄은 head이므로 읽지 않는다.
- 참고 함수: 문자열 split(), for문 관련 enumerate()



In [20]:
#data파일에 풀이와 여러가지 코드, 설명들이 있다.

> **CSV (Comma Separated Value)** 파일
> - 데이터들을 정형화(표)된 형태로 텍스트파일에 저장하는 방식
> - 행은 하나의 데이터를 나타내고, 열은 하나의 속성을 나타낸다.
> - 첫번째줄은 데이터 속성을 나타낸다.(예:이름,나이,주소)
> - 하나의 데이터는 한줄에 표시. (데이터 구분자는 엔터)
> - 하나의 데이터를 구성하는 값들(속성)들은 , 로 구분
>     - tab으로 구분하는 경우 TSV 
>     - 각 속성값들은 " " 로 감싸기도 한다.
> - 텍스트기반(그러므로 데이터를 저장하는 데에 가장 좋다.)
> - 파일 확장자는 `.csv`, `.tsv` 로 준다.
> - 여담으로 캐글 같은 곳에 가면 데이터를 csv로 준다.

In [19]:
#8월 25일 수업에서 했던 내용 코드. 잘 복습을 해보자. 코드를 보면 쉽다.

import os
cwd = os.getcwd()
print(cwd)

os.chdir(r"C:\Users\User\부트캠프 강의-파이썬\data")
print(os.getcwd()) #현재 위치를 바꾼다.

#member.csv파일을 연다.
fw = open("members.csv",mode="rt",encoding="utf-8")
print(type(fw))

read_txt = fw.read()
print(read_txt)

fw.close()


names=[]
ages=[]
addresses=[]
read_number=0
#member.csv파일을 연다.
fw = open("member.csv",mode="rt",encoding="utf-8")
print(type(fw))

read_txt = fw.readline() #첫번째 줄은 생략!!
while read_txt:
    if read_number==0:
        read_number+=1
        
    else:
        print(read_txt.split(","))
        names.append(read_txt.split(",")[0])
        ages.append(read_txt.split(",")[1])
        addresses.append(read_txt.split(",")[2].strip())
   
    read_txt=fw.readline()
    read_number+=1
    
fw.close()

print(names,ages,addresses)


for ln,txt in enumerate(names,start=1):
    print(ln,txt.strip())
for ln,txt in enumerate(ages,start=1):
    print(ln,txt.strip())    
for ln,txt in enumerate(addresses,start=1):
    print(ln,txt.strip())    

C:\Users\User\부트캠프 강의-파이썬\data
C:\Users\User\부트캠프 강의-파이썬\data
<class '_io.TextIOWrapper'>

<class '_io.TextIOWrapper'>
['유재석', '30', '서울\n']
['박명수', '35', '인천\n']
['정준하', '40', '부산\n']
['노홍철', '55', '광주\n']
['정형돈', '60', '대구']
['유재석', '박명수', '정준하', '노홍철', '정형돈'] ['30', '35', '40', '55', '60'] ['서울', '인천', '부산', '광주', '대구']
1 유재석
2 박명수
3 정준하
4 노홍철
5 정형돈
1 30
2 35
3 40
4 55
5 60
1 서울
2 인천
3 부산
4 광주
5 대구
