# Path (경로)

- **경로(Path)**
    - 프로그램에서 사용할 **자원의 위치를 path(경로)** 라고 한다.
    - **파일 시스템**에서는 파일이나 디렉토리가 있는 위치의 경로를 말한다.
    

- **절대경로**
    - 자원의 전체 경로를 표현하는 방식
    - 시작 경로부터 자원(파일, 디렉토리)이 있는 위치까지 표현한다.
        - 시작 경로: Root Path
            - windows: `c:`, `d:`
            - Unix, Linux: `/`

- **상대경로**
    - 현재 작업 경로(위치)에서 부터 자원이 있는 위치까지 표현한다.
        - 시작 경로: 현재 작업경로
    - 구문
        - `.` : 현재 디렉토리
        - `..`: 상위 디렉토리
        - `/` : 경로 구분자,  상위경로/하위경로

- 운영체제(O/S)별 경로구분자
    - 윈도우즈: `\` (역슬래쉬)
    - 리눅스/유닉스: `/` (슬래쉬)

In [1]:
import os
os.getcwd()

'C:\\DA_30_classes\\01_파이썬기초'

In [None]:
os.chdir(r"C:\\DA_30_classes\\01_파이썬기초")

In [None]:
os.chdir("/Program Files")

In [3]:
os.getcwd()

'C:\\Program Files'

In [None]:
'C:\\Program Files

# 입출력 (IO)

## 입출력이란
- 프로그램이 사용하려는 외부 자원을 연결하여 데이터를 입력 받거나 출력하는 작업을 IO라고 한다.
- 외부 자원
    - 파일, 원격지 컴퓨터(Network으로 연결된 컴퓨터의 자원), 데이터베이스 등.
- **Stream**
    - 입출력 시 **데이터의 흐름을 stream** 이라고 한다.
- InputStream 
    - Program이 외부로 부터 데이터를 읽어 들이는 흐름.
- OutputStream 
    - Program이 외부로 데이터를 써주는 흐름.


![io](images/ch09_01.png)

## IO 코딩 순서
![순서](images/ch09_02.png)

### 파일 열기(연결)
- open() 함수 사용
    - 연결된 파일과 입출력 메소드를 제공하는 객체(Stream)를 리턴
- 구문
    - `open(file, mode='r', encoding=None)`
    - 함수 주요 매개변수
        - file : 연결할 파일 경로
        - mode : 열기 모드
            - mode는 목적, 데이터종류를 조합한 문자열을 사용한다.
        - encoding 
            - 텍스트 파일일 경우 인코딩 방식
            - None 또는 생략하면  os 기본 encoding방식을 따른다.
                - Windows: cp949/euckr
                - Linux, Unix: utf-8
|mode타입|mode문자|설명|
|:-|-|-|
|목적|r|읽기 모드-목적의 기본 모드|
||w|새로 쓰기 모드|
||a|이어 쓰기 모드|
||x|새로 쓰기모드-연결하려는 파일이 있으면 Exception발생|
|데이터종류|b|binary 모드|
||t|Text모드-text데이터 입출력시 사용|
    

### 출력 메소드

- write(출력할 Data)
    - 연결된 파일에 `출력할 Data` 출력한다.
- writelines(문자열을 가진 컬렉션)
    - 리스트, 튜플, 집합이 원소로 가진 문자열들을 한번에 출력한다.
    - text 출력일 경우에만 사용가능.
    - 원소에 문자열 이외의 타입의 값이 있을 경우 TypeError 발생

In [1]:
import os
wd = os.getcwd()
print(type(wd), wd)

<class 'str'> C:\DA_30_classes\01_파이썬기초


In [2]:
os.chdir(r"c:\temp") # working dir(현재 directory)를 변경

In [3]:
os.getcwd()

'c:\\temp'

In [6]:
# a.txt 파일에 문자열을 출력
# 1. a.txt 파일과 연결
fw = open(r"c:\DA_30_classes\a.txt", "wt")  # 절대경로
print(type(fw))
# 2. 문자열을 출력
fw.write("안녕하세요\n")
fw.write("반갑습니다.\n")
fw.write("abcd12345")
# 3. a.txt 파일과 연결 닫기
fw.close()

<class '_io.TextIOWrapper'>


In [57]:
txt = """abcdefg
1234356
가나다라마바사"""
# 연결
fw2 = open('c.txt', 'at') # 상대경로 (현재작업디렉토리 / b.txt)
# 출력
fw2.write(txt)
fw2.write('sdslksjdflkjsdlfksjdlfkjsd')
# fw2.flush() # 버퍼의 출력한 것을 파일에 출력해라.
# 연결 닫기
fw2.close()

In [39]:
os.getcwd()

'c:\\temp'

In [62]:
fw3 = open('e.txt', 'wt', encoding='utf-8')
str_list = [
    "안녕",
    "hello",
    "1234"
]
# for s in str_list:
#     fw3.write(s)
fw3.writelines(str_list)
fw3.close()    

### 입력 메소드
- read() : 문자열(text mode), bytes(binary mode) 
    - 연결된 파일의 내용을 한번에 모두 읽어 들인다.
- readline() : 문자열(text mode), bytes(binary mode)
    - 한 줄만 읽는다.
    - text 입력일 경우만 사용가능
    - 읽은 라인이 없으면 `None`을 리턴한다.
- readlines() : 리스트
    - 한번에 다 읽은 뒤 각각의 라인을 리스트에 원소로 담아 반환한다.
- Input Stream (TextIOWrapper, BufferedReader)는 Iterable 타입
    - for문을 이용한 라인단위 순차 조회할 수 있다.

In [63]:
fr = open('b.txt', 'rt') #연결
result1 = fr.read() #읽기(입력)
print(result1)
fr.close() # 연결 닫기

abcdefg
1234356
가나다라마바사


In [64]:
fr = open('b.txt', 'rt', encoding='utf-8') #연결
result1 = fr.read() #읽기(입력)
print(result1)
fr.close() # 연결 닫기

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb0 in position 18: invalid start byte

In [70]:
fr2 = open('b.txt')
result2 = fr2.readline() # 1줄 읽기. (엔터를 포함)
print(result2)
result2 = fr2.readline() # 1줄 읽기. (엔터를 포함)
print(result2)
result2 = fr2.readline() # 1줄 읽기. (엔터를 포함)
print(result2)
result2 = fr2.readline() # 더 읽을 것이 없으면 빈문자열을 반환
print(result2)
fr2.close()

abcdefg

1234356

가나다라마바사



In [71]:
fr3 = open('b.txt')
result3 = fr3.readlines() # --> writelines()와 연동할때 사용.
print(result3)
fr3.close()

['abcdefg\n', '1234356\n', '가나다라마바사']


In [78]:
fr4 = open('b.txt')
print(type(fr4), fr4.mode)
for line, t in enumerate(fr4, start=1):
    print(f"{line}. {t}", end="")
fr4.close()

<class '_io.TextIOWrapper'> r
1. abcdefg
2. 1234356
3. 가나다라마바사

In [81]:
try:
    # 연결
    fr3 = None
    fr3 = open('b.txt')
    # 입출력
    result3 = fr3.readlines()
    print(result3)
except Exception as e:
    print("처리", e)
finally:
    if fr3:
        fr3.close()

['abcdefg\n', '1234356\n', '가나다라마바사']


## with block

파일과 입출력 작업이 다 끝나면 반드시 연결을 닫아야 한다. 매번 연결을 닫는 작업을 하는 것이 번거롭고 실수로 안 닫을 경우 문제가 생길 수 있다. **with block은 block을 벗어나면 자동으로 연결을 닫아 준다.** 그래서 연결을 닫는 코드를 생략할 수 있다.

- 구문
```python
with open() as 변수: # `변수`는 open()이 반환하는 Stream객체를 참조한다.
    입출력 작업      # 변수를 이용해 입출력 작업을 처리한다.
# with block을 빠져 나오면 close()가 자동으로 실행된다.
```

In [None]:
f = open('a.txt', 'wt')
f.write("aaa\n")
f.write('bbbb\n')
f.close()

In [7]:
os.getcwd()
os.chdir(r"C:\DA_30_classes\01_파이썬기초")

In [9]:
with open('a.txt', 'wt', encoding='utf-8') as f:
    f.write("aaaa\n")
    f.write('bbbbbb\n')
    print(f.closed)
    
print(f.closed)
# f.write('aaa')

False
True


ValueError: I/O operation on closed file.

In [91]:
try:
    with open('a.txt', 'rt', encoding='utf-8') as f:
        print(f.closed)
        txt = f.readline()
except:
    pass
    
print(txt)
print(f.closed)
print(f.readline())

False
aaaa

True


ValueError: I/O operation on closed file.

In [11]:
# context manager 클래스 구현
#  -> with block 에서 사용할 수 있는 객체.
#  -> 1.with 들어갈때, 2. with 구문, 3. with block 을 빠져나올때 무엇을 할지 정의한 클래스

class MyContextManager:
    
    def __init__(self):
        print("객체가 생성될 때 호출")
        
    def __enter__(self):
        print("with block으로 들어갈때 호출")
        return self  # with 생성 as 변수: 변수에 대입될 값을 반환.
    
    def __exit__(self, exc_type, exc_value, exc_traceback):
        # 파라미터들을 with block 구문에서 Exception 발생했을때 
        #                         그 Exception관련 값들을 전달받는다.
        print("with block을 빠져나오기 직전에 호출")

In [12]:
with MyContextManager() as v:
    print('with block 의 실행구문')

객체가 생성될 때 호출
with block으로 들어갈때 호출
with block 의 실행구문
with block을 빠져나오기 직전에 호출


In [13]:
class FileContextManager:
    
    def __init__(self, file_path, mode='rt', encoding="utf-8"):
        self.file_path = file_path
        self.mode = mode
        self.encoding = encoding
        
    def __enter__(self):
        self.stream = open(self.file_path, self.mode, encoding=self.encoding)
        return self.stream
    
    def __exit__(self, exc_type, exc_value, exc_traceback):
        self.stream.close()

In [14]:
with FileContextManager("a.txt") as fr:
    txt = fr.read()
    print(txt)
    print(fr.closed)
    
print(fr.closed)

aaaa
bbbbbb

False
True


In [None]:
# 정수, 실수, 객체, ...... (str을 제외한 모든 타입) 을 출력하기 위해서는 
# bytes 타입으로 변환한다.
# 변환된 bytes 값을 출력한다.


# 저장된 bytes 값을 읽어들이기.
# 읽으면 bytes 타입의 값으로 읽어온다.
# 읽어온 bytes 타입 값을 원래 타입으로 변환 한 뒤 사용.

In [21]:
data = 10 #int
# 정수->bytes 타입
# 1: length => 정수중 저장하려는 크기(byte)
bytes_data = data.to_bytes(1, byteorder='little', signed=True)
print(type(bytes_data))

with open('int_data.dat', 'wb') as fw:
    fw.write(bytes_data)
#     fw.write(data)

<class 'bytes'>


In [27]:
#읽기
with open('int_data.dat', 'rb') as fr:
    read_bytes_data = fr.read()
    print(type(read_bytes_data))
    print(read_bytes_data)
    
# bytes -> 원래타입 int
read_data = int.from_bytes(read_bytes_data, byteorder='little', signed=True)
read_data

<class 'bytes'>
b'\n'


10

In [23]:
b"ssssss"

b'ssssss'

In [25]:
b"11111"

b'11111'

In [26]:
"가나다".encode('utf-8')

b'\xea\xb0\x80\xeb\x82\x98\xeb\x8b\xa4'

# pickle 모듈을 이용한 객체 직렬화

## 객체 직렬화(Object Serialization)
- 객체의 속성값들을 bytes로 변환해 출력하는 것을 객체 직렬화(Object Serialization) 이라고 한다.
- bytes로 출력된 데이터를 읽어 객체화 하는 것을 객체 역직렬화(Object Deserialization) 이라고 한다.

### pickle
- 객체 파일 입출력을 위한 파이썬 모듈
- open() 시 **binary mode**로 설정한다.
- 저장시 파일 확장자는 보통 `pkl` 이나 `pickle` 로 한다.
- ex)
```python
fw = open("data.pkl", "wb") # 객체를 pickle에 저장하기 위한 output stream 생성
fr = open("data.pkl", "rb") # 파일에 저장된 객체를 읽어오기 위한 input stream 생성
```
- **메소드**
    - dump(저장할 객체, fw) : 출력
    - load(fr): 입력 - 읽은 객체를 반환한다.

In [30]:
import pickle

num = 10.5
with open("int_data2.pkl", 'wb') as fw:
    # 출력
    pickle.dump(num, fw)  # (출력할값, output stream)

In [31]:
with open("int_data2.pkl", "rb") as fr:
    # 입력
    read_num = pickle.load(fr)  # (input stream)
    
print(type(read_num))
print(read_num)

<class 'float'>
10.5


In [17]:
%%writefile person_module.py

class Person:
    
    def __init__(self, name, age):
        self.name = name
        self.age = age
        
    def __str__(self):
        return f"name: {self.name}, age: {self.age}"

Writing person_module.py


In [2]:
from person_module import Person

p = Person("홍길동", 20)
print(p)


name: 홍길동, age: 20


In [3]:
import pickle
# Person instance(객체)를 출력
with open("person.pkl", "wb") as fw:
    pickle.dump(p, fw)

In [8]:
with open('person.pkl', 'rb') as fr:
    read_person = pickle.load(fr)

In [9]:
print(type(read_person))
print(read_person)

<class '__main__.Person'>
name: 홍길동, age: 20


In [11]:
l = [Person('a',10), Person('b', 30)]
with open('person_list.pkl', 'wb') as fw:
    pickle.dump(l, fw)

In [12]:
with open('person_list.pkl', 'rb') as fr:
    l2 = pickle.load(fr)

In [16]:
print(l2[0])
print(l2[1])

name: a, age: 10
name: b, age: 30


# TODO

- 간단한 터미널(CLI - command line interface)) 기반 메모장
    1. 사용자로부터 파일명을 입력받는다.
    2. 사용자로부터 파일에 저장할 문장을 입력받아서 파일에 저장한다.
        - 한줄씩 입력받는다.
        - 사용자가 !q 를 입력하면 저장후 종료한다.
    3. 사용자가 저장한 파일을 읽어서 출력한다.


In [5]:
print("> 저장할 파일경로를 입력하세요.")
file_path = input("파일경로:")
print(f"> {file_path} 경로에 저장합니다.")
print("="*50)
with open(file_path, "wt", encoding='utf-8') as fw:
    print("> 저장할 내용을 입력하세요")
    while True:
        line_text = input(">")
        if line_text == '!q':
            break
        fw.write(line_text+"\n")

> 저장할 파일경로를 입력하세요.
파일경로:test2.txt
> test2.txt 경로에 저장합니다.
> 저장할 내용을 입력하세요
>안녕하세요
>안녕하세요
>반갑습니다.
>!q


In [10]:
%%writefile simple_memo.py
# 함수
def memo():
    print("> 저장할 파일경로를 입력하세요.")
    file_path = input("파일경로:")
    print(f"> {file_path} 경로에 저장합니다.")
    print("="*50)
    with open(file_path, "wt", encoding='utf-8') as fw:
        print("> 저장할 내용을 입력하세요")
        while True:
            line_text = input(">")
            if line_text == '!q':
                break
            fw.write(line_text+"\n")
            
if __name__ == "__main__":
    memo()

Overwriting simple_memo.py


In [9]:
import simple_memo as sm
sm.memo()

> 저장할 파일경로를 입력하세요.
파일경로:a.txt
> a.txt 경로에 저장합니다.
> 저장할 내용을 입력하세요
>a
>b
>!q


- member.csv 파일을 읽어서 각 열의 값을 배열에 담는다.    
이름,나이,주소  형태의 csv를 읽어    
```python
names = []
ages =[]
addresses =[]    
```
배열에 넣는다. 
    - 단 첫줄은 head이므로 읽지 않는다.
    - 참고 함수: 문자열 split(), for문 관련 enumerate()



> **CSV (Comma Separated Value)** 파일
> - 데이터들을 정형화(표)된 형태로 텍스트파일에 저장하는 방식
> - 하나의 데이터는 한줄에 표시. (데이터 구분자는 엔터)
> - 하나의 데이터를 구성하는 값들(속성)들은 , 로 구분
>     - tab으로 구분하는 경우 TSV 
>     - 각 속성값들은 " " 로 감싸기도 한다.
> - 텍스트기반
> - 파일 확장자는 `.csv`, `.tsv` 로 준다.

In [25]:
names = []
ages = []
addresses = []

with open('member.csv', 'rt', encoding="utf-8") as fr:
#     l = fr.readlines()
    for index, line_text in enumerate(fr):
        if index == 0: # not index
            continue
        name, age, address = line_text.strip().split(',')
        names.append(name)
        ages.append(age)
        addresses.append(address)

In [26]:
names

['홍길동', '이순신', '유관순', '강감찬', '손흥민']

In [27]:
ages

['25', '27', '23', '25', '31']

In [28]:
addresses

['서울', '인천', '부산', '광주', '춘천']

In [31]:
import pandas as pd

m = pd.read_csv('member.csv')
print(m)
m

    이름  나이  주소
0  홍길동  25  서울
1  이순신  27  인천
2  유관순  23  부산
3  강감찬  25  광주
4  손흥민  31  춘천


Unnamed: 0,이름,나이,주소
0,홍길동,25,서울
1,이순신,27,인천
2,유관순,23,부산
3,강감찬,25,광주
4,손흥민,31,춘천


In [32]:
m['이름']

0    홍길동
1    이순신
2    유관순
3    강감찬
4    손흥민
Name: 이름, dtype: object

In [33]:
m['나이']

0    25
1    27
2    23
3    25
4    31
Name: 나이, dtype: int64

In [34]:
m.iloc[2]

이름    유관순
나이     23
주소     부산
Name: 2, dtype: object