## 파일의 경로(Path)
- 절대경로(Absolute path): 시작 디렉토리(폴더-Root 디렉토리)부터 자원의 경로를 표현하는 방식
    - windows: c:\text\python\io.txt  - c:\ root director, 경로구분자: \\(역슬래시)
    - 리눅스/유닉스:  \text\python\io.txt  - \ : root directory, 경로구분자: /(슬래시)
- 상대경로: 현재 디렉토리에서부터 찾아가는 경로 표현방식
    - "." : 현재 디렉토리
    - ".." : 상위 디렉토리
    - " / ", " \\ " : 경로구분자

### os 모듈
- 표준 모듈 (설치는 필요 없지만 import는 해야한다)
- 운영 체제(os)에서 제공하는 기능들을 파이선 프로그램에서 사용할 수 있도록 도와주는 모듈

In [1]:
import os

In [2]:
# 현재 디렉토리를 문자열로 반환
curr_dir = os.getcwd()  # current work directory
print(curr_dir)  # 주피터 노트북: 현재 작성하는 ipynb 파일이 위치한 경로

C:\Users\Playdata\코딩


In [5]:
# 현재 디렉토리를 변경하고 싶다
os.chdir("C:\\Users\Playdata\Desktop\파이싸ㅡㄴ")

In [6]:
os.getcwd()

'C:\\Users\\Playdata\\Desktop\\파이싸ㅡㄴ'

#### escape문자
- "\문자"로 시작하는 문자. text로 표현하지 못하는 문자를 표현하는 문자
- "\n": 엔터
- "\t": 탭

In [13]:
print("a\tb")
print("\\t는 탭입니다")
print("c\\src\\a.py")
print("c:/src/a.py") # 파이썬에서 문자열로 파일 경로 표시할떄 windows라고 해도 /를 사용해도 인식
print(r"c:\src\a.py") # raw string => \를 escape 문자의 접두어로 인식하지 않게 함


a	b
\t는 탭입니다
c\src\a.py
c:/src/a.py
c:\src\a.py


In [14]:
os.chdir(curr_dir)
os.getcwd()

'C:\\Users\\Playdata\\코딩'

In [15]:
# 특정 디렉토리 안에 있는 하위 디렉토리나 파일들의 이름을 리스트에 담아서 반환
# path를 지정하거나 생략하면 현재 디렉토리 내의 내용을 반환
path_list = os.listdir()
path_list

['.ipynb_checkpoints',
 '01_변수2.ipynb',
 '01_변수_데이터타입.ipynb',
 '02_자료구조.ipynb',
 '03_제어문.ipynb',
 '03_함수.ipynb',
 '04_객체지향 프로그래밍.ipynb',
 '06_module_package_import.ipynb',
 '07_예외와 예외처리.ipynb',
 '08_입출력_IO.ipynb',
 'my_module.py',
 'my_package',
 '__pycache__',
 '낙서장.ipynb',
 '알고리즘 스터디.ipynb']

In [16]:
# ipynb 파일들만 가진 리스트
[filename for filename in os.listdir() if filename.endswith(".ipynb")]

['01_변수2.ipynb',
 '01_변수_데이터타입.ipynb',
 '02_자료구조.ipynb',
 '03_제어문.ipynb',
 '03_함수.ipynb',
 '04_객체지향 프로그래밍.ipynb',
 '06_module_package_import.ipynb',
 '07_예외와 예외처리.ipynb',
 '08_입출력_IO.ipynb',
 '낙서장.ipynb',
 '알고리즘 스터디.ipynb']

In [17]:
os.listdir(r"c:\Program Files")

['AhnLab',
 'Android',
 'Common Files',
 'desktop.ini',
 'Elantech',
 'Intel',
 'Internet Explorer',
 'ModifiableWindowsApps',
 'MSBuild',
 'NPKI',
 'Reference Assemblies',
 'Uninstall Information',
 'Windows Defender',
 'Windows Defender Advanced Threat Protection',
 'Windows Mail',
 'Windows Media Player',
 'Windows Multimedia Platform',
 'Windows NT',
 'Windows Photo Viewer',
 'Windows Portable Devices',
 'Windows Security',
 'Windows Sidebar',
 'WindowsApps',
 'WindowsPowerShell',
 'Wizvera']

In [18]:
# 디렉토리 만들기
os.mkdir("test") # os.mkdir("./test") 현재 디렉토리에 test 디렉토리 만듦

In [19]:
os.mkdir("test") #못 만들면 예외 발생

FileExistsError: [WinError 183] 파일이 이미 있으므로 만들 수 없습니다: 'test'

In [20]:
os.mkdir(r"test1\test2\test3")

FileNotFoundError: [WinError 3] 지정된 경로를 찾을 수 없습니다: 'test1\\test2\\test3'

In [22]:
os.makedirs(r"test1\test2\test3") # test1/test2 아래 test3 만들기

In [23]:
 os.makedirs(r"test1\test2\test4") # 없는 경로는 다 만든다

In [26]:
# 디렉토리 삭제하는 법
os.rmdir(r"test1\test2\test3") # test3을 삭제

FileNotFoundError: [WinError 2] 지정된 파일을 찾을 수 없습니다: 'test1\\test2\\test3'

In [27]:
os.rmdir(r"test1") # 빈 디렉토리만 삭제 가능

OSError: [WinError 145] 디렉터리가 비어 있지 않습니다: 'test1'

In [28]:
os.removedirs(r"test1\test2\test4")

In [30]:
os.removedirs(r"test1/test2")  #test1, test2 모두 삭제

# test1 밑에 test2만 있으면 test1, test2 모두 삭제
# test1 밑에 test2와 다른 디렉토리/파일이 있으면 test2만 삭제

FileNotFoundError: [WinError 3] 지정된 경로를 찾을 수 없습니다: 'test1/test2'

In [None]:
# 파일 삭제
os.remove()

### os.path 모듈
- 경로 관련 처리를 하는 모듈

In [32]:
import os

In [33]:
# 파일이나 디렉토리가 있는지 여부
os.path.exists("a.txt"), os.path.exists("my_module.py")

(False, True)

In [36]:
# 디렉토리인지의 여부(없으면 False)
os.path.isdir("my_module.py"), os.path.isdir("test"), os.path.isdir("aaaa")

(False, True, False)

In [35]:
os.mkdir("test")

In [39]:
# 파일인지 여부(없으면 False)
os.path.isfile("my_module.py"), os.path.isfile("test"), os.path.isfile("aaa.txt")

(True, False, False)

In [41]:
path = "test"
if not os.path.isdir(path):  # test 디렉토리가 없으면?
    os.mkdir(path)

In [43]:
# 경로를 문자열로 조합해주는 함수
path = os.path.join("C:\project", "data", "image")
print(path)

C:\project\data\image


In [None]:
r"c:\project\data\image"

In [None]:
# C:\project  프로젝트 경로
#   데이터들을 저장할 경로: data
#      이미지 데이터: img
#      텍스트 데이터: txt
#   소스 경로: src

In [51]:
base_dir = r"c:\project"
# src_dir = base_dir + r"\src"
src_dir = os.path.join(base_dir, "src")
data_dir = os.path.join(base_dir, "data")
data_img_dir = os.path.join(data_dir, "img")
data_txt_dir = os.path.join(data_dir, "txt")

In [56]:
img1_file = os.path.join(data_img_dir, "1.jpg")
print(img1_file)

c:\project\data\img\1.jpg


In [45]:
src_dir

'c:\\project\\src'

In [47]:
data_dir

'c:\\project\\data'

In [49]:
data_img_dir

'c:\\project\\data\\img'

In [52]:
data_txt_dir

'c:\\project\\data\\txt'

In [57]:
!cd

C:\Users\Playdata\코딩


In [59]:
!dir

 C 드라이브의 볼륨에는 이름이 없습니다.
 볼륨 일련 번호: 3C67-7697

 C:\Users\Playdata\코딩 디렉터리

2021-01-19  오후 02:14    <DIR>          .
2021-01-19  오후 02:14    <DIR>          ..
2021-01-19  오전 10:22    <DIR>          .ipynb_checkpoints
2021-01-06  오전 10:48            22,260 01_변수2.ipynb
2021-01-06  오전 09:12            43,593 01_변수_데이터타입.ipynb
2021-01-07  오후 12:17            72,932 02_자료구조.ipynb
2021-01-11  오전 09:46            49,337 03_제어문.ipynb
2021-01-12  오후 02:49            53,512 03_함수.ipynb
2021-01-15  오전 11:35            56,159 04_객체지향 프로그래밍.ipynb
2021-01-15  오후 04:50            11,494 06_module_package_import.ipynb
2021-01-18  오후 05:02            15,721 07_예외와 예외처리.ipynb
2021-01-19  오후 02:14            21,397 08_입출력_IO.ipynb
2021-01-15  오후 02:44               218 my_module.py
2021-01-15  오후 04:33    <DIR>          my_package
2021-01-19  오후 12:25    <DIR>          test
2021-01-15  오후 02:44    <DIR>          __pycache__
2021-01-14  오후 11:37            26,193 낙서장.ipynb
2021-01-13  오후 11:23             

# 텍스트 파일 입출력
1. 연결 - open()
2. 입출력 - read()/write()
3. 연결 닫기 - close()

In [61]:
# 현재 디렉토리 안에 있는 a.txt와 연결
# wt: 쓰기 + 텍스트 모드
# encoding 생략: os 기본 인코딩 - win: cp949, 유닉스(맥)/리눅스: utf-8
f = open("a.txt", "wt")  # "w" == "wt", t는 기본이므로 생략 가능

In [64]:
# 출력
txt = """안녕하세요.
ABCDE
12345"""
f.write(txt) # 18: 글자수

18

In [67]:
f.write("\n두번째로 쓴 내용")

10

In [68]:
# 연결 닫기
f.close()

In [69]:
f.write("세번째")

ValueError: I/O operation on closed file.

In [79]:
file = os.path.join(os.getcwd(), "my_text.txt")
print(file)
# 출력 모드일 때 파일이 없으면 파일을 생성함
# w : 덮어쓰기
f = open(file, "w")
f.write("첫번째 줄\n")
f.write("두번째 줄\n")
f.write("세번째 줄")
# 연결 닫기
f.close()

C:\Users\Playdata\코딩\my_text.txt


In [84]:
file = os.path.join(os.getcwd(), "my_text2.txt")
print(file)
# 출력 모드일 때 파일이 없으면 파일을 생성함
# a : 이어쓰기
f = open(file, "at")
f.write("첫번째 줄\n")
f.write("두번째 줄\n")
f.write("세번째 줄")
# 연결 닫기
f.close()

C:\Users\Playdata\코딩\my_text2.txt


In [125]:
file = os.path.join(os.getcwd(), "my_text3.txt")
print(file)
# 출력 모드일 때 파일이 없으면 파일을 생성함
# a : 이어쓰기
f = open(file, "at")
f.write("첫번째 줄\n")
f.write("두번째 줄\n")
f.write("세번째 줄\n")
# 연결 닫기
f.close()

C:\Users\Playdata\코딩\my_text3.txt


In [120]:
file = os.path.join(os.getcwd(), "my_text4.txt")
print(file)
# 출력 모드일 때 파일이 없으면 파일을 생성함
# a : 이어쓰기
f = open(file, "at")
f.write("첫번째 줄\n")
f.flush()  # 버퍼(메모리)를 비워라 => 파일에 써라 
f.write("두번째 줄\n")
f.flush()
f.write("세번째 줄\n")
# 연결 닫기

C:\Users\Playdata\코딩\my_text4.txt


6

In [121]:
f.close()

In [122]:
file = "my_text3.txt"
# 읽기 / 텍스트
# 읽기 모드인 경우 파일이 반드시 존재해야 한다.
try:
    # 연결
    fi = open(file, "rt")
    # 읽기
    txt = fi.read() # 파일에서 읽은 데이터(텍스트)를 반환. read(): 한번에 전체를 읽어줌
    print(txt)
except:
    print(f"파일 {file}를 읽는 도중 오류 발생")
finally:
    # 연결 닫기는 finally에서 처리
    fi.close()

첫번째 줄
두번째 줄
세번째 줄첫번째 줄
두번째 줄
세번째 줄첫번째 줄
두번째 줄
세번째 줄첫번째 줄
두번째 줄
세번째 줄첫번째 줄
두번째 줄
세번째 줄첫번째 줄
두번째 줄
세번째 줄첫번째 줄
두번째 줄
세번째 줄첫번째 줄
두번째 줄
세번째 줄첫번째 줄
두번째 줄
세번째 줄



In [127]:
try:
    fi = open("my_text3.txt")  # rt 모드
#     txt = fi.read()  # 전체를 읽어옴
    txt_list = fi.readlines()
    print(type(txt_list))  # 한 줄을 하나의 문자열로써 리스트로 묶어 반환
    print(txt_list)
except:
    print("오류 발생")
finally:
    fi.close()

<class 'list'>
['첫번째 줄\n', '두번째 줄\n', '세번째 줄첫번째 줄\n', '두번째 줄\n', '세번째 줄첫번째 줄\n', '두번째 줄\n', '세번째 줄첫번째 줄\n', '두번째 줄\n', '세번째 줄첫번째 줄\n', '두번째 줄\n', '세번째 줄첫번째 줄\n', '두번째 줄\n', '세번째 줄첫번째 줄\n', '두번째 줄\n', '세번째 줄첫번째 줄\n', '두번째 줄\n', '세번째 줄첫번째 줄\n', '두번째 줄\n', '세번째 줄\n', '첫번째 줄\n', '두번째 줄\n', '세번째 줄\n']


In [131]:
try:
    fi = open("my_text3.txt")
    # 입력 Stream(fi) = iterable 타입 => for in문에서 사용시 한 번 반복할 때 한 줄 반환
    for index, line_text in enumerate(fi, start=1):
        print(f"{index}. {line_text)", end="")
    
    
except:
    print("오류 발생")
finally:
    fi.close()

SyntaxError: f-string: unmatched ')' (<ipython-input-131-4fed5d53c445>, line 5)

In [None]:
try:
    1. 연결
    2. 입출력
except:
    연결, 입출력 시 발생한 예외 처리
finally:
    3. 연결 닫기 = 무 적 권 해야함
    

In [133]:
try:
    f = open("my_text3.txt")

SyntaxError: unexpected EOF while parsing (<ipython-input-133-efbefc021ea0>, line 3)

with open("my_text3.txt) as fi:

In [None]:
try:
    fo = open("test.txt", "wt")
    x = fi.read()
    print(x)
finally:
    fi.close()

In [135]:
try:
    
    with open("test.txt", "wt") as fo:
        fo.write("a")
        fo.write("b")
except:
    pass
# with 블럭의 실행이 끝나면 알아서 close 됨

TODO - 간단한 메모장  
사용자로부터 파일명을 입력받는다.  
사용자로 부터 파일에 저장할 문장을 입력받아서 파일에 저장한다.  
사용자가 !q 를 입력하면 종료한다.  

사용자가 저장한 파일을 읽어서 출력한다.  

In [4]:
def print_memo():
    filename = input("파일명을 입력하세요: ")
    fi = open(filename+".txt", "at")
    memo_repeat = input("내용을 입력하세요: ")
    if memo_repeat != "!q":
        fi.write(memo_repeat)
    else:
        fi.close()

IndentationError: unexpected indent (<ipython-input-4-a39e3c069cd7>, line 7)

In [2]:
print_memo()

파일명을 입력하세요: dd


UnboundLocalError: local variable 'memo_repeat' referenced before assignment

In [7]:
# 1. 파일명 입력
file = input("파일명: ")
try:
    with open(file, "wt") as fw:
        # 사용자 입력 읽어오기
        # 사용자가 !q를 입력하기 전까지 입력된 내용을 파일에 출력
        while True:
            line = input("내용 입력: ")
            if line == "!q":
                break
            fw.write(line+"\n")
        print("종료")
except:
    print("실행 도중 오류 발생")

파일명: 흠여뤄
내용 입력: 흠여뤼
내용 입력: 흠냐뤼
내용 입력: 흠야륑
내용 입력: !q
종료


In [10]:
try:
    with open(file, "rt") as fi:
        memo = fi.read()
        print(memo)
except:
    pass

흠여뤼
흠냐뤼
흠야륑



## csv (Comma Separated Value) 파일
- 정형 데이터(테이블(표) 형태)를 파일에 저장하는 방식
- 한 개의 데이터를 한 줄에 표시
- 한 개의 데이터를 구성하는 값(속성)은 ","로 구분
    - tsv(Tab Separated Value) - 속성값들을 tab으로 구분
- 텍스트 파일 기반
- 파일 확장자는 ".csv", ".tsv" 를 사용

In [None]:
TODO - csv 파일을 읽어서 각 열의 값을 배열에 담는다.  
이름,나이,주소  형태의 csv를 읽어  
names = ["홍길동", "박영희", "김영수", ...]  
ages =[20, 30, 17, 20, 22]  
address =["서울", "인천", "부산", ...]  
배열에 넣는다. 라인이 index가 된다.  
홍길동,20,서울  
박영희,30,인천  
김영수,17,부산  
이경수,20,서울  
장경철,22,인천  

In [None]:
data.csv

In [None]:
#1. data.csv와 읽기 모드로 연결
#2. 라인 단위로 읽어서 이름, 나이, 주소를 분리 = 리스트에 각각 추가

In [35]:
names = []
ages = []
address = []

try:
    with open("data.csv", "rt", encoding="utf-8") as fi:
        for line in fi:
            name, age, addr = line.split(",")
            names.append(name.strip())
            ages.append(age.strip())
            address.append(addr.strip())

except Exception as e:
    print("Error!", e)


In [36]:
names

['홍길동', '박영희', '김영수', '이경수', '장경철']

In [37]:
ages

['20', '30', '17', '20', '22']

In [38]:
address

['서울', '인천', '부산', '서울', '인천']

In [29]:
# names, ages, address = csv

In [33]:
with open("member.csv", "wt", encoding="utf-8") as fw:
    for mem in zip(names, ages, address):
        fw.write(",".join(mem)+"\n")

In [32]:
t = ('홍길동', '20', '서울') 
# 리스트, 튜플의 원소들을 하나의 문자열로 묶는 메소드 => str
"구분자.join(튜플)
",".join(t)

'홍길동,20,서울'

In [42]:
# pandas를 이용해 csv파일 읽어오기
import pandas as pd

AttributeError: partially initialized module 'pandas' has no attribute 'compat' (most likely due to a circular import)

In [41]:
data = pd.read_csv("data.csv", encoding="utf-8")

NameError: name 'pd' is not defined

In [44]:
import pandas as pd

AttributeError: partially initialized module 'pandas' has no attribute 'compat' (most likely due to a circular import)

In [None]:
p = Person("이름", 20, "주소")

## pickle을 이용한 객체 읽고 쓰기
- 저장: pickle.dump (저장할 객체, 출력)
    - 객체 직렬화(Serialize) : 객체를 출력
- 읽기: pickle.load(입력)
    - 객체 역직렬화 : 직렬화된 객체를 입력받는 것
- 파일과 연결 시 binary 모드로 설정해야 함

In [51]:
list1 = [1, 2, 3, 4, 5]

In [54]:
import pickle

with open("list.pkl", "wb") as fi:
    pickle.dump(list1, fi)

In [57]:
with open("list.pkl", "rb") as fo:
    list2 = pickle.load(fo)

In [58]:
list2

[1, 2, 3, 4, 5]

In [59]:
print(type(list2))

<class 'list'>


In [61]:
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
        
    def __str__(self):
        return f"{self.name}, {self.age}"

In [62]:
p = Person("Sam", 30)

In [64]:
import pickle
with open("person.pkl", "wb") as fo:
    pickle.dump(p, fo)

In [65]:
import pickle
with open("person.pkl", "rb") as fi:
    p2 = pickle.load(fi)

In [67]:
print(p2)

Sam, 30
