##  파일의 경로 (PATH)
- 절대경로(Absolute path): 시작 디렉토리(Root directory)부터 자원의 전체경로를 표현하는 방식.
    - windows: c:\text\python\io.txt - c:\ <= Root directory. 경로구분자: \ (역슬러시)
    - linux/Unix: /text/python/io.txt - / <= Root directory. 경로구분자: / (슬러시)
    
- 상대경로: 현재 디렉토리에서부터 찾아가는 경로 표현방식
    - `.` : 현재 디렉토리
    - `..` : 상위 디렉토리
    - `/` : 경로 구분자
    
    
## OS 모듈
- 표준 모듈 (설치는 필요없지만 import는 해야한다)
- 운영체제(os)에서 제공한는 기능들을 파이썬 프로그램에서 사용할 수 있도록 도와주는 모듈.

In [2]:
import os

In [3]:
# 현재 디렉토리를 문자열로 반환
curr_dir = os.getcwd() # current work directory
print(curr_dir) # 주피터 노트북: 현재 작성하는 ipynb 파일이 위치한 경로.

C:\Users\mein0\1.JupyterNoteCodes


In [31]:
# 현재 디렉토리를 변경 3가지 방법
os.chdir("C:\\temp\\a") # mac : os.chdir("/home/temp/a")
# os.chdir(r"C:\temp\a") # raw string 이용시.
#os.chdir(r"C:/temp/a") # 파이썬은 /를 인식함.

In [32]:
os.getcwd()

'C:\\temp\\a'

In [34]:
os.chdir(curr_dir)
os.getcwd()

'C:\\Users\\mein0\\1.JupyterNoteCodes'

####  Escape 문자
- `\문자` 로 시작하는 문자. text로 표현하지 못하는 문자를 표현하는 문자.
- `\n` : enter
- `\t` : tab
- `\b` : back space
- `\\` : \

In [27]:
print("1. c\nd")
print("2. c\td")
print("3. c\bd")
print("c:\\src\\a.py")
# 파이썬에서 문자열로 파일 경로 표시할때 windows라고 해도 "/"(슬러시)를 사용해도 인식함.
print("c:/src/a.py")
print(r"c:\src\a.py") # r : raw string => \를 escape문자의 접두어로 인식하지 않는다.

1. c
d
2. c	d
3. cd
c:\src\a.py
c:/src/a.py
c:\src\a.py


In [35]:
# 특정 디렉토리 안에 있는 하위디렉토리나 파일들의 이름을 리스트에 담아서 반환.
# path를 지정하거나 생략하면 현재 디렉토리 내의 내용을 반환
path_list = os.listdir()
path_list

['.git',
 '.gitattributes',
 '.ipynb_checkpoints',
 '01_변수_데이터타입.ipynb',
 '02_자료구조.ipynb',
 '03_제어문.ipynb',
 '04_Function(함수).ipynb',
 '05_객체지향프로그래밍.ipynb',
 '06_module_package_import.ipynb',
 '07_예외와 예외처리.ipynb',
 '08_입출력_IO.ipynb',
 'CodingStudy.ipynb',
 'my_module.py',
 'my_package',
 'playdataSrc',
 'test.py',
 '__pycache__']

In [38]:
# ipynb 파일들만 가진 리스트.
[filename for filename in os.listdir() if filename.endswith('ipynb')]

['01_변수_데이터타입.ipynb',
 '02_자료구조.ipynb',
 '03_제어문.ipynb',
 '04_Function(함수).ipynb',
 '05_객체지향프로그래밍.ipynb',
 '06_module_package_import.ipynb',
 '07_예외와 예외처리.ipynb',
 '08_입출력_IO.ipynb',
 'CodingStudy.ipynb']

In [46]:
# 디렉토리 만들기
os.mkdir("test") # os.mkdir("./test") # 현재디렉토리에 test 디렉토리를 만든다.

In [72]:
# os.mkdir(r"test1")
# os.mkdir(r"test1\test2")
# os.mkdir(r"test1\test2\test3")
# 여러 하위폴더를 경로에 만들때 makedirs
os.makedirs(r"test1\test2\test3")

In [74]:
# 디렉토리 삭제
os.rmdir(r"test1\test2\test3") #rmdir() 빈 디렉토리만 삭제가능.

In [75]:
# 하위 디렉토리를 삭제하고 싶을때
# test1밑에 test2만 있으면 test1, test2 모두 삭제
# But, test1밑에 test2외에 다른 디렉토리/파일이 있으면 test2만 삭제.
os.removedirs(r"test1/test2")

In [73]:
# 파일 삭제
os.remove(r"test1\test2\test3\a.txt")

### os.path 모듈
- 경로 관련 처리를 하는 모듈

In [16]:
import os

In [77]:
# 파일이나 디렉토리가 있는지 여부
os.path.exists("a.txt"), os.path.exists("my_module.py")

(False, True)

In [87]:
# 디렉토리인지의 여부 (없으면 false)
os.path.isdir("my_module.py"), os.path.isdir("my_package"), os.path.isdir("aaa")


(False, True, False)

In [88]:
# 파일인지의 여부 (없으면 False)
os.path.isfile("my_module.py"), os.path.isfile("my_package"), os.path.isfile("aaa")

(True, False, False)

In [89]:
# isdir 활용.
path = 'test'
if not os.path.isdir(path):
    os.mkdir(path)

In [100]:
# 경로를 문자열로 조합해주는 "join" 함수
# r"c:\project\data\image" 를 문자열로 만들고싶을때.
path = os.path.join("C:\Project","data", "image")
print(path)

# 프로젝트 경로 : C:\Project  
#     데이터들을 저장할 경로 : data
#         이미지 데이터 : img
#         텍스트 데이터 :  txt
#     소스경로 : src
base_dir = r"C:\Project"
src_dir = os.path.join(base_dir, "src")
data_dir = os.path.join(base_dir, "data")
data_img_dir = os.path.join(data_dir, "img")
data_txt_dir = os.path.join(data_dir, "txt")

#파일경로를 추가
img1_file = os.path.join(data_img_dir, '1.jpg')

C:\Project\data\image


In [101]:
data_img_dir, data_txt_dir, img1_file

('C:\\Project\\data\\img',
 'C:\\Project\\data\\txt',
 'C:\\Project\\data\\img\\1.jpg')

In [8]:
# 주피터 노트북에서 명령프롬프트(터미널) 명령이 실행
# !명령어
!dir

 C 드라이브의 볼륨에는 이름이 없습니다.
 볼륨 일련 번호: 7C7B-9F35

 C:\Users\mein0\1.JupyterNoteCodes 디렉터리

2021-01-19  오후 02:16    <DIR>          .
2021-01-19  오후 02:16    <DIR>          ..
2021-01-18  오후 12:14                66 .gitattributes
2021-01-19  오전 10:22    <DIR>          .ipynb_checkpoints
2021-01-13  오후 08:16            37,237 01_변수_데이터타입.ipynb
2021-01-13  오후 06:06            38,014 02_자료구조.ipynb
2021-01-13  오후 09:59            37,606 03_제어문.ipynb
2021-01-13  오후 09:06            46,237 04_Function(함수).ipynb
2021-01-15  오후 04:55            62,133 05_객체지향프로그래밍.ipynb
2021-01-18  오후 03:46             7,269 06_module_package_import.ipynb
2021-01-19  오전 10:22            23,980 07_예외와 예외처리.ipynb
2021-01-19  오후 02:16            11,966 08_입출력_IO.ipynb
2021-01-18  오후 12:31            18,893 CodingStudy.ipynb
2021-01-15  오후 04:52               493 my_module.py
2021-01-15  오후 04:33    <DIR>          my_package
2021-01-14  오전 09:16    <DIR>          playdataSrc
2021-01-19  오후 12:27    <DIR>          test
2

In [7]:
#mac : !pwd
!cd 

C:\Users\mein0\1.JupyterNoteCodes


#  텍스트 파일 입출력
1. 입력 - open()
    - 목적이 무엇인지와 타입을 명시
2. 입출력 - read() /  write()
3. 연결 닫기 - close()

In [10]:
# 현재 디렉토리안에 있는 a.txt과 연결
# wt: 쓰기 /  텍스트 모드
# encoding 생략: os 기본인코딩 : win: cp949, 유닉스(맥)/리눅스: utf-8
f = open("a.txt", 'wt') # 'w' == 'wt' t는 기본이므로 생략가능.

In [11]:
# 출력
txt = """안녕하세요
ABCDE
12345"""
f.write(txt) # return값은 글자수.

17

In [12]:
f.write("두번째로 쓴내용")

8

In [14]:
#연결 닫기
f.close()

In [17]:
os.getcwd()

'C:\\Users\\mein0\\1.JupyterNoteCodes'

In [20]:
file = os.path.join(os.getcwd(), "my_text.txt")
print(file)
# 출력 모드일때 파일이 없으면 파일을 생성한다.
# w : 덮어쓰기.
# 연결
f = open(file, "wt")
# 출력
f.write("첫번째줄\n")
f.write("두번째줄\n")
f.write("세번째줄.")

#연결닫기
f.close() # 최종 출력

C:\Users\mein0\1.JupyterNoteCodes\my_text.txt


In [28]:
file = os.path.join(os.getcwd(), "my_text2.txt")
print(file)
# 출력 모드일때 파일이 없으면 파일을 생성한다.
# a : (출력) 이어쓰기.
# 연결
f = open(file, "at")
# 출력
f.write("첫번째줄\n")
f.write("두번째줄\n")
f.write("세번째줄.")

#연결닫기
f.close()

C:\Users\mein0\1.JupyterNoteCodes\my_text2.txt


In [30]:
file = os.path.join(os.getcwd(), "my_text3.txt")
print(file)
# 출력 모드일때 파일이 없으면 파일을 생성한다.
# a : (출력) 이어쓰기.
# 연결
f = open(file, "at")
# 출력
f.write("첫번째줄\n")
# flush()
f.flush() 
f.write("두번째줄\n")
f.flush()
f.write("세번째줄.")

#연결닫기
f.close()

C:\Users\mein0\1.JupyterNoteCodes\my_text3.txt


In [35]:
#file = "test.txt"
file = "my_text3.txt"
# 읽기/텍스트
# 읽기 모드인 경우 파일이 반드시 존재해야 한다.
#if os.path.exists(file):
try:
    #연결
    fi = open(file, 'rt') # fi = open(file) 'rt'생략 가능.
    print("연결성공")
    #읽기
    txt = fi.read() # 파일에서 읽은 데이터(텍스트)를 반환. read(): 한번에 전체를 읽음.
    print(txt)
except:
    print(f"파일 {file}를 읽는 도중 오류 발생")
finally:
    # 연결 닫기는 finally에서 처리
    fi.close()

연결성공
첫번째줄
두번째줄
세번째줄.첫번째줄
두번째줄
세번째줄.


In [36]:
try:
    fi = open('my_text3.txt') # rt 모드 rt생략
    #txt = fi.read() #전체를 읽어온다.
    txt_list = fi.readlines() 
    print(type(txt_list))
    print(txt_list)
    
except:
    print("Error")
    
finally:
    fi.close()

<class 'list'>
['첫번째줄\n', '두번째줄\n', '세번째줄.첫번째줄\n', '두번째줄\n', '세번째줄.']


In [3]:
try:
    fi = open('my_text3.txt')
    # 입력 Stream (fi)은 iterable. for in 문에서 사용시 한번에 한줄씩 반환.
#     for index, line_text in enumerate(fi, start=1):
#         print(f"{index}. {line_text}")
    for index, line_text in enumerate(fi, start=1):
        #if "첫" in line_text:
        print(f"{index}. {line_text}", end="")          
              
except:
    print("Error")
    
finally:
    fi.close()

1. 첫번째줄
2. 두번째줄
3. 세번째줄.첫번째줄
4. 두번째줄
5. 세번째줄.

In [None]:
try:
    1. 연결
    2. 입출력

except:
    연결, 입출력시 발생한 예외 처리
    
finally:
    3. 연결닫기

In [None]:
# Try사용한 구문과 아래 with 구문은 같은 역할. with는 close가 필요없다.
try:
    fi = open('my_text3.txt')
    x = fi.read()
    print(x)
finally:
    fi.close()

### with문
    - 파일과 입출력 작업이 다 끝나면 반드시 연결을 닫아야 한다. 매번 닫는 작업을하는 것이 번거롭고 실수로 안 닫을 경우 문제가 생길 수있다. 그래서 작업이 끝난 뒤 자동으로 닫도록 해주는 구문이 with문이다.

In [None]:
with open('my_text3.txt') as fi:
    x = fi.read()
    print(x)

# with 블럭의 실행이 끝나면 자동으로 close해준다. 

In [None]:
# 아래코드와 같은역할. with는 finally에서 close할 필요가 없다.
try:
    fi = open('my_text3.txt')
    x = fi.read()
    print(x)
except:
    pass
finally:
    fi.close()

In [None]:
try:
    with open('my_text3.txt') as fi:
        x = fi.read()
        print(x)
except:
    pass

# TODO

In [None]:
TODO - 간단한 메모장    
사용자로부터 파일명을 입력받는다.      
사용자로 부터 파일에 저장할 문장을 입력받아서 파일에 저장한다.     
사용자가 !q 를 입력하면 종료한다.    
사용자가 저장한 파일을 읽어서 출력한다.     

# input() 사용자로부터  text를 입력받는다.

In [50]:
try:
    file = input("파일명: ")
    fi = open(file,'wt')
    sentence = input("저장할 문장: ")
    while sentence != "!q":
        fi.write(sentence+'\n')
        sentence = input("저장할 문장: ")
except:
    print("실행도중 오류 발생")
finally:
    fi.close()

파일명: afef
저장할 문장: egetr
저장할 문장: wetewtg
저장할 문장: vvv
저장할 문장: !q


In [53]:
file = input("파일명: ")
with open (file, 'wt') as fw:
    sentence = input("저장할 문장: ")
    while sentence != "!q":
        fw.write(sentence+'\n')
        sentence = input("저장할 문장: ")

파일명: ttt.txt
저장할 문장: eif3
저장할 문장: fhgi3
저장할 문장: !q


In [35]:
def simple_memo():
    
    global file
    file = input("파일명: ")
    try:
        with open (file, 'wt') as fw:
            while True:
                line = input()
                if line == '!q':
                    break
                fw.write(line+"\n")
            print("종료")

    except:
        print("실행도중 오류 발생") 
        
    

In [36]:
simple_memo()

파일명: 333.txt
3
4
5
6
!q
종료


In [37]:
try:
    with open (file, 'rt') as fi:
        memo = fi.read()
        print(memo)
    
except:
    print("실행도중 오류 발생")     

3
4
5
6



## csv(Comma Separated Value) 파일
- 정형 데이터(테이블-표 형태)를 파일에 저장하는 방식 
- 한개의 데이터를 한줄에 표시
- 한개의 데이터를 구성하는 값(속성)은 `,` 로 구분
    - tsv(Tab Separated Value) - 속성값을 tab으로 구분
- 텍스트파일 기반
- 파일 확장자는 `.csv`, `.tsv` 를 사용

In [None]:
TODO - csv 파일을 읽어서 각 열의 값을 배열에 담는다.  
이름,나이,주소  형태의 csv를 읽어   
names = []   
ages =[]   
address =[]   
배열에 넣는다. 라인이 index가 된다.    
홍길동,20,서울    
박영희,30,인천   
김영수,17,부산   
이경수,20,서울   
장경철,22,인천    

In [None]:
data.csv

In [106]:
names=[]
ages=[]
address=[]

with open('data1.csv', 'rt', encoding='utf-8') as fi: #cp에러면 encoding='utf-8' 추가

    for info in fi:
        split_list = info.split(',')
        names.append(split_list[0])
        ages.append(split_list[1])
        address.append(split_list[2].replace('\n',""))
#         print(info, i)
#         names += info.split(',')
#         ages += info.split(',')
#         address += info.split(',')
#         i +=1
#         a = info.split(',')
#         b = info.split(',')
#         c = info.split(',')
#         a = info.endswith(',')
#         names.append(a)
#         ages.append(b)
#         address.append(c)

In [74]:
names=[]
ages=[]
address=[]

try:
    with open('data3.csv', 'rt', encoding='utf-8') as fi:
        for line in fi:
            name, age, addr = line.split(',')
            names.append(name.strip())
            ages.append(age.strip())
            address.append(addr.strip())

    
except Exception as e:
    print("오류발생", e)

In [84]:
with open("member.csv", 'wt', encoding='utf-8') as fw:
    for mem in zip(names, ages, address):
        fw.writelines(",".join(mem)+"\n")

In [82]:
t = ('홍길동', '20', '서울') 
#리스트, 튜플의 원소들을 하나로 문자열로 묶는 메소드 => str
# "구분자".join(튜플)
",".join(t)

'홍길동,20,서울'

In [75]:
names

['홍길동', '박영희', '김영수', '이경수', '장경철']

In [76]:
ages

['20', '30', '17', '20', '22']

In [77]:
address

['서울', '인천', '부산', '서울', '인천']

In [85]:
with open('member.csv', 'rt', encoding='utf-8') as fi: #cp에러면 encoding='utf-8' 추가
    m = fi.read()
    print(m)

홍길동,20,서울
박영희,30,인천
김영수,17,부산
이경수,20,서울
장경철,22,인천



In [86]:
# pandas를 이용해 csv파일 읽어오기
import pandas as pd

In [94]:
data = pd.read_csv("data1.csv", encoding='utf=8', header = None)
data

Unnamed: 0,0,1,2
0,Hong,20,Seoul
1,Park,30,Incheon
2,Kim,17,Busan
3,Lee,20,Seoul
4,Jang,22,Incheon


In [95]:
data[0], data[1], data[2]

(0    Hong
 1    Park
 2     Kim
 3     Lee
 4    Jang
 Name: 0, dtype: object,
 0    20
 1    30
 2    17
 3    20
 4    22
 Name: 1, dtype: int64,
 0      Seoul
 1    Incheon
 2      Busan
 3      Seoul
 4    Incheon
 Name: 2, dtype: object)

## Pickle을 이용한 객체 읽고 쓰기
- 저장: pickle.dump(저장할객체, 출력)
    - Serialize(객체 직렬화) - 객체를 출력하는 것.
- 읽기: pickle.load(입력)
    - 객체 역직렬화 - 직렬화된 객체를 입력받는 것.
- 파일과 연결시 binary 모드로 설정해야 한다.

In [96]:
list1 = [1,2,3,4,5]

In [2]:
import pickle

In [97]:
with open('list.pkl', 'wb') as fi:
    pickle.dump(list1, fi)

In [100]:
with open('list.pkl', 'rb') as fo:
    list2 = pickle.load(fo)

In [108]:
print(type(list2))

<class 'list'>


In [109]:
list2

[1, 2, 3, 4, 5]

In [1]:
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
        
    def __str__(self):
        return f"{self.name}. {self.age}"

In [4]:
p = Person("Hong", 30)

In [5]:
with open("person.pkl", 'wb') as fo:
    pickle.dump(p, fo)

In [6]:
with open("person.pkl", 'rb') as fi:
    p2 = pickle.load(fi)

In [7]:
print(p2)

Hong. 30


In [8]:
p2.name

'Hong'