# 파일 경로를 객체로 다루려면?
## pathlib
### 파일 시스템 경로를 문자열이 아닌 객체로 만들어 여러 가지 일을 할 수 있도록 하는 모듈

In [1]:
import pathlib

# for p in pathlib.Path.cwd().glob('*.txt'):
#     new_p = p.parent.joinpath('archive', p.name)
#     p.replace(new_p)

In [2]:
p = list(pathlib.Path.cwd().glob('*.ipynb'))[0]
p.parent.joinpath('archive',p.name)

WindowsPath('C:/Users/qq221/Study/Python Library/archive/001. 텍스트 다루기.ipynb')

In [3]:
# 현재 디렉터리의 모든 파일을 조사하여 확작자별 개수 구하기
import collections, pathlib
collections.Counter([p.suffix for p in pathlib.Path.cwd().iterdir()])

Counter({'': 4, '.ipynb': 6, '.txt': 1})

# 디렉터리의 구성을 알려면?
## os.path
### 경로명과 파일명에 대한 유용한 함수를 제공하는 모듈

In [4]:
import os 


#재귀로 구현 하위 폴더에 디렉터리가 있다면 search(해당디렉터리) 나머지 파일들은 출력
def search(dirname):
    '''지정 경로의 하위경로에 있는 모든 ipynb파일 출력'''
    filenames = os.listdir(dirname)
    for filename in filenames:
        filepath = os.path.join(dirname, filename)
        if os.path.isdir(filepath):
            search(filepath)
        elif os.path.isfile(filepath):
            name, ext = os.path.splitext(filepath)
            if ext == '.ipynb':
                print(filepath)
                
search("C:/Users/qq221/Study")

C:/Users/qq221/Study\5조\.ipynb_checkpoints\윈도우즈 프로젝트랩-checkpoint.ipynb
C:/Users/qq221/Study\5조\윈도우즈 프로젝트랩.ipynb
C:/Users/qq221/Study\AdaptiveStreamingScraping\.ipynb_checkpoints\GetData-checkpoint.ipynb
C:/Users/qq221/Study\AdaptiveStreamingScraping\GetData.ipynb
C:/Users/qq221/Study\IrastoyaWebscraping\.ipynb_checkpoints\01. GetData-checkpoint.ipynb
C:/Users/qq221/Study\IrastoyaWebscraping\.ipynb_checkpoints\04.resize_img-checkpoint.ipynb
C:/Users/qq221/Study\IrastoyaWebscraping\01. GetData.ipynb
C:/Users/qq221/Study\IrastoyaWebscraping\02.AddTranslation.ipynb
C:/Users/qq221/Study\IrastoyaWebscraping\03.combine_csv.ipynb
C:/Users/qq221/Study\IrastoyaWebscraping\04.resize_img.ipynb
C:/Users/qq221/Study\Python Basic\Dojang\.ipynb_checkpoints\01함수-checkpoint.ipynb
C:/Users/qq221/Study\Python Basic\Dojang\.ipynb_checkpoints\02함수에서 위치 인수와 키워드 인수 사용하기-checkpoint.ipynb
C:/Users/qq221/Study\Python Basic\Dojang\.ipynb_checkpoints\03함수에서 재귀호출 사용하기-checkpoint.ipynb
C:/Users/qq221/Study\Python Ba

In [5]:
#pathlib를 이용한 구현

In [6]:
import pathlib

def search(dirname):
    for p in pathlib.Path(dirname).rglob('*.ipynb'):
        print(p)
        
search("C:/Users/qq221/Study")

C:\Users\qq221\Study\5조\윈도우즈 프로젝트랩.ipynb
C:\Users\qq221\Study\5조\.ipynb_checkpoints\윈도우즈 프로젝트랩-checkpoint.ipynb
C:\Users\qq221\Study\AdaptiveStreamingScraping\GetData.ipynb
C:\Users\qq221\Study\AdaptiveStreamingScraping\.ipynb_checkpoints\GetData-checkpoint.ipynb
C:\Users\qq221\Study\IrastoyaWebscraping\01. GetData.ipynb
C:\Users\qq221\Study\IrastoyaWebscraping\02.AddTranslation.ipynb
C:\Users\qq221\Study\IrastoyaWebscraping\03.combine_csv.ipynb
C:\Users\qq221\Study\IrastoyaWebscraping\04.resize_img.ipynb
C:\Users\qq221\Study\IrastoyaWebscraping\.ipynb_checkpoints\01. GetData-checkpoint.ipynb
C:\Users\qq221\Study\IrastoyaWebscraping\.ipynb_checkpoints\04.resize_img-checkpoint.ipynb
C:\Users\qq221\Study\Python Basic\Dojang\01함수.ipynb
C:\Users\qq221\Study\Python Basic\Dojang\02함수에서 위치 인수와 키워드 인수 사용하기.ipynb
C:\Users\qq221\Study\Python Basic\Dojang\03함수에서 재귀호출 사용하기.ipynb
C:\Users\qq221\Study\Python Basic\Dojang\04람다 표현식 사용하기.ipynb
C:\Users\qq221\Study\Python Basic\Dojang\05클로저 사용하기.ipynb
C

# 여러 개의 파일을 한꺼번에 읽으려면?
## fileinput
### 여러개의 파일을 한꺼번에 처리할 때 사용하는 모듈

In [7]:
import fileinput
import glob

#./006ex 파일 경로의 모든 txt파일을 읽음 
with fileinput.input(glob.glob("006ex/*.txt")) as f:
    for line in f:
        print(line)

1st text file

4th grade 1st semester is approaching...

End of 1st text file
2nd text file

Information processing technicians should also be prepared...

end of second text file
3rd text file

Let's Fight!

End of 3rd text file


# 디렉터리와 파일을 비교하려면?
## filecmp
### 파일 두 개 또는 디렉터리 두 곳을 비교할 때 사용하는 모듈

In [8]:
import filecmp

fd = filecmp.dircmp('./006a','./006b')

#006a 디렉터리에만 있는 파일
print('006a 디렉터리에만 있는 파일')
for a in fd.left_only:
    print(f'006a : {a}')

print()
    
#006b 디렉터리에만 있는 파일
print('006b 디렉터리에만 있는 파일')
for b in fd.right_only:
    print(f'006b : {b}')
    
    
print()


#두 곳 모두에 있지만 내용이 다른 파일
print('두 곳 모두에 있지만 내용이 다른 파일')
for x in fd.diff_files:
    print(f'x: {x}')

006a 디렉터리에만 있는 파일
006a : 001. 텍스트 다루기.ipynb
006a : 002. 바이너리 데이터 다루기.ipynb

006b 디렉터리에만 있는 파일
006b : 004. 수학과 숫자 다루기.ipynb
006b : 005. 함수형 프로그래밍 다루기.ipynb

두 곳 모두에 있지만 내용이 다른 파일
x: 같은 이름 내용 다름.ipynb


# 임시로 만든 파일을 이용하려면?
## tempfile
### 임시 파일을 만들 때 사용하는 모듈

In [9]:
import random
import tempfile

def sumfile(f):
    '''파일을 읽어서 텍스트의 숫자를 더하는 함수(한줄에는 하나의 숫자가 있다)'''
    result = 0
    for line in f.readlines():
        num = int(line)
        result += num
    return result

#쓰기모드로 임시 파일을 만듬
tf = tempfile.TemporaryFile(mode='w+')
for i in range(10):               # 한줄씩 랜덤 값 삽입
    num = random.randint(1,100)
    tf.write(str(num))
    tf.write("\n")



tf.seek(0)   # 파일의 오프셋(커서 위치)을 처음으로 이동 
result = sumfile(tf)
tf.close #close 수행 시 임시파일 자동삭제

print(result)

494


# 파일을 찾으려면?
## glob
### 패턴(유닉스 셸이 사용하는 규칙)을 이용하여 파일을 검색할 때 사용하는 모듈

In [10]:
import glob

#현재 디렉터리와 하위 디렉터리의 모든 ipynb파일 출력
for filename in glob.glob("**/*.ipynb", recursive=True):
    print(filename)

001. 텍스트 다루기.ipynb
002. 바이너리 데이터 다루기.ipynb
003. 다양한 데이터 다루기.ipynb
004. 수학과 숫자 다루기.ipynb
005. 함수형 프로그래밍 다루기.ipynb
006. 파일과 디렉터리 다루기.ipynb
006a\001. 텍스트 다루기.ipynb
006a\002. 바이너리 데이터 다루기.ipynb
006a\003. 다양한 데이터 다루기.ipynb
006a\같은 이름 내용 다름.ipynb
006b\003. 다양한 데이터 다루기.ipynb
006b\004. 수학과 숫자 다루기.ipynb
006b\005. 함수형 프로그래밍 다루기.ipynb
006b\같은 이름 내용 다름.ipynb


# 특정 파일만 찾으려면?
## fnmatch
### 파일 중에서 특정 패턴(유닉스 셸이 사용하는 규칙)과 일치하는 파일을 찾을 때 사용하는 모듈

In [11]:
import fnmatch
import os



# * : 모든 것과 일치
# ? : 모든 단일 문자와 일치
# [seq] seq의 모든 문자와 일치
# [!seq] seq에 없는 모든 문자와 일치

#현재 디렉터리의 모든 파일중 다음 규칙을 따르는 파일을 찾아 출력  '??[1-9]??다*.ipynb'
for filename in os.listdir('.'):
    if fnmatch.fnmatch(filename, '??[1-9]??다*.ipynb'):
        print(filename)

003. 다양한 데이터 다루기.ipynb


# 파일에서 무작위로 한 줄만 가져오려면?
## linecache
### 파일의 원하는 줄의 값을 읽을 때 사용하는 모듈, 이때 캐시를 사용하여 파일에서 여러 줄을 읽는 일반적인 상황을 내부적으로 최적화한다.

In [12]:
import linecache
import random

no = random.randint(1,100)
print(linecache.getline('saying.txt', no)) # 파일의 지정한 줄을 읽어서 반환 
                                        # getline을 여러번 호출하더라도 캐시에 저장한 값을 반환하므로 속도가 빠름

하늘의 별 따기



# 파일을 복사하거나 이동하려면?
## shutil
### 파일을 복사, 이동할 때 사용하는 모듈

In [13]:
import shutil

#shutil.copy("파일 경로", "복사할 파일 경로")
#shutil.move("파일 경로", "이동할 파일 경로")