Jump to python
==

하위 디렉터리 검색하기
--

* 특정 디렉터리부터 시작해 하위(디렉터리 포함)의 모든 파일 중 파이썬 파일(*.py)만 출력해주는 프로그램 만들기

* 생각할 것
>  - 필요한 기능? 파이썬 파일만 찾아 출력
>  - 입력받는 값? 검색을 시작할 디렉터리
>  - 출력하는 값? 파이썬 파일명

In [None]:
# sub_dir_search.py 파일 작성
# /NasData/home/knh/workspace 디렉터리에 저장

# sub_dir_search.py

def search(dirname):
    print(dirname)

search("/NasData/home/knh/")

# search 함수 만들고 시작 디렉터리를 입력받도록 함

In [None]:
# 디렉터리에 있는 파일 검색할 수 있도록 소스 변경
# sub_dir_search.py

import os

def search(dirname):
    filenames = os.listdir(dirname)
    for filename in filenames:
        full_filename = os.path.join(dirname, filename)
        print(full_filename)

search("/NasData/home/knh/")

# os.listdir 사용 시, 해당 디렉터리에 있는 파일 리스트 구할 수 있음
# 이때 파일 리스트는 파일 이름만 포함되어 있기에, 경로를 포함한 파일 이름을 구하기 위해서는 입력으로 받은 dirname을 앞에 덧붙여 줘야 함
# os 모듈에는 디렉터리와 파일 이름을 이어 주는 os.path.join 함수가 있어, 디렉터리 포함한 전체 경로 쉽게 구할 수 있음

In [None]:
'''

(py3.9) knh@gnode5:~/workspace\$ /NasData/home/knh/anaconda3/envs/py3.9/bin/python /NasData/home/knh/workspace/sub_dir_search.py
/NasData/home/knh/.nv
/NasData/home/knh/data
/NasData/home/knh/.config
/NasData/home/knh/dev
/NasData/home/knh/.dbus
/NasData/home/knh/anaconda3
/NasData/home/knh/review
/NasData/home/knh/.wget-hsts
/NasData/home/knh/.kaggle
/NasData/home/knh/mlcl
/NasData/home/knh/.Xauthority
/NasData/home/knh/cifar-baseline
/NasData/home/knh/.vscode-server
/NasData/home/knh/workspace
/NasData/home/knh/vggsound.csv
/NasData/home/knh/save.png
/NasData/home/knh/.local
/NasData/home/knh/.mozilla
/NasData/home/knh/cifar_net.pth
/NasData/home/knh/.bash_logout
/NasData/home/knh/.dotnet
/NasData/home/knh/foo.txt
/NasData/home/knh/Downloads
/NasData/home/knh/.bashrc
/NasData/home/knh/.ipython
/NasData/home/knh/MLCL_2023
/NasData/home/knh/.viminfo
/NasData/home/knh/nltk_data
/NasData/home/knh/.python_history
/NasData/home/knh/deep-learning-from-scratch
/NasData/home/knh/colab
/NasData/home/knh/.bash_history
/NasData/home/knh/.conda
/NasData/home/knh/tmp.ipynb
/NasData/home/knh/.vscode
/NasData/home/knh/.cache
/NasData/home/knh/.bash_profile

'''

In [None]:
# /NasData/home/knh/ 디렉터리에 있는 파일 중 확장자가 .py인 파일만 출력
# sub_dir_search.py

import os

def search(dirname):
    filenames = os.listdir(dirname)
    for filename in filenames:
        full_filename = os.path.join(dirname, filename)
        ext = os.path.splitext(full_filename)[-1]
        if ext == '.py': 
            print(full_filename)

search("/NasData/home/knh/")

# 파일 이름에서 확장자만 추출하기 위해 os 모듈의 os.path.splitext 함수 사용
# os.path.splitext는 파일 이름을 확장자 기준으로 두 부분으로 나누어 줌
# os.path.splitext(full_filename)[-1] 는 해당 파일 확장자 이름이 됨

'''

(py3.9) knh@gnode5:~/workspace\$ /NasData/home/knh/anaconda3/envs/py3.9/bin/python /NasData/home/knh/workspace/sub_dir_search.py

'''

In [None]:
# /NasData/home/knh/ 디렉터리 바로 밑의 파일 뿐 아니라, 하위 디렉터리(sub directory) 포함한 모든 파이썬 파일을 검색
# sub_dir_search.py

import os

def search(dirname):
    try:
        filenames = os.listdir(dirname)
        for filename in filenames:
            full_filename = os.path.join(dirname, filename)
            if os.path.isdir(full_filename):
                search(full_filename)
            else:
                ext = os.path.splitext(full_filename)[-1]
                if ext == '.py': 
                    print(full_filename)
    except PermissionError:
        pass

search("/NasData/home/knh/")

# try-except 문으로 함수 전체를 감싼 이유는 os.listdir 수행 시, 권한이 없는 디렉터리에 접근하더라도 프로그램이 오류로 종료되지 않고 그냥 수행되도록 하기 위해서
# full-filename이 디렉터리인지 파일인지 구별하기 위해 os.path.isdir 함수 사용
# 디렉터리일 경우 해당 경로 입력 받아 다시 search 함수 호출

# 해당 디렉터리의 파일이 디렉터리일 경우, 다시 search 함수를 호출해 나가면(재귀 호출) 해당 디렉터리의 하위 파일을 다시 검색하기 시작해서 모든 파일을 검색할 수 있음

# 재귀 호출? 자기 자신을 다시 호출하는 프로그래밍 기법
# Ex. search 함수에서 다시 자기 자신인 search 함수 호출

# 해당 실행 결과는 너무 많아 생략

* 하위 디렉터리 검색을 쉽게 해주는 os.walk
>  - os.walk는 시작 디렉터리부터 시작해 하위에 있는 모든 디렉터리 차례로 방문하는 함수

In [None]:
# oswalk.py

import os

for (path, dir, files) in os.walk("/NasData/home/knh/"):
    for filename in files:
        ext = os.path.splitext(filename)[-1]
        if ext == '.py':
            print("%s/%s" % (path, filename))

In [None]:
'''

/NasData/home/knh/anaconda3/lib/python3.7/_sitebuiltins.py
/NasData/home/knh/anaconda3/lib/python3.7/_pyio.py
/NasData/home/knh/anaconda3/lib/python3.7/_weakrefset.py
/NasData/home/knh/anaconda3/lib/python3.7/turtle.py
/NasData/home/knh/anaconda3/lib/python3.7/signal.py
/NasData/home/knh/anaconda3/lib/python3.7/types.py
/NasData/home/knh/anaconda3/lib/python3.7/secrets.py
/NasData/home/knh/anaconda3/lib/python3.7/mimetypes.py
/NasData/home/knh/anaconda3/lib/python3.7/io.py
/NasData/home/knh/anaconda3/lib/python3.7/getpass.py
/NasData/home/knh/anaconda3/lib/python3.7/dummy_threading.py
/NasData/home/knh/anaconda3/lib/python3.7/random.py
/NasData/home/knh/anaconda3/lib/python3.7/struct.py
/NasData/home/knh/anaconda3/lib/python3.7/ftplib.py
/NasData/home/knh/anaconda3/lib/python3.7/sched.py
/NasData/home/knh/anaconda3/lib/python3.7/opcode.py
/NasData/home/knh/anaconda3/lib/python3.7/threading.py
/NasData/home/knh/anaconda3/lib/python3.7/ipaddress.py
/NasData/home/knh/anaconda3/lib/python3.7/decimal.py
/NasData/home/knh/anaconda3/lib/python3.7/traceback.py
/NasData/home/knh/anaconda3/lib/python3.7/copy.py
/NasData/home/knh/anaconda3/lib/python3.7/_dummy_thread.py
/NasData/home/knh/anaconda3/lib/python3.7/_strptime.py
/NasData/home/knh/anaconda3/lib/python3.7/_pydecimal.py
/NasData/home/knh/anaconda3/lib/python3.7/typing.py

'''