# 06-6 하위 디렉터리 검색하기
<hr style="height: 1px;">

특정 디렉터리부터 시작해서 그 하위 모든 파일 중 파이썬 파일(\*.py)만 출력해 주는 프로그램을 만들려면 어떻게 해야 할까?

1. 다음과 같이 sub_dir_search.py 파일을 작성해 보자.

```
# C:\05.Python\JumpToPython\ex\sub_dir_search.py
import os
def search(dirname):
    filenames = os.listdir(dirname)
    for filename in filenames:
        full_filename = os.path.join(dirname, filename)
        print(full_filename)

search("c:/")
```

os.listdir을 사용하면 해당 디렉터리에 있는 파일들의 리스트를 구할 수 있다. 우리가 최종적으로 구하고자 하는 것은 "파일경로+파일명"이므로 os.listdir()을 통해 나온 파일명 리스트 요소 하나하나마다 파일경로를 붙여줘야 한다. os 모듈에는 디렉터리와 파일이름을 이어주는 os.path.join(dirname, filename)이 있으므로 이를 사용하면 된다.

```
>>> import os
>>> os.listdir("c:/")
['!@MrKg', '$Recycle.Bin', '00.lib', '01.java', '02.sql', '03.ServletJSP', '04.JavaScript', '05.Python', '06. C#', '08.sw', '10.flask', '11.R', '12.Cloud', '16.Crawling', '16.Crawling.zip', '20.AWS', '22. Big Data Class', 'big data class materials', 'Bitnami', 'Config.Msi', 'Desktop.zip', 'dfBCIeDc5GcMuRexh8cgtE70kA=', 'Documents and Settings', 'Git_local', 'hiberfil.sys', 'home', 'Intel', 'Java', 'java_sql', 'java_sql.zip', 'Linux_HDD', 'ML', 'MSOCache', 'pagefile.sys', 'PerfLogs', 'Program Files', 'Program Files (x86)', 'ProgramData', 'Recovery', 'swapfile.sys', 'swsetup', 'System Volume Information', 'Temp', 'Users', 'Windows', '추석전강의내용', '추석전강의내용.zip']
```

위 코드를 수행하면 c:/ 디렉터리에 있는 파일이 다음과 같이 출력된다.

```
(base) C:\05.Python\JumpToPython\ex>python sub_dir_search.py
c:/!@MrKg
c:/$Recycle.Bin
c:/00.lib
c:/01.java
c:/02.sql
c:/03.ServletJSP
c:/04.JavaScript
c:/05.Python
c:/06. C#
c:/08.sw
c:/10.flask
c:/11.R
c:/12.Cloud
c:/16.Crawling
c:/16.Crawling.zip
c:/20.AWS
c:/22. Big Data Class
c:/big data class materials
c:/Bitnami
c:/Config.Msi
c:/Desktop.zip
c:/dfBCIeDc5GcMuRexh8cgtE70kA=
c:/Documents and Settings
c:/Git_local
c:/hiberfil.sys
c:/home
c:/Intel
c:/Java
c:/java_sql
c:/java_sql.zip
c:/Linux_HDD
c:/ML
c:/MSOCache
c:/pagefile.sys
c:/PerfLogs
c:/Program Files
c:/Program Files (x86)
c:/ProgramData
c:/Recovery
c:/swapfile.sys
c:/swsetup
c:/System Volume Information
c:/Temp
c:/Users
c:/Windows
c:/추석전강의내용
c:/추석전강의내용.zip
```

3. 이제 C:/ 디렉터리에 있는 파일들 중 확장자가 .py인 파일만을 출력하도록 코드를 변경하자.

In [1]:
# os.path.splitext 파악하기
import os

def search(dirname):
    filenames = os.listdir(dirname)
    for filename in filenames:
        full_filename = os.path.join(dirname, filename)
        ext = os.path.splitext(full_filename)
        print(ext)
        
search("C:/")

('C:/!@MrKg', '')
('C:/$Recycle', '.Bin')
('C:/00', '.lib')
('C:/01', '.java')
('C:/02', '.sql')
('C:/03', '.ServletJSP')
('C:/04', '.JavaScript')
('C:/05', '.Python')
('C:/06', '. C#')
('C:/08', '.sw')
('C:/10', '.flask')
('C:/11', '.R')
('C:/12', '.Cloud')
('C:/16', '.Crawling')
('C:/16.Crawling', '.zip')
('C:/20', '.AWS')
('C:/22', '. Big Data Class')
('C:/big data class materials', '')
('C:/Bitnami', '')
('C:/Config', '.Msi')
('C:/Desktop', '.zip')
('C:/dfBCIeDc5GcMuRexh8cgtE70kA=', '')
('C:/Documents and Settings', '')
('C:/Git_local', '')
('C:/hiberfil', '.sys')
('C:/home', '')
('C:/Intel', '')
('C:/Java', '')
('C:/java_sql', '')
('C:/java_sql', '.zip')
('C:/Linux_HDD', '')
('C:/ML', '')
('C:/MSOCache', '')
('C:/pagefile', '.sys')
('C:/PerfLogs', '')
('C:/Program Files', '')
('C:/Program Files (x86)', '')
('C:/ProgramData', '')
('C:/Recovery', '')
('C:/swapfile', '.sys')
('C:/swsetup', '')
('C:/System Volume Information', '')
('C:/Temp', '')
('C:/Users', '')
('C:/Windows', '')
('

In [5]:
# 확장자가 .py인 것들만 추려내기
import os

def search(dirname):
    filenames = os.listdir(dirname)
    for filename in filenames:
        full_filename = os.path.join(dirname, filename)
        ext = os.path.splitext(full_filename)[-1]
        if ext == ".py":
            print(full_filename)
        
search("C:\\05.Python\JumpToPython\ex")

C:\05.Python\JumpToPython\ex\argv_test.py
C:\05.Python\JumpToPython\ex\memo.py
C:\05.Python\JumpToPython\ex\mod1.py
C:\05.Python\JumpToPython\ex\modtest.py
C:\05.Python\JumpToPython\ex\myargv.py
C:\05.Python\JumpToPython\ex\path_append.py
C:\05.Python\JumpToPython\ex\sub_dir_search.py
C:\05.Python\JumpToPython\ex\sys1.py
C:\05.Python\JumpToPython\ex\sys2.py
C:\05.Python\JumpToPython\ex\tabto4.py


4. 하지만 우리가 원하는 것은 하위 디렉터리를 포함한 모든 파이썬 파일을 검색하는 것. 하위 디렉터리도 검색이 가능하도록 다음과 같이 코드를 변경해보자.

In [10]:
import os

def search(dirname):
    try:
        filenames = os.listdir(dirname)
        for filename in filenames:
            full_filename = os.path.join(dirname, filename)
            if os.path.isdir(full_filename):
                search(full_filename)
            else:
                ext = os.path.splitext(full_filename)[-1]
                if ext == ".py":
                    print(full_filename)
    except PermissionError:
        pass
    
search("C:\\05.Python\JumpToPython")

C:\05.Python\JumpToPython\ex\argv_test.py
C:\05.Python\JumpToPython\ex\game\graphic\render.py
C:\05.Python\JumpToPython\ex\game\graphic\__init__.py
C:\05.Python\JumpToPython\ex\game\sound\echo.py
C:\05.Python\JumpToPython\ex\game\sound\__init__.py
C:\05.Python\JumpToPython\ex\game\__init__.py
C:\05.Python\JumpToPython\ex\memo.py
C:\05.Python\JumpToPython\ex\mod1.py
C:\05.Python\JumpToPython\ex\modtest.py
C:\05.Python\JumpToPython\ex\myargv.py
C:\05.Python\JumpToPython\ex\mymod\mod2.py
C:\05.Python\JumpToPython\ex\path_append.py
C:\05.Python\JumpToPython\ex\sub_dir_search.py
C:\05.Python\JumpToPython\ex\sys1.py
C:\05.Python\JumpToPython\ex\sys2.py
C:\05.Python\JumpToPython\ex\tabto4.py


try ... except PermissionError로 함수 전체를 감싼 이유는 os.listdir를 수행할 때 권한이 없는 디렉터리에 접근하더라도 프로그램이 오류로 종료되지 않고 그냥 수행되도록 하기 위함임.

**[하위 디렉터리 검색을 쉽게 해주는 os.walk]**

os.walk를 사용하면 위에서 작성한 코드를 보다 간편하게 만들 수 있음. os.walk는 시작 디렉터리부터 시작하여 그 하위 모든 디렉터리를 차례대로 방문하게 해주는 함수임.

In [11]:
import os

for (path, dir, files) in os.walk("C:\\05.Python\JumpToPython"):
    for filename in files:
        ext = os.path.splitext(filename)[-1]
        if ext == '.py':
            print("%s/%s" % (path, filename))

C:\05.Python\JumpToPython\ex/argv_test.py
C:\05.Python\JumpToPython\ex/memo.py
C:\05.Python\JumpToPython\ex/mod1.py
C:\05.Python\JumpToPython\ex/modtest.py
C:\05.Python\JumpToPython\ex/myargv.py
C:\05.Python\JumpToPython\ex/path_append.py
C:\05.Python\JumpToPython\ex/sub_dir_search.py
C:\05.Python\JumpToPython\ex/sys1.py
C:\05.Python\JumpToPython\ex/sys2.py
C:\05.Python\JumpToPython\ex/tabto4.py
C:\05.Python\JumpToPython\ex\game/__init__.py
C:\05.Python\JumpToPython\ex\game\graphic/render.py
C:\05.Python\JumpToPython\ex\game\graphic/__init__.py
C:\05.Python\JumpToPython\ex\game\sound/echo.py
C:\05.Python\JumpToPython\ex\game\sound/__init__.py
C:\05.Python\JumpToPython\ex\mymod/mod2.py


디렉터리와 파일을 검색하는 일반적인 경우라면 os.walk를 사용하는 것을 추천.