# os 모듈

~~~python
# 필요 라이브러리 불러오기
import os
~~~

In [None]:
# Practice here!


### 디렉토리 확인, 변경

~~~python
# 현재 절대경로 확인 
!pwd
~~~

In [None]:
# Practice here!


~~~python
# 현재 절대경로 확인 (current working directory)
os.getcwd()
~~~

In [None]:
# Practice here!


~~~python
# 디렉토리 변경 (change directory)
os.chdir('../')
print(os.getcwd())
os.chdir('절대경로 입력')
os.getcwd()
~~~

In [None]:
# Practice here!


### os.mkdir, os.makedirs

~~~python
# 폴더를 한 개 만드는 함수
# 만들고자 하는 폴더가 이미 존재할 경우 에러 발생
os.mkdir('test')
~~~

In [None]:
# Practice here!


~~~python
# 폴더 생성시 지정한 경로가 존재하지 않으면 에러 발생
# 예를 들어 cd 라는 폴더를 만들고 싶어 os.mkdir(”ab/cd”) 를 사용하였는데, ab 폴더가 존재하지 않는다면 에러가 발생함.
os.mkdir('ab/cd')
~~~

In [None]:
# Practice here!


~~~python
#폴더를 한 개 만드는 함수. 만약 경로가 존재하지 않다면 경로까지 모두 만들어줌
os.makedirs('oh/my/god')
# ab라는 폴더 내부에 cd라는 폴더를 만들고 싶은데 ab폴더가 없는 상황이라면 
# os.mkdir("ab/cd")는 에러가 발생하지만 os.makedirs("ab/cd")는 ab폴더를 만들고 내부에 cd폴더까지 만들어줍니다.
~~~

In [7]:
# Practice here!


~~~python
# 만들고자 하는 폴더가 이미 존재할 경우 에러 발생
os.makedirs('oh/my/god')
~~~

In [None]:
# Practice here!


~~~python
# exist_ok 파라미터
# makedirs()의 두 번째 파라미터에 exist_ok=True 를 전달하면 동일한 폴더가 존재하더라도 에러를 발생시키지 않고 그냥 넘긴다.
os.makedirs('oh/my/god', exist_ok=True)
~~~

In [None]:
# Practice here!


~~~python
# 특정 경로에 파일, 폴더가 존재하는지를 확인해주는 기능
# 실제로 존재하면 True, 존재하지 않으면 False 반환
os.path.exists('oh/my/god')
~~~

In [None]:
# Practice here!


~~~python
# os.path.exists의 일반적인 사용 예시

download_folder = "test"

if not os.path.exists(download_folder):
    os.makedirs(download_folder)
~~~

In [None]:
# Practice here!


### os.remove() / os.rmdir()

~~~python
# 파일 한 개를 삭제하는 함수
# 삭제하려는 파일이 존재하지 않는다면 에러 발생
# 파일이 아닌 폴더를 삭제하려 하면 에러 발생. 삭제하려는 대상이 파일인지, 폴더인지에 따라 rmdir( )과 remove( )를 잘 구분하여 사용하셔야 합니다.
os.remove('file.png')
~~~

In [None]:
# Practice here!


~~~python
# os.remove의 일반적인 사용 예시
download_file = "file.png"

if os.path.exists(download_file):
    os.remove(download_file)
    print('삭제되었습니다.')

if os.path.exists(download_file):
    print(f"{'file.png'}이(가) 존재합니다.")
else:
    print(f"{'file.png'}이(가) 존재하지 않습니다.")
~~~

In [None]:
# Practice here!


~~~python
# 폴더 한 개를 삭제하는 함수
os.rmdir('folder')
~~~

In [None]:
# Practice here!


~~~python
os.rmdir('oh')
# 만약 삭제하려는 폴더 내부에 내용물이 있다면 에러 발생
# 삭제하려는 폴더가 존재하지 않는다면 에러 발생
# 폴더가 아닌 파일을 삭제하려 하면 에러 발생
os.rmdir('oh/my/god')
os.rmdir('oh/my')
os.rmdir('oh')
~~~

In [None]:
# Practice here!


### os.path.join()

~~~python
# 여러 개의 경로 요소를 결합하여 하나의 경로를 생성합니다.
# 운영체제에 맞는 경로 구분자를 사용하여 경로 요소를 연결합니다.
os.path.join('join', 'path')
temp_path = os.path.join('join', 'path', '4.png')
print(temp_path)
~~~

In [None]:
# Practice here!


~~~python
temp_path = os.path.join('join', 'path', '4.png')

# join/path 디렉터리가 존재하지 않으면 생성합니다.
if not os.path.exists(os.path.join('join', 'path')):
    os.makedirs(os.path.join('join', 'path'))
    print(os.makedirs(os.path.join('join', 'path')))

os.rename('4.png', temp_path)
~~~

In [None]:
# Practice here!


### os.path.basename()

~~~python
# 주어진 경로에서 마지막 요소를 반환합니다. 경로의 기본 이름을 얻는 데 유용합니다.
path = 'test/documents/example.txt'
base_name = os.path.basename(path)
print(f"Base name: {base_name}")
~~~

In [None]:
# Practice here!


#### os.path.dirname()

~~~python
# 파일 경로에서 디렉토리만 추출합니다
path = 'test/documents/example.txt'
directory = os.path.dirname(path)
print(directory)
~~~

In [None]:
# Practice here!


### os.rename()

~~~python
# 파일이나 폴더의 이름을 바꾸는 함수. 파일이나 폴더를 옮기는 것도 가능.
os.rename(src, dst)
# src: 이름 변경하고자 하는 폴더나 파일의 경로
# dst: 이름 변경 후의 폴더나 파일의 경로
~~~

In [None]:
# Practice here!


~~~python
os.mkdir('test')
os.rename('1.png', 'test/100.png')
# src 경로가 올바르지 않다면(파일 or 폴더가 존재하지 않는다면) 에러 발생
# dst 에 해당하는 파일이나 폴더가 이미 존재한다면 에러 발생
# src와 dst 경로를 다르게 하여dirs 이름 뿐만이 아니라 위치도 변경할 수 있음
# 폴더 위치 변경시 폴더 내부에 내용물이 있어도 가능합니다!
~~~

In [None]:
# Practice here!


~~~python
os.mkdir('oh')
# 테스트 폴더가 oh 폴더의 아래로 들어감
os.rename('test', 'oh/test')
~~~

In [None]:
# Practice here!


### os.listdir()

~~~python
# 한 폴더 내의 모든 파일, 폴더 목록을 리스트로 불러오는 함수
file_list = os.listdir('./')
print(file_list)
file_list2 = os.listdir('path')
print(file_list2)
~~~

In [1]:
# Practice here!


~~~python
# 파일의 경로를 입력할 경우 에러 발생
# 반드시 폴더로 적어주셔야 합니다
file_list2 = os.listdir('2.png')
~~~

In [None]:
# Practice here!


## 미니 실습: 파일 확장자별로 구분해서 넣기

1. os.listdir()를 사용하여 대상 디렉터리의 파일 목록을 가져옵니다.
2. 확장자별로 파일 목록을 분류합니다 (예: png_file_list, xlsx_file_list, jpg_file_list 등).
3. 각 확장자별로 폴더를 생성합니다 (os.path.join 및 os.makedirs를 사용).
4. 분류된 파일 목록을 이용하여, 각 확장자별 폴더로 파일을 이동합니다 (os.rename을 사용).
5. 이동한 파일 목록을 출력하여 확인합니다.

In [None]:
# 파일의 특정 문구가 들어가있는지 확인하는 방법
a ='asdasd'

'as' in a

True

In [None]:
import os

target_dir = './practice/'
file_list = os.listdir(target_dir)
png_file_list = []
xlsx_file_list = []
jpg_file_list = []

for file_name in file_list:
    if '.png' in file_name.lower():
        png_file_list.append(file_name)
    elif '.xlsx' in file_name.lower():
        xlsx_file_list.append(file_name)
    elif '.jpg' in file_name.lower():
        jpg_file_list.append(file_name)
    else:
        pass

# 확장자별로 폴더 생성 및 파일 이동
png_folder = os.path.join(target_dir, 'PNG')
xlsx_folder = os.path.join(target_dir, 'XLSX')
jpg_folder = os.path.join(target_dir, 'JPG')

# PNG 폴더 생성
if not os.path.exists(png_folder):
    os.makedirs(png_folder)

# XLSX 폴더 생성
if not os.path.exists(xlsx_folder):
    os.makedirs(xlsx_folder)

# JPG 폴더 생성
if not os.path.exists(jpg_folder):
    os.makedirs(jpg_folder)

# PNG 파일 이동
for file_name in png_file_list:
    src = os.path.join(target_dir, file_name)
    dst = os.path.join(png_folder, file_name)
    os.rename(src, dst)

# XLSX 파일 이동
for file_name in xlsx_file_list:
    src = os.path.join(target_dir, file_name)
    dst = os.path.join(xlsx_folder, file_name)
    os.rename(src, dst)

# JPG 파일 이동
for file_name in jpg_file_list:
    src = os.path.join(target_dir, file_name)
    dst = os.path.join(jpg_folder, file_name)
    os.rename(src, dst)

print('png files')
print(png_file_list)
print('xlsx files')
print(xlsx_file_list)
print('jpg files')
print(jpg_file_list)


png files
[]
xlsx files
[]
jpg files
[]


# glob 라이브러리

### glob()

In [None]:
# 폴더 내부에 여러겹의 하위 폴더가 있는 등의 복잡한 구조를 가진 폴더에서도 원하는 파일의 경로를 모두 얻어낼 수 있습니다.
# glob(): 사용자가 제시한 조건에 맞는 경로를 가진 파일들의 리스트를 반환하는 함수

import glob
path_list = glob.glob("파일 및 폴더 경로 조건 제시")

# 경로 조건을 제시하라는 것은 ?, *, ** 을 이용하여 조건을 제시하는 것입니다.
# [] 대괄호 안에 있는 문자 중 하나와 정확히 한 글자와 매칭
# ? 은 임의의 한 문자를 뜻함(무조건 한 문자가 들어가야함)
# * 은 경로 구분자( /, \\, \ )를 제외한 임의의 문자열을 뜻함
# ** 은 경로 구분자( /, \\, \ )를 포함한 임의의 문자열을 뜻함

# 사용 데이터: glob_practice 폴더 내에 존재

In [None]:
import glob

# ?은 임의의 한 문자를 뜻함
path_list = glob.glob('./glob_practice/데이터[1].txt')
print(path_list)
# 데이터1000.txt가 검출이 안됩니다.

['./glob_practice\\데이터1.txt']


In [None]:
import glob

# ?은 임의의 한 문자를 뜻함
path_list = glob.glob('./glob_practice/데이터?.txt')
print(path_list)
# 데이터1000.txt가 검출이 안됩니다.

['./glob_practice\\데이터1.txt', './glob_practice\\데이터2.txt']


In [None]:
path_list = glob.glob('./glob_practice/데이터????.txt')
print(path_list)

# ? 는 무조건 한 문자 이상 들어가있어야 한다는 것을 조건으로 가지고 있습니다. 따라서 데이터1000.txt 파일의 경로만이 불러와집니다.

['./glob_practice\\데이터1000.txt']


In [None]:
# * 기호로 해결

path_list = glob.glob('./glob_practice/데이터*.txt')
print(path_list)

# 실습에는 데이터1.txt, 데이터2.txt, 데이터1000.txt 만 있지만 만약 1~1000까지 있다고 하더라도 모두 불러와집니다.

['./glob_practice\\데이터1.txt', './glob_practice\\데이터1000.txt', './glob_practice\\데이터2.txt']


In [None]:
# 다음과 같이 작성시 중간에 ‘데이터’가 들어가는 모든 파일들의 경로를 불러올 수 있습니다.
path_list = glob.glob('./glob_practice/*데이터*')
print(path_list)

['./glob_practice\\데이터1.txt', './glob_practice\\데이터1000.txt', './glob_practice\\데이터2.txt', './glob_practice\\엑셀데이터1.xlsx', './glob_practice\\엑셀데이터2.xlsx', './glob_practice\\텍스트데이터1.txt', './glob_practice\\텍스트데이터2.txt']


In [None]:
# 특정 확장자를 가진 파일들의 경로만 얻고싶을 때에도 사용 가능합니다.
path_list = glob.glob('./glob_practice/*.txt')
print(path_list)

['./glob_practice\\데이터1.txt', './glob_practice\\데이터1000.txt', './glob_practice\\데이터2.txt', './glob_practice\\텍스트데이터1.txt', './glob_practice\\텍스트데이터2.txt']


In [None]:
# 현재 하위 폴더(폴더1, 폴더2)에는 접근을 하고 있지 않습니다. 
# 예시폴더 하위의 폴더인 ‘폴더1’ 에도 txt 파일이 있는데 왜 그 파일들의 경로는 나오지 않지?

# 두 가지 이유가 있습니다.

# 1. 기본적으로 glob 함수는 따로 옵션을 주지 않는 이상 하위 폴더까지 들어가지 않고 해당 폴더 내에서만 찾습니다.
# 2. *문자가 경로 구분자를 제외한 문자를 뜻한다고 하였습니다. 
# ‘폴더1’의 내부에 있는 ‘폴더1의텍스트1.txt’의 경로는 glob_practice\폴더1\폴더1의데이터1.txt’입니다. *에 해당하는 부분에 경로 구분자인 \\가 들어가 있어서 *문자와 매치되는 경로가 아닙니다.

In [None]:
# **은 경로 구분자(/, \\, \)를 포함한 임의의 문자열을 뜻함
path_list = glob.glob('./glob_practice/**')
print(path_list)
## ** 이라 함은 경로 구분자를 포함한 문자를 뜻하므로 glob_practice\\폴더1\\폴더1의데이터1.xlsx’ 도 ‘예시폴더\\**’ 와 매치되어 리스트에 들어가있어야 할텐데 들어가지 않음

['./glob_practice\\데이터1.txt', './glob_practice\\데이터1000.txt', './glob_practice\\데이터2.txt', './glob_practice\\엑셀데이터1.xlsx', './glob_practice\\엑셀데이터2.xlsx', './glob_practice\\텍스트데이터1.txt', './glob_practice\\텍스트데이터2.txt', './glob_practice\\폴더1', './glob_practice\\폴더2']


In [None]:
# 위의 결과와 동일함
path_list = glob.glob('./glob_practice/*')
print(path_list)

['./glob_practice\\데이터1.txt', './glob_practice\\데이터1000.txt', './glob_practice\\데이터2.txt', './glob_practice\\엑셀데이터1.xlsx', './glob_practice\\엑셀데이터2.xlsx', './glob_practice\\텍스트데이터1.txt', './glob_practice\\텍스트데이터2.txt', './glob_practice\\폴더1', './glob_practice\\폴더2']


In [None]:
# 여러 깊이의 하위폴더 내부까지도 탐색하고 싶다면, recursive=True 매개변수를 전달해야합니다. 
# 따로 지정해주지 않으면 기본 값으로 recursive=False 가 되어 폴더를 재귀적으로 탐색하지 않습니다.
# (폴더를 재귀적으로 탐색한다는 것은 여러 깊이의 하위 폴더까지 탐색한다는 것입니다.)

path_list = glob.glob('./glob_practice/**', recursive=True)
print(path_list)

['./glob_practice\\', './glob_practice\\데이터1.txt', './glob_practice\\데이터1000.txt', './glob_practice\\데이터2.txt', './glob_practice\\엑셀데이터1.xlsx', './glob_practice\\엑셀데이터2.xlsx', './glob_practice\\텍스트데이터1.txt', './glob_practice\\텍스트데이터2.txt', './glob_practice\\폴더1', './glob_practice\\폴더1\\폴더1의데이터1.txt', './glob_practice\\폴더1\\폴더1의데이터1000.txt', './glob_practice\\폴더1\\폴더1의데이터2.txt', './glob_practice\\폴더1\\폴더1의엑셀데이터1.xlsx', './glob_practice\\폴더1\\폴더1의엑셀데이터2.xlsx', './glob_practice\\폴더1\\폴더1의텍스트데이터1.txt', './glob_practice\\폴더1\\폴더1의텍스트데이터2.txt', './glob_practice\\폴더2', './glob_practice\\폴더2\\폴더2의데이터1.txt', './glob_practice\\폴더2\\폴더2의데이터1000.txt', './glob_practice\\폴더2\\폴더2의데이터2.txt', './glob_practice\\폴더2\\폴더2의엑셀데이터1.xlsx', './glob_practice\\폴더2\\폴더2의엑셀데이터2.xlsx', './glob_practice\\폴더2\\폴더2의텍스트데이터1.txt', './glob_practice\\폴더2\\폴더2의텍스트데이터2.txt']


### 퀴즈: 모든 txt 파일의 경로를 얻고 싶다면? 

In [None]:
path_list = glob.glob('./glob_practice/**/*.txt', recursive=True)
print(path_list)

['./glob_practice\\데이터1.txt', './glob_practice\\데이터1000.txt', './glob_practice\\데이터2.txt', './glob_practice\\텍스트데이터1.txt', './glob_practice\\텍스트데이터2.txt', './glob_practice\\폴더1\\폴더1의데이터1.txt', './glob_practice\\폴더1\\폴더1의데이터1000.txt', './glob_practice\\폴더1\\폴더1의데이터2.txt', './glob_practice\\폴더1\\폴더1의텍스트데이터1.txt', './glob_practice\\폴더1\\폴더1의텍스트데이터2.txt', './glob_practice\\폴더2\\폴더2의데이터1.txt', './glob_practice\\폴더2\\폴더2의데이터1000.txt', './glob_practice\\폴더2\\폴더2의데이터2.txt', './glob_practice\\폴더2\\폴더2의텍스트데이터1.txt', './glob_practice\\폴더2\\폴더2의텍스트데이터2.txt']


## shutil Library

In [None]:
# os 모듈과 비슷한 기능을 제공하는 라이브러리입니다. 
# 하지만 os 모듈에는 없는 ‘복사’ 기능이 있습니다.

### move()

In [None]:
import shutil

shutil.move(src, dst)
# src: 변경 전 파일 이나 폴더의 경로
# dst: 변경 후 파일 이나 폴더의 경로

# 파일 및 폴더의 이동에 사용되며, 이름을 바꿀 수도 있습니다.
# dst에 해당하는 파일이 이미 존재한다면 **덮어씌웁니다.**
# os.rename() 함수와 사용 목적이나 방법이 동일하지만 dst 에 해당하는 파일이 이미 존재할 때 어떤 식으로 처리하는지 차이가 있습니다.
# os.rename() 함수는 파일이 존재할 때 에러를 발생시킵니다.

In [None]:
shutil.move('./glob_project', './mytest')

'./mytest'

### rmtree()

In [None]:
# 폴더를 내용물까지 포함하여 모두 지우는 함수
# 내용물이 있든 없든 무조건 폴더를 지우므로 편리한 때가 있지만 신중한 사용이 필요합니다.
shutil.rmtree('./mytest')

# os.rmdir( ) 함수는 폴더 내부에 내용물이 있다면 삭제 불가

### copy()

In [None]:
shutil.copy(src, dst)
# src: 복사하려는 파일의 경로
# dst: 붙여넣기 하려는 경로

# 복사와 동시에 파일명 수정도 가능
# 붙여넣기 하려는 파일이 이미 존재한다면 덮어씌움
# 파일만 복사 가능. 폴더 복사 시도시 에러 발생

In [None]:
shutil.copy('7.png', './oh/test/test.png')

'./oh/test/test.png'

### copytree()

In [None]:
# 폴더를 복사, 붙여넣기 하는 함수

shutil.copytree(src, dst)
# src: 복사하려는 폴더의 경로
# dst: 붙여넣기 하려는 경로

# 붙여넣기 하려는 폴더가 이미 존재한다면 에러 발생(copy( ) 함수와의 차이점)
# 폴더 내부의 내용물까지 모두 복사됨
# 폴더만 복사 가능. 파일 복사 시도시 에러 발생
# 복사와 동시에 폴더명 수정도 가능

# 어떤 함수는 dst가 있으면 에러가 발생하고 어떤 함수는 덮어쓰기 되고.. 이걸 다 외워서 사용해야하나? 라는 의문이 생길 수 있습니다. 
# 외우는게 편하신 분들은 외우시면 되지만 처음부터 모든 것을 외우고 사용하기란 쉽지는 않을 겁니다.
# ‘~한 상황에서 ~한 차이가 있는 함수가 있었다’는 사실만 기억해놓았다가 실제 코드를 작성할 때 간단한 예시코드를 돌려보고 결과를 확인해가며 사용하시면 됩니다.
# 구글 검색또한 아주아주 현명한 방법이 될 수 있습니다.

### os, glob, shutil 라이브러리 활용 종합 예제

1. ‘프로젝트1’ 폴더에 있는 모든 파일 및 폴더의 경로를 출력해주세요
2. ‘프로젝트1’ 폴더에 있는 모든 파일의 경로를 출력해보세요. ‘파일’의 경로만 출력되어야 합니다.
3. ‘프로젝트2’ 폴더에 있는 모든 이미지 파일의 확장자를 .png 확장자로 변환해주세요.
4. ‘glob예제’ 폴더 하위에 ‘프로젝트4’ 폴더를 새로 만들어 ‘프로젝트2’의 ‘dir1’, ‘dir2’, ‘dir3’ 으로 나뉜 파일들을 한 곳에 복사해 모아주세요.
5. ‘프로젝트3’ 폴더 하위에 ‘03모음’ 폴더를 만들어 모든 202203.json 파일을 복사해 모아보세요. 단, 원본 파일은 202203(0).json을 파일명으로, n차 수정 폴더 내부의 파일은 202203(n).json을 파일명으로 하여 파일명 중복을 피하도록 코드를 작성해주세요.

In [None]:
# 1번

import glob

target_dir = 'glob_project\프로젝트1'
path_list = glob.glob(target_dir + '\\**', recursive=True)
print(path_list)

['glob_project\\프로젝트1\\', 'glob_project\\프로젝트1\\image files', 'glob_project\\프로젝트1\\image files\\img1.bmp', 'glob_project\\프로젝트1\\image files\\img2.bmp', 'glob_project\\프로젝트1\\image files\\img3.bmp', 'glob_project\\프로젝트1\\image files\\img4.bmp', 'glob_project\\프로젝트1\\image files\\img5.bmp', 'glob_project\\프로젝트1\\json files', 'glob_project\\프로젝트1\\json files\\img1.json', 'glob_project\\프로젝트1\\json files\\img2.json', 'glob_project\\프로젝트1\\json files\\img3.json', 'glob_project\\프로젝트1\\json files\\img4.json', 'glob_project\\프로젝트1\\json files\\img5.json']


In [None]:
# 2번

import glob
import os

target_dir = 'glob_project\프로젝트1'
path_list = glob.glob(target_dir + '\**', recursive=True)

file_list = []
for path in path_list:
    if os.path.isfile(path):
        file_list.append(path)

print(file_list)

['glob_project\\프로젝트1\\image files\\img1.bmp', 'glob_project\\프로젝트1\\image files\\img2.bmp', 'glob_project\\프로젝트1\\image files\\img3.bmp', 'glob_project\\프로젝트1\\image files\\img4.bmp', 'glob_project\\프로젝트1\\image files\\img5.bmp', 'glob_project\\프로젝트1\\json files\\img1.json', 'glob_project\\프로젝트1\\json files\\img2.json', 'glob_project\\프로젝트1\\json files\\img3.json', 'glob_project\\프로젝트1\\json files\\img4.json', 'glob_project\\프로젝트1\\json files\\img5.json']


In [None]:
# 3번

import glob
import os

target_dir = 'glob_project\프로젝트2'
path_list = glob.glob(target_dir + '\**\*.bmp', recursive=True)

for path in path_list:
    os.rename(path, path.replace('.bmp', '.png'))

In [None]:
# 4번

import glob
import os
import shutil

target_dir = 'glob_project\프로젝트2'
path_list = glob.glob(target_dir + '\**', recursive=True)

save_dir = 'glob_project\프로젝트4'
if not os.path.exists(save_dir):
    os.mkdir(save_dir)

for path in path_list:
    if os.path.isfile(path):
        shutil.copy(path, save_dir + '\\' + path.split('\\')[-1])

In [None]:
# 5번

import glob
import os
import shutil

target_dir = 'glob_project\\프로젝트3'
save_dir = target_dir + '\\03모음'

if not os.path.isdir(save_dir):
    os.mkdir(save_dir)

shutil.copy(target_dir + '\\원본\\json\\202203.json', save_dir + '\\202203(0).json')

path_list = glob.glob(target_dir + '\\수정본\\**\\202203.json', recursive=True)
for path in path_list:
    revise_num = int(path.split('\\')[-3].replace('차 수정', ''))
    shutil.copy(path, save_dir + '\\202203(%d).json' % revise_num)