# 파이썬으로 파일/폴더 다루기

파이썬에 내장된 아래 모듈들을 활용한다.

- pathlib: https://python.flowdas.com/library/pathlib.html
- glob: https://python.flowdas.com/library/glob.html
- shutil: https://python.flowdas.com/library/shutil.html

## 절대경로, 상대경로 이해하기

현재 폴더 절대경로 가져오기 (괄호 안에 아무것도 쓰지 않는다.)

- 현재폴더의 절대경로 가져오기 : <code>Path.cwd()</code>
- 특정파일의 절대경로 가져오기 : <code>Path(파일명).resolve()</code>
- 파일명 가져오기 : <code>Path(파일명).name()</code>
  - 파일명만 (확장자 없이) 가져오기 : <code>Path(파일명).stem</code>
  - 확장자만 가져오기 : <code>Path(파일명).suffix</code>

In [96]:
from pathlib import Path

Path.cwd()

WindowsPath('C:/Users/hlee/Desktop/작업폴더')

In [97]:
from pathlib import Path

Path('main.py').resolve()

WindowsPath('C:/Users/hlee/Desktop/작업폴더/main.py')

In [98]:
from pathlib import Path

Path('C:\\Users\\hlee\\Desktop\\작업폴더\\main.py').name

'main.py'

In [99]:
from pathlib import Path

Path('C:\\Users\\hlee\\Desktop\\작업폴더\\main.py').stem

'main'

In [100]:
from pathlib import Path

Path('C:\\Users\\hlee\\Desktop\\작업폴더\\main.py').suffix

'.py'

<code>Path.joinpath()</code>라는 함수도 널리 쓰인다. <code>Path.cwd()</code>와 함께 폴더/파일 이름을 순서대로 적어주면, 해당 문자열을 합쳐서 절대 경로의 형태로 돌려준다.

In [101]:
from pathlib import Path

Path.joinpath(Path.cwd(), "files", "sample.txt")

WindowsPath('C:/Users/hlee/Desktop/작업폴더/files/sample.txt')

## 파일 목록 얻기

파이썬으로 어떤 폴더 안에 있는 파일 목록을 얻는 가장 쉬운 방법은 <code>Path(폴더경로).iterdir()</code> 를 사용하는 것이다.

In [102]:
from pathlib import Path

[파일 for 파일 in Path("files").iterdir()]

[WindowsPath('files/1.txt'),
 WindowsPath('files/12.txt'),
 WindowsPath('files/123.txt'),
 WindowsPath('files/1234.txt'),
 WindowsPath('files/12345.txt'),
 WindowsPath('files/test - 복사본.txt'),
 WindowsPath('files/test.txt'),
 WindowsPath('files/test1.xlsx'),
 WindowsPath('files/test2.xlsx'),
 WindowsPath('files/test3.xlsx'),
 WindowsPath('files/test4.xlsx'),
 WindowsPath('files/test5.xlsx')]

glob 모듈을 사용하는 것도 가능하다. glob 모듈을 사용하면 파일명에서 특정 조건을 만족하는 파일만 필터링 하기 쉽다.

<code>*</code>를 활용하면 특정문자로 끝나는 규칙(확장자)을 통해 필터링이 가능하다. 예를 들면 .xlsx 확장자를 가진 파일만 고르고 싶다면 이렇게.

In [103]:
import glob

glob.glob("files/*.xlsx")

['files\\test1.xlsx',
 'files\\test2.xlsx',
 'files\\test3.xlsx',
 'files\\test4.xlsx',
 'files\\test5.xlsx']

당연히 특정 문자로 시작하는 파일만 찾을 수도 있다.

In [104]:
import glob

glob.glob("files/test*")

['files\\test - 복사본.txt',
 'files\\test.txt',
 'files\\test1.xlsx',
 'files\\test2.xlsx',
 'files\\test3.xlsx',
 'files\\test4.xlsx',
 'files\\test5.xlsx']

문자열 사이사이에 와일드카드문자를 써주면 더 복잡한 것도 쉽게 찾을 수 있다.

In [105]:
import glob

glob.glob("files/1*4*")

['files\\1234.txt', 'files\\12345.txt']

<code>?</code>를 활용하면 문자 개수를 세서 필터링 할 수 있다. 예를 들어 파일명이 다섯<code>?</code>를 활용하면 문자 개수를 세서 필터링 할 수 있다. 예를 들어 파일명이 다섯 글자인 .xlsx 파일만 찾고 싶다면 이렇게. 글자인 .xlsx 파일만 찾고 싶다면 이렇게.

In [107]:
import glob

glob.glob("files/????.txt")

['files\\1234.txt', 'files\\test.txt']

## 파일/폴더 관리하기

### 파일/폴더 이름 바꾸기

<code>Path(원래파일경로).rename(새로운파일경로)</code> 함수를 사용한다.

파일의 절대경로 상대경로 모두 가능하다. (폴더도 마찬가지 원리로 가능하다.)

In [112]:
from pathlib import Path

Path("C:\\Users\\hlee\\Desktop\\작업폴더\\files\\test.txt").rename("C:\\Users\\hlee\\Desktop\\작업폴더\\files\\new.txt")
Path("files/new.txt").rename("files/test.txt")	

WindowsPath('files/test.txt')

### 파일/폴더 이동하기

이름 바꾸기와 동일하게 <code>Path(원래파일경로).rename(새로운파일경로)</code> 함수를 사용한다. 함수를 사용한다. 파일의 경로를 변경함으로써 이동의 효과가 나타난다. (폴더도 마찬가지 원리로 가능하다.)

In [114]:
from pathlib import Path

Path("C:\\Users\\hlee\\Desktop\\작업폴더\\files\\test.txt").rename("C:\\Users\\hlee\\Desktop\\작업폴더\\test.txt")
Path("test.txt").rename("files/test.txt")	

WindowsPath('files/test.txt')

### 파일/폴더 삭제하기

파일의 삭제는 휴지통(recycle bin)으로 옮겨가는 것이 아니라 완전한 삭제를 의미하기 때문에 신중하게 사용하는 것이 좋다. 만약 휴지통으로 옮기는 기능을 수행하고 싶다면 <a href="https://pypi.org/project/Send2Trash/">Send2Trash</a>와 같은 라이브러리를 별도로 설치해서 사용해야 한다.

- 파일 삭제 : <code>Path(파일경로).unlink()</code>
- 폴더 삭제 : <code>shutil.rmtree()</code>

In [115]:
from pathlib import Path

Path("files/test.txt").unlink()

폴더의 삭제는 <code>Path(폴더경로).unlink()</code> 함수로는 수행이 불가능하다. 대신 <code>shutil</code> 모듈을 이용한다.

In [116]:
import shutil

shutil.rmtree("새 폴더")

이 또한 휴지통으로 이동 시키는 것이 아니라 완전한 삭제를 의미한다.

### 파일/폴더 복사하기

- 파일 복사 : <code>shutil.copyfile()</code>
- 폴더 복사 : <code>shutil.copytree()</code>

In [121]:
import shutil

shutil.copyfile("files/test.txt", "files/test-copy.txt")
shutil.copytree("files", "files - 복사본")

'files-copy'

### 새 폴더 만들기

<code>Path(폴더경로).mkdir(exist_ok=True)</code> 함수를 사용한다. <code>exist_ok=True</code>는 해당 폴더가 없을 경우에만 생성한다는 뜻이다. 만약 같은 이름을 가진 폴더가 이미 존재하는 상태에서, 이를 명시하지 않고 코드를 실행하면 "파일이 이미 있으므로 만들 수 없습니다"라는 에러가 발생한다.

In [122]:
from pathlib import Path

Path("새 폴더").mkdir(exist_ok=True)

# (실습) 반복문을 활용해서 파일명 일괄 수정하기

실습을 위해 파일 20개를 랜덤으로 만들고

In [135]:
from pathlib import Path
import uuid

폴더명 = "새 폴더"

Path(폴더명).mkdir(exist_ok=True)

for n in range(20):
    fname = f"{폴더명}\\{uuid.uuid4()}.txt"
    f = open(fname, 'w')
    f.close()

## 모든 파일명 앞/뒤에 특정 문자열 추가하기

앞에 "수정_"이라는 텍스트를 붙여보자

In [136]:
from pathlib import Path

for 파일 in Path("새 폴더").iterdir():
    Path(파일).rename(f"새 폴더/수정_{Path(파일).name}")

이번엔 뒤에 "_최종"이라는 이름을 붙여보자.

In [137]:
from pathlib import Path

for 파일 in Path("새 폴더").iterdir():
    Path(파일).rename(f"새 폴더/{Path(파일).stem}_최종{Path(파일).suffix}")

더 우아한 방식으로도 파일 경로를 다룰 수 있겠으나 본 강의는 파이썬 입문자를 위한 것이고, 파일의 이름 및 경로에 익숙해지는 것이 목적이므로 더 깊이 다루지 않는다.

## 모든 파일에 순서대로 번호 부여하기

반복문을 돌며 해당 번호를 하나씩 +1 하는 방식.

In [138]:
from pathlib import Path

번호 = 1
for 파일 in Path("새 폴더").iterdir():
    Path(파일).rename(f"새 폴더/{Path(파일).stem}_진짜최종_{번호}{Path(파일).suffix}")
    번호 += 1 