# 파일 읽기 및 저장하기
*  fileinput

### 1-1. fileinput
* 텍스트 파일을 읽고, 쓰고, 저장하는 기능을 편리하게 사용할 수 있도록 해주는 라이브러리
* 여러개의 파일을 읽어서 수정할 수 있음

In [1]:
import fileinput
import os
import glob


In [3]:
# 현재 경로를 확인
os.getcwd()

'C:\\JM\\Python\\jupyter'

In [4]:
# 디렉토리 내 파일 확인
os.listdir(os.getcwd())

['.ipynb_checkpoints', '24. 파일 입출력 라이브러리.ipynb']

In [5]:
# 경로 설정
path = 'sample/'

In [8]:
# glob(): 해당 경로의 파일 이름을 리스트로 반환
glob.glob(os.path.join(path,'*.txt'))

['sample\\step1.txt',
 'sample\\step2.txt',
 'sample\\step3.txt',
 'sample\\step4.txt',
 'sample\\step5.txt']

In [12]:
with fileinput.input(glob.glob(os.path.join(path,'*.txt'))) as f:
    for line in f:
        print(line)

1번째 줄입니다.

2번째 줄입니다.

3번째 줄입니다.

4번째 줄입니다.

5번째 줄입니다.

6번째 줄입니다.
7번째 줄입니다.

8번째 줄입니다.

9번째 줄입니다.
10번째 줄입니다.

11번째 줄입니다.

12번째 줄입니다.
13번째 줄입니다.

14번째 줄입니다.

15번째 줄입니다.


In [14]:
txt_files = glob.glob(os.path.join(path,'*.txt'))

In [15]:
txt_files

['sample\\step1.txt',
 'sample\\step2.txt',
 'sample\\step3.txt',
 'sample\\step4.txt',
 'sample\\step5.txt']

In [16]:
#각 파일의 첫번째 라인을 찾아 변경하기
with fileinput.input(txt_files, inplace = True) as f:
    for line in f:
        if f.isfirstline():
            print('첫번째 라인 입니다.',end = '\n')
        else:
            print(line,end='')

In [17]:
# 검색된 라인 변경하기
with fileinput.input(txt_files, inplace = True) as f:
    for line in f:
        if line == '첫번째 라인 입니다.\n':
            print('1번째 라인 입니다.',end = '\n')
        else:
            print(line,end='')

In [20]:
# 키워드 포함 라인 변경하기
with fileinput.input(txt_files, inplace = True) as f:
    for line in f:
        if '줄' in line:
            print('첫번째 줄입니다.', end = '\n')
        else:
            print(line,end='')

In [21]:
# 텍스트 치환하기
with fileinput.input(txt_files, inplace = True) as f:
    for line in f:
        if '첫번째' in line:
            print(line.replace('첫번째','두번째'), end = '')
        else:
            print(line,end='')

In [85]:
# 키워드 포함 라인 변경하기
with fileinput.input(txt_files, inplace = True) as f:
    for line in f:
        i=1
        if '두' in line:
            print(line.replace('두',i, end = ''))
        else:
            print(line,end='')
        i+=1

TypeError: replace() takes no keyword arguments

### 1-2. pickle
* 파이썬에서 사용하는 딕셔너리, 리스트, 클래스 등의 자료형을 변환 없이 그대로 파일로 저장하고 불러올 때 사용하는 모듈

In [42]:
import pickle

In [43]:
data = ['apple','banana','orange']

In [44]:
# 파일 저장
with open('list.pkl','wb') as f:
    pickle.dump(data,f)

In [47]:
# 파일 읽기
with open('list.pkl','rb') as f:
    data = pickle.load(f)

In [48]:
print(type(data))
print(data)

<class 'list'>
['apple', 'banana', 'orange']


In [37]:
# 딕셔너리 저장
data = {}
data[1] = {'id':1,'userid':'apple','name':'김사과','gender':'여자','age':20}

In [38]:
with open('dict.pkl','wb') as f:
    pickle.dump(data,f)

In [39]:
with open('dict.pkl','rb') as f:
    data = pickle.load(f)

In [40]:
type(data)
print(data)

{1: {'id': 1, 'userid': 'apple', 'name': '김사과', 'gender': '여자', 'age': 20}}


# 2. 파일 찾기, 복사, 이동하기

### 2-1. 파일 확장자로 찾기

In [57]:
# 파일 확장자로 찾기
os.getcwd()

'C:\\JM\\Python\\jupyter'

In [65]:
for filename in glob.glob('*.txt'):
    print(filename)

주피터 노트북.txt


In [66]:
# txt 파일 찾기 : 하위 경로
for filename in glob.glob('**/*.txt'):
    print(filename)

sample\step1.txt
sample\step2.txt
sample\step3.txt
sample\step4.txt
sample\step5.txt


In [67]:
# txt 파일 찾기: 현재와 하위 경로 모두 포함
for filename in glob.glob('**/*.txt',recursive = True):
    print(filename)

주피터 노트북.txt
sample\step1.txt
sample\step2.txt
sample\step3.txt
sample\step4.txt
sample\step5.txt


In [68]:
# 파일명 글자수로 찾기
for filename in glob.glob('????.*',recursive = True): # 글자수 4개
    print(filename)

dict.pkl
list.pkl


In [70]:
for filename in glob.glob('???????.*',recursive = True): # 글자수 7개
    print(filename)

주피터 노트북.txt


In [74]:
# 문자열 패턴 포함 파일명 찾기
for filename in glob.glob('[a-z][a-z][a-z][a-z].*',recursive = True): # 알파벳 글자수 4
    print(filename)

dict.pkl
list.pkl


In [75]:
for filename in glob.glob('**/step*.*'): # 하위폴더 안의 step으로 시작하는 파일
    print(filename)

sample\step1.txt
sample\step2.txt
sample\step3.txt
sample\step4.txt
sample\step5.txt


In [76]:
for filename in glob.glob('**/*프로젝트*.*'): 
    print(filename)

project\25.프로젝트 실습.ipynb
project\프로젝트 개요.txt


### 2-2. fnmatch
* glob과 동일하게 특정한 패턴으로 따르는 파일명을 찾아주는 모듈
* 파일명 매칭 여부를 True, False 형태로 반환하기 때문에 os.listdir()함수와 함께 사용

In [77]:
import fnmatch

In [79]:
# 파일명은 '새'로 시작하고 확장명은 .txt를 검색
# 확장자를 제외한 파일명의 길이는 4개이며, 파일명의 마지막 문자는 숫자임
for filename in os.listdir('./sample'):
    if fnmatch.fnmatch(filename,'s???[0-9].txt'):
        print(filename)

step1.txt
step2.txt
step3.txt
step4.txt
step5.txt


### 2-3. shutil
* 파일을 복사하거나 이동할 때 사용하는 내장 모듈

In [89]:
# 파일 복사하기
import shutil

In [92]:
shutil.copy('./sample/step1.txt','./sample/step1_복사본.txt')

'./sample/step1_복사본.txt'