# 6 리스트 활용

목표 : 지정된 날짜 이후에 수정된 파일들 복사하는 코드 만들기

## 6.1 파일 목록 얻기

### 6.1.1 파일 목록 얻기 - `glob.glob`

* `?`는 임의의 문자 1개와 일치 한다.
* `*`는 임의 개수(0개 포함)의 모든 문자와 일치한다.
* `[...]`는 괄호 안의 임의의 1개 문자와 일치한다.


In [1]:
import glob

glob.glob("C:\\Windows\\*.exe")

[]

In [2]:
glob.glob('C:\\Windows\\[bc]*.*') # b혹은 c로 시작하는 파일들

[]

In [3]:
glob.glob('C:\\Windows\\??.exe')

[]

### 6.1.2 더 강력한 파일 목록 얻기 - `os.walk()`

디렉터리의 하위 트리 구조를 재귀적으로 검색해 가면서 디렉터리 목록과 파일 목록을 전달해 주는 객체를 생성

In [4]:
import os

for (curdir, dirs, files) in os.walk('.'):
    print('curdir=', curdir)
    print('dirs=', dirs[:5]) # 지면 관계상 5개까지만
    print('files=', files[:5]) # 지면 관계상 5개까지만
    print('-'*60)

curdir= .
dirs= ['.ipynb_checkpoints', 'data', 'deep-learning-from-scratch-master', 'img']
files= ['01_파이썬언어개요_실행환경.pptx', 'graphviz-2.38.msi', 'face_out.png', '09_객체직렬화.ipynb', '11_scikit-learn 소개.ipynb']
------------------------------------------------------------
curdir= ./.ipynb_checkpoints
dirs= []
files= ['06_리스트_활용-checkpoint.ipynb', '03_문자열-checkpoint.ipynb', '05_리스트-checkpoint.ipynb', '04_수치연산-checkpoint.ipynb']
------------------------------------------------------------
curdir= ./data
dirs= []
files= ['face.png', '기후자료_2014_108.xlsx', 'alice.txt', '기후자료_2014_108.csv']
------------------------------------------------------------
curdir= ./deep-learning-from-scratch-master
dirs= ['ch05', 'ch03', 'ch04', 'ch06', 'ch07']
files= ['README.md', 'LICENSE.md', '.gitignore']
------------------------------------------------------------
curdir= ./deep-learning-from-scratch-master/ch05
dirs= ['__pycache__']
files= ['layer_naive.py', 'gradient_check.py', 'two_layer_net.py', 'buy_apple.py'

## 6.2 파일 경로 다루기


In [5]:
import os

os.path.abspath('.')

'/home/idea/Dropbox/pythonlecture sj'

In [6]:
os.path.basename('D:\\Projects\\PythonLecture\\a.png')

'D:\\Projects\\PythonLecture\\a.png'

In [8]:
os.path.commonpath(['D:\\Projects\\PythonLecture', 'D:\\Projects\\PythonLecture\\DeepLearning'])

''

In [9]:
os.getcwd()

'/home/idea/Dropbox/pythonlecture sj'

In [10]:
os.path.dirname('D:\\Projects\\PythonLecture\\a.png')

''

In [11]:
os.path.normpath('.\\..\\.')

'.\\..\\.'

In [12]:
os.path.split('D:\\Projects\\PythonLecture\\a.png')

('', 'D:\\Projects\\PythonLecture\\a.png')

In [13]:
os.path.splitdrive('D:\\Projects\\PythonLecture\\a.png')

('', 'D:\\Projects\\PythonLecture\\a.png')

In [14]:
os.path.splitext('D:\\Projects\\PythonLecture\\a.png')

('D:\\Projects\\PythonLecture\\a', '.png')

In [15]:
os.path.join('d:', '\\root', 'a.png')

'd:/\\root/a.png'

## 6.3 파일 속성 정보 알아내기

파일 목록을 얻었으면 각 파일에 대한 속성 정보를 구해야 한다. 이 정보를 알아야 여러가지 작업이 가능하기 때문이다. 
`os.path` 모듈을 이용하여 파일의 다양한 속성을 확인할 수 있다.

In [16]:
import os

fpath = "C:\\Windows\\notepad.exe"

In [17]:
os.path.isfile(fpath)  # fpath가 일반파일이면 True를 반환한다.

False

In [18]:
os.path.isdir(fpath)   # fpath가 디렉터리(폴더)이면 True를 반환한다.

False

In [19]:
os.path.exists(fpath)  # fpath 파일이 존재하면 True를 반환한다.

False

In [20]:
os.path.getsize(fpath) # 파일의 크기를 얻는다

FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Windows\\notepad.exe'

### 6.3.1 파일 수정시간/접근시간


In [21]:
os.path.getmtime(fpath)  # 파일 수정 시간

FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Windows\\notepad.exe'

In [22]:
os.path.getatime(fpath)  # 파일 접근 시간

FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Windows\\notepad.exe'

### 6.3.2 시간의 해석


In [23]:
import time

`time.time()`은 현재 시간을 돌려준다.

In [24]:
time.time()

1487124796.2009144

In [25]:
time.localtime()

time.struct_time(tm_year=2017, tm_mon=2, tm_mday=15, tm_hour=11, tm_min=13, tm_sec=21, tm_wday=2, tm_yday=46, tm_isdst=0)

In [26]:
time.localtime(123123123)

time.struct_time(tm_year=1973, tm_mon=11, tm_mday=26, tm_hour=9, tm_min=52, tm_sec=3, tm_wday=0, tm_yday=330, tm_isdst=0)

구조화된 시간을 변수에 저장해보자.
이 값은 이름있는 튜플은 이름으로 접근할 수도 있고 인덱스로도 접근할 수 있다.

In [27]:
t = time.localtime(1447192560.872364)
t.tm_year, t.tm_mon, t.tm_mday, t.tm_hour, t.tm_min, t.tm_sec

(2015, 11, 11, 6, 56, 0)

슬라이싱으로 년월일, 시분초 등의 정보를 추출하면 편하다.

In [28]:
t[:3], t[:6]

((2015, 11, 11), (2015, 11, 11, 6, 56, 0))

이 것으로 시간 형식을 만들 수 있다.

In [30]:
'{}-{}-{} {}:{}:{}'.format(*t[:6]) # *를 앞에 붙이면 각각 분리해서 입력한 것과 같은 효과

'2015-11-11 6:56:0'

이 구조화된 정보로 부터 다시 숫자 시간으로 변환하려면 `time.mktime()`을 이용한다.

In [31]:
time.mktime(t)

1447192560.0

`struct_time` 자료형 대신에 9개 값의 튜플을 이용할 수도 있다. 
다음은 주어진 시간 2015년 10월 19일 18시 8분 30초에 대한 하나의 숫자 시간을 계산한 예이다.

In [32]:
time.mktime((2015, 10, 19, 18, 8, 30, 0, 0, 0))

1445245710.0

## 6.4 파일 다루기

`os` 모듈의 `rename()`은 파일 이름을 바꾼다. 파일을 이동하는데도 사용할 수 있다.

In [33]:
os.rename('a.py', 'b.py')   # a.py --> b.py

FileNotFoundError: [Errno 2] No such file or directory: 'a.py' -> 'b.py'

In [34]:
os.rename('t1.py', 'public_html/t1.py')  # 파일의 이동

FileNotFoundError: [Errno 2] No such file or directory: 't1.py' -> 'public_html/t1.py'

파일을 복사하는데는 `shutil` 모듈의 `copyfile`을 사용할 수 있다.

In [33]:
import shutil

shutil.copyfile('a.py', 'b.py')

`os.remove()`는 파일을 삭제한다.

In [34]:
os.remove('t.py')

## 6.5 디렉터리 다루기


In [35]:
os.getcwd() # 현재 프로세스의 작업 디렉터리

In [36]:
os.chdir('d:\\') # 작업 중인 디렉터리를 변경

In [37]:
os.mkdir('temp')

In [38]:
os.rmdir('temp2')  # 내용이 없는 빈 디렉터리를 삭제

In [39]:
os.removedirs('level1/level2')

In [40]:
import shutil

shutil.rmtree('temp')  # 주의!!! 하위 디렉터리까지 모두 한꺼번에 삭제

디렉토리를 통째로 복사하는 것도 가능하다.

In [41]:
shutil.copytree('public_html', 'myweb_backup')

## 6.6 파일 다루기 예제

지정된 날짜 이후에 수정된 파일들 복사하기

In [42]:
import time
import os
import shutil
import ctypes

def is_hidden(filepath):
    for name in filepath.split(os.sep):
        if name.startswith('.'):
            return True
    return False

start_tm = '2017-2-9 00:00:00'
src_dir = os.path.abspath('.')
dest = 'd:\\tmp'

st = time.strptime(start_tm, '%Y-%m-%d %H:%M:%S')
tm = time.mktime(st)

for curdir, dirs, files in os.walk(src_dir):
    if is_hidden(curdir):
        print('[skipping directory]', curdir)
        continue
    for fname in files:
        if os.path.splitext(fname)[1] in ('.ipynb', '.jpg'):
            fpath = os.path.join(curdir, fname)
            try:
                if os.path.getmtime(fpath) >= tm:
                    common = os.path.commonpath([src_dir, fpath])
                    fpath2 = os.path.normpath(os.path.join(dest, fpath[len(common)+1:]))
                    fpath2_dir = os.path.split(fpath2)[0]
                    if not os.path.exists(fpath2_dir):
                        os.makedirs(fpath2_dir)
                    if not os.path.exists(fpath2):
                        print(fpath, '==>', fpath2)
                        shutil.copyfile(fpath, fpath2)
            except FileNotFoundError as e:
                print(e)

[skipping directory] D:\Projects\PythonLecture\DeepLearnigConference2017\notebook\.ipynb_checkpoints
D:\Projects\PythonLecture\DeepLearnigConference2017\notebook\.ipynb_checkpoints\03_문자열-checkpoint.ipynb ==> d:\tmp\.ipynb_checkpoints\03_문자열-checkpoint.ipynb
D:\Projects\PythonLecture\DeepLearnigConference2017\notebook\.ipynb_checkpoints\04_수치자료형-checkpoint.ipynb ==> d:\tmp\.ipynb_checkpoints\04_수치자료형-checkpoint.ipynb
D:\Projects\PythonLecture\DeepLearnigConference2017\notebook\.ipynb_checkpoints\05_리스트-checkpoint.ipynb ==> d:\tmp\.ipynb_checkpoints\05_리스트-checkpoint.ipynb
D:\Projects\PythonLecture\DeepLearnigConference2017\notebook\.ipynb_checkpoints\05_리스트_활용-checkpoint.ipynb ==> d:\tmp\.ipynb_checkpoints\05_리스트_활용-checkpoint.ipynb
D:\Projects\PythonLecture\DeepLearnigConference2017\notebook\.ipynb_checkpoints\06_사전-checkpoint.ipynb ==> d:\tmp\.ipynb_checkpoints\06_사전-checkpoint.ipynb
D:\Projects\PythonLecture\DeepLearnigConference2017\notebook\.ipynb_checkpoints\07_객체직렬화-checkpoint.i

### 6.6.1 퀴즈 1

오늘 오전 7시 이후로 수정된 모든 파일 목록을 출력해보고, `backup_2015_11_10`과 같이 오늘 날짜로 된 폴더를 생성하여 한 장소에 모두 복사한다.

### 6.6.2 퀴즈 2

작업을 하다보면 필요 없는 파일들이 생겨난다. 이들을 일괄적으로 삭제해보자. 예를 들어 확장자가 `.bak` 파일을 삭제해본다.

### 6.6.3 퀴즈 3

파일 찾기 `os.walk`를 이용하여 부분 파일 이름으로 파일을 찾아보자.

만일 원한다면 찾아진 파일들을 다음 명령으로 한 번에 에디터로 불러올 수도 있다.
만일 EditPlus3 혹은 sublime text가 설치 되어 있다면 다음 명령으로 위의 파일들은 한 번에 에디터에 올라온다.

In [43]:
from subprocess import Popen

Popen([r"C:\Program Files (x86)\EditPlus 3\editplus.exe"] + flist)

<subprocess.Popen at 0x579ff60>

In [44]:
from subprocess import Popen

Popen([r"C:\Program Files\Sublime Text 3\sublime_text.exe"] + flist)

<subprocess.Popen at 0x579f198>