# 資料夾與檔案相關模組

**模組os內有許多資料夾與檔案的函式可以使用，可以對資料夾與檔案進行存取與管理，重要的資料夾與檔案函式如下:**

- `os.getcwd()`: 回傳目前所在的資料夾
- `os.chdir(path)`: 改變到path所指定的資料夾下
- `os.mkdir(path, dir_fd=None)`: 建立path所指定的資料夾，path所指定的資料夾不能事先存在。若dir_fd有設定資料夾路徑，則path為相對路徑，path前須加上dir_fd，建立的資料夾為dir_fd\\path，若dir_fd為None則path為絕對路徑
- `os.rmdir(path, *, dir_fd=None)`: 刪除path所指定的資料夾，但該資料夾需要是空的才能刪除。若dir_fd有設定資料夾路徑，則path為相對路徑，path前面須加上dir_fd，刪除的檔案為dir_fd\\path，若dir_fd為None則path為絕對路徑
- `os.remove(path, dir_fd=None)`: 刪除path所指定的檔案，若dir_fd有設定資料夾路徑，則path為相對路徑，path前須加上dir_fd，刪除的檔案為dir_fd\\path，若dir_fd為None則path為絕對路徑
- `os.listdir(path='.')`: 以串列回傳path所指定資料夾下的檔案與資料夾
- `os.path.abspath(path)`: 將path所指定的相對路徑轉換成絕對路徑
- `os.path.join(path, *paths)`: 回傳path結合*paths的資料夾或檔案路徑
- `os.walk(top, topdown=True, onerror=None, followlinks=False)`: 遞迴方式走訪top所指定的資料夾，預設使用topdown方式，由上而下，回傳一個tuple包含三個元素(dirpath, dirnames, filenames)
    - dirpath是字串，表示資料夾的絕對路徑
    - dirnames是串列，表示dirpath下的所有子資料夾
    - filenames是串列，表示dirpath下的所有非資料夾的元素
- `os.path.isfile(path)`: 檢查path所指定的檔案或資料夾是否為檔案，若是檔案則回傳True，否則回傳False
- `os.path.isdir(path)`: 檢查path所指定的檔案或資料夾是否為資料夾，若是資料夾則回傳True，否則回傳False
- `os.path.exists(path)`: 檢查path所指定的檔案或資料夾是否存在，若是則回傳True，否則回傳False
- `os.path.getsize(path)`: 回傳path所指定檔案的大小，`單位為byte`

In [1]:
import os

In [2]:
print(os.getcwd())

C:\Users\315\python程式設計


In [3]:
os.chdir('C:\Riot Games\VALORANT')
print(os.getcwd())

C:\Riot Games\VALORANT


In [5]:
os.mkdir('C:\\test1') # 建立C磁碟下的test資料夾

In [12]:
os.rmdir('C:\\test') # 刪除C磁碟下的test資料夾

In [13]:
os.mkdir('C:\\test') # 建立C磁碟下的test資料夾

In [6]:
os.remove('C:\test.chm') # 刪除檔案C磁碟下的檔案test.chm

OSError: [WinError 123] 檔案名稱、目錄名稱或磁碟區標籤語法錯誤。: 'C:\test.chm'

In [7]:
print(os.listdir('C:\Riot Games\VALORANT')) # 以串列回傳path所指定資料夾下的檔案與資料夾

['live']


In [8]:
print(os.path.abspath('.')) #將path所指定的相對路徑轉換成絕對路徑

C:\Riot Games\VALORANT


In [10]:
root = 'C:\\test'
file = 'zsg.jpg'
print(os.path.join(root, file)) # 回傳path結合*paths的資料夾或檔案路徑

C:\test\zsg.jpg


In [14]:
path = 'C:\\test'
for root, dirs, files in os.walk(path):
    for file in files:
        print(os.path.join(root, file))

C:\test\test.txt


In [15]:
print(os.path.isfile('C:\\\\Windows'))

False


In [16]:
print(os.path.isdir('C:\\\\Windows'))

True


In [17]:
print(os.path.exists('C:\\\\Windows'))

True


In [18]:
print(os.path.getsize('C:\\\\Windows')) # 回傳單位為byte

20480


**其他檔案與資料夾相關模組的重要函式如下:**

- `glob.glob(pathname)`: 找出pathname所指定類型的檔案
- `fnmatch.fnmatch(filename, pattern)`: 檢查filename是否滿足pattern，若滿足pattern則回傳True，否則回傳False
- `fnmatch.filter(names, pattern)`: 可以使用pattern過濾names所匯入的檔案名稱串列，只找出pattern所指定的副檔名
- `str.endswith(suffix)`: 字串是否以suffix結尾

In [19]:
import os, glob
path = 'C:\\\\Riot Games\\VALORANT\\live'
os.chdir(path)
print(glob.glob('*.txt')) # * 表示任何檔案名稱

['Manifest_DebugFiles_Win64.txt', 'Manifest_NonUFSFiles_Win64.txt']


In [20]:
import os, glob, fnmatch
path = 'C:\\Riot Games\\VALORANT\\live'
os.chdir(path)
files = glob.glob('*.exe')
for file in files:
    print(fnmatch.fnmatch(file, '*.exe'))

True


In [21]:
import os, glob, fnmatch
path = 'C:\\Riot Games\\VALORANT\\live'
os.chdir(path)
files = glob.glob('*.txt')
print(fnmatch.filter(files, '*.txt'))

['Manifest_DebugFiles_Win64.txt', 'Manifest_NonUFSFiles_Win64.txt']


In [33]:
path = 'C:\\Riot Games\\VALORANT\\live'
os.chdir(path)
files = glob.glob('*.txt')
for file in files:
    if file.endswith('.txt'):
        print(file)
    else:
         print('找不到所指定的檔案')

Manifest_DebugFiles_Win64.txt
Manifest_NonUFSFiles_Win64.txt


## 找出C磁碟下的檔案與資料夾

**使用`os.listdir`找出路徑下的檔案與資料夾，接著利用`os.path.isdir`判斷是否為資料夾，將檔案前加上`檔案:`，資料夾前面加上`資料夾:`**

In [23]:
import os
os.chdir('C:\\')
print(os.getcwd()) # 確認目前位置
fds = os.listdir('C:\\')
for fd in fds:
    if os.path.isdir(fd):
        print(f'資料夾: {fd}')
    else:
        print(f'檔案: {fd}')

C:\
資料夾: $Recycle.Bin
資料夾: $SysReset
資料夾: $WinREAgent
檔案: .GamingRoot
資料夾: Documents and Settings
檔案: DumpStack.log
檔案: DumpStack.log.tmp
檔案: hiberfil.sys
資料夾: hp
資料夾: hpswsetup
資料夾: Intel
資料夾: Microsoft
資料夾: OneDriveTemp
檔案: pagefile.sys
資料夾: PerfLogs
資料夾: Program Files
資料夾: Program Files (x86)
資料夾: ProgramData
資料夾: Recovery
資料夾: Riot Games
資料夾: RM
檔案: swapfile.sys
資料夾: SWSetup
資料夾: System Volume Information
資料夾: System.sav
資料夾: test
資料夾: Users
資料夾: Windows
資料夾: xampp
資料夾: XboxGames


## 使用串列生成式找出C磁碟下的檔案與資料夾

**使用`os.listdir`找出路徑下的檔案與資料夾，接著利用`os.path.isfile`判斷是否為檔案，將檔案儲存到串列files，接著利用`os.path.isdir`判斷是否為資料夾，將資料夾儲存到串列dirs，分開顯示檔案與資料夾**

In [25]:
import os
path = 'C:\\'
print(f'目前路徑為{os.getcwd()}')
print('=' * 40)

files = [f for f in os.listdir(path) if os.path.isfile(os.path.join(path, f))]
dirs = [d for d in os.listdir(path) if os.path.isdir(os.path.join(path, d))]
print(f'檔案為{files}')
print('=' * 40)
print(f'資料夾為{dirs}')

目前路徑為C:\
檔案為['.GamingRoot', 'DumpStack.log', 'DumpStack.log.tmp', 'hiberfil.sys', 'pagefile.sys', 'swapfile.sys']
資料夾為['$Recycle.Bin', '$SysReset', '$WinREAgent', 'Documents and Settings', 'hp', 'hpswsetup', 'Intel', 'Microsoft', 'OneDriveTemp', 'PerfLogs', 'Program Files', 'Program Files (x86)', 'ProgramData', 'Recovery', 'Riot Games', 'RM', 'SWSetup', 'System Volume Information', 'System.sav', 'test', 'Users', 'Windows', 'xampp', 'XboxGames']


## 使用模組glob列出副檔名為py的檔案

**使用`os.chdir`切換到指定的資料夾，接著使用`glob.glob`可以找出特定副檔名的檔案，使用`*.py`就可以找出副檔名為py的檔案，`*`表示任何檔案名稱**

In [30]:
import os, glob
path = 'C:\\test'
os.chdir(path)
for file in glob.glob('*.py'):
    print(file)

test1.py
test2.py


## 使用遞迴列出所有資料夾與檔案

**自訂函式`find_dir`**
- 使用模組os的函式listdir列出指定資料夾下的所有資料夾與檔案，將結果儲存到變數fds
- 使用for迴圈依序取出變數fds的每個元素
- 若該元素是資料夾，則使用遞迴方式呼叫函式find_dir列出資料夾下的所有檔案與資料夾

In [32]:
import os
path = 'C:\\test'
def find_dir(dirs):
    fds = os.listdir(dirs)
    for fd in fds:
        full_path = os.path.join(dirs, fd)
        if os.path.isdir(full_path):
            print('資料夾', full_path)
            find_dir(full_path)
        else:
            print('檔案', full_path)
find_dir(path)

檔案 C:\test\test.txt
檔案 C:\test\test1.py
檔案 C:\test\test2.py
資料夾 C:\test\test_dir
資料夾 C:\test\test_dir1
檔案 C:\test\test_dir1\hi.txt
檔案 C:\test\test_dir1\wow.txt
資料夾 C:\test\test_dir2
資料夾 C:\test\test_dir2\hello_world


## 使用*os.walk*列出所有Python檔案

**使用`os.walk`會自動遞迴列出所有資料夾與檔案，接著使用`file.endswith('.py')`找出結尾是`.py`的檔案**

In [35]:
import os
path = 'C:\\test'

# os.walk會回傳(dirpath, dirnames, filenames)
for root, dirs, files in os.walk(path):
    for file in files:
        if file.endswith('.py'):
            print(os.path.join(root, file))

C:\test\test1.py
C:\test\test2.py


## 使用os.walk列出所有JPG與PNG檔案

**使用`os.walk`會自動遞迴列出所有資料夾與檔案，接著使用`fnmatch.filter`，只將JPG與PNG檔案儲存到串列matches中**

In [39]:
import fnmatch, os
path = 'C:\$Recycle.Bin'
exts = ['*.jpg', '*.jpeg', '*.png']
matches = []

# 使用os.walk會回傳一個tuple，使用root, dirs, files解開此回傳的tuple物件
# root是字串，表示資料夾絕對路徑
# dirs是串列，表示root下的所有子資料夾
# files是串列，表示root下的所有非資料夾的元素
for root, dirs, files in os.walk(path):
    for ext in exts:
        for file in fnmatch.filter(files, ext): # 找出檔案結尾是ext的檔案
            matches.append(os.path.join(root, file)) # 使用os.path.join結合root與file，將此檔案路徑新增到串列matches中
for image in matches:
    print(image)

C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$I0Q3AFW.jpg
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$I64Z98W.jpg
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$ICFKNP4.jpg
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$ILUDKSO.jpg
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$IRXGQGB.jpg
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$ITY7EQC.jpg
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$IW1Q9WZ.jpg
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$IYF1S23.jpg
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$R5J55CV.lcv\Assets\Installer.150x150.contrast-black_scale-100.png
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$R5J55CV.lcv\Assets\Installer.150x150.contrast-black_scale-140.png
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$R5J55CV.lcv\Assets\Installer.150x150.contrast-black_scale-180.png
C:\$Recycle.B

# 存取文字檔

**這一節要取出檔案內的每一行**
- 首先要學會開啟檔案，讀取檔案，寫入檔案與關閉檔案
- 處理檔案的類型: 文字檔、csv檔、二進位檔
- 本節介紹文字檔的讀取與寫入，以下為檔案存取函式

**`open(filename, mode, encoding)`: 開啟檔案filename，設定模式為mode，使用encoding為文字編碼，mode所提供的模式如下**
   - `r`: 讀取
   - `w`: 寫入
   - `x`: 寫入，但檔案不能已經存在，防止複寫檔案
   - `a`: 寫入，若檔案已經存在，保留原本的資料，將新增的內容加到檔案的最後
   - `t`: 文字檔
   - `b`: 二進位檔
   - `+`: 可以讀取與寫入檔案

In [11]:
fin = open('poem.txt', mode = 'rt', encoding = 'utf-8')
fin.close()

**`read(size)`: 若不指定size，則會讀取整個檔案，否則會讀取大小為size位元組的資料**

In [12]:
fin = open('poem.txt', mode = 'rt', encoding = 'utf-8')
s = fin.read()
print(s)
fin.close()

昔人已乘黃鶴去，此地空餘黃鶴樓。
黃鶴一去不復返，白雲千載空悠悠。


**`readline()`: 從檔案中讀取一行**

In [13]:
fin = open('poem.txt', mode = 'rt', encoding = 'utf-8')
s = fin.readline()
print(s)
fin.close()

昔人已乘黃鶴去，此地空餘黃鶴樓。



**`readlines()`: 從檔案中讀取每一行資料，最後將每一行資料製作成串列**

In [22]:
fin = open('poem.txt', mode = 'rt', encoding = 'utf-8')
lines = fin.readlines()
print(lines)
print('=' * 40)

for line in lines:
    print(line)
fin.close()

['昔人已乘黃鶴去，此地空餘黃鶴樓。\n', '黃鶴一去不復返，白雲千載空悠悠。']
昔人已乘黃鶴去，此地空餘黃鶴樓。

黃鶴一去不復返，白雲千載空悠悠。


**`write(string)`: 將string寫入檔案**

In [23]:
s = 'I love Python! Writing Python is very fun!'
fout = open('my.txt', mode = 'wt')
fout.write(s)
fout.close() # 開啟my.txt會發現內容為 I love Python! Writing Python is very fun!

fin = open('my.txt', mode = 'rt', encoding = 'utf-8') # 檢查是否成功寫入
s = fin.read()
print(s)
fout.close()

I love Python! Writing Python is very fun!


**`print(*objects, sep = '', end = '\n', file = sys.stdout)`**: 函式`print`也可以寫入檔案
   - 使用file指定要寫入的檔案，就可使用函式print將*objects寫入檔案
   - `sep`用於設定每個資料間的間隔字元
   - `end`用於設定行與行之間的換行字元

In [24]:
s = 'I am Python, hello world!'
fout = open('my.txt', mode = 'at')
print(s, file = fout)
fout.close()

fin = open('my.txt', mode = 'rt', encoding = 'utf-8') # 檢查是否成功寫入
s = fin.read()
print(s)
fout.close()

I love Python! Writing Python is very fun!I am Python, hello world!



## 使用函式read讀取文字檔

**使用函式open開啟檔案，接著利用函式read一次讀取整個檔案，最後使用函式close關閉檔案**

In [25]:
fin = open('poem.txt', mode = 'rt', encoding = 'utf-8')
s = fin.read()
print(s)
fin.close()

昔人已乘黃鶴去，此地空餘黃鶴樓。
黃鶴一去不復返，白雲千載空悠悠。


## 使用for迴圈讀取純文字檔

**使用函式open開啟檔案，接著利用for迴圈一行一行讀取檔案，最後使用函式close關閉檔案**

In [26]:
fin = open('poem.txt', mode = 'rt', encoding = 'utf-8')
for line in fin:
    print(line.rstrip()) # 字串line先使用函式rstrip刪去最後一個換行字元(\n)，因為函式print每行會自動加上換行字元
                         # 若字串line不刪除最後的換行字元，則每行之間會多空一行
fin.close()

昔人已乘黃鶴去，此地空餘黃鶴樓。
黃鶴一去不復返，白雲千載空悠悠。


## 讀取指定資料夾下所有Python檔的程式

- **使用`glob.glob`找出指定資料夾下的所有Python檔，使用`with open as`開啟檔案，接著利用for迴圈一行一行讀取檔案內容，將每行程式顯示在螢幕上**
- **使用`with open as`開啟檔案會自動關閉檔案，不須再加上函式close關閉檔案**

In [33]:
import glob
python_files = glob.glob('C:\\test\\*.py')
for file_name in python_files:
    print(f'檔案為{file_name}')
    with open(file_name) as f:
        for line in f:
            print(line.rstrip())
    print()

檔案為C:\test\test1.py
print('Hello world !')

檔案為C:\test\test2.py
s = input('Please enter a string: ')
print(s)



## 將字串寫入檔案

**使用`with open as`開啟檔案進行寫入，接著利用函式print與函式write將字串寫入檔案**

In [34]:
s = '昔人已乘黃鶴去，此地空餘黃鶴樓。\
黃鶴一去不復返，白雲千載空悠悠。'

with open('poem.txt', mode = 'wt', encoding = 'utf-8') as fout:
    print(s, file = fout)
    fout.write(s)

# 開啟檔案poem.txt，會發現檔案中有兩行字串s的內容

## 將字串寫入檔案，使用`try`偵測錯誤

**使用`try except`偵測檔案開啟是否有錯誤，使用`with open as`開啟檔案進行寫入，接著將字串寫入檔案**

In [35]:
s = '昔人已乘黃鶴去，此地空餘黃鶴樓。\
黃鶴一去不復返，白雲千載空悠悠。'

try:
    with open('poem_try_except.txt', mode = 'wt', encoding = 'utf-8') as fout:
        fout.write(s)
except:
    print('無法寫入檔案')

## 拷貝檔案

**將檔案poem.txt內容拷貝到檔案poem2.txt**

In [36]:
fin = open('poem.txt', mode = 'rt', encoding = 'utf-8')
fout = open('poem2.txt', mode = 'wt', encoding = 'utf-8')
line = fin.readline()

while line:
    fout.write(line)
    line = fin.readline()
fin.close()
fout.close()

In [38]:
# 與上方有相同結果

with open('poem.txt', mode = 'rt', encoding = 'utf-8') as fin:
    line = fin.read()
with open('poem3.txt', mode = 'wt', encoding = 'utf-8') as fout:
    fout.write(line)

## 產生費式數列儲存到檔案

**產生費式數列前1000個元素儲存到檔案fib.txt**

In [1]:
def fib(num):
    if num == 1:
        return 1
    elif num == 2:
        return 1
    else:
        return fib(num - 1) + fib(num - 2)

with open('fib.txt', mode = 'wt', encoding = 'utf-8') as fout:
        for i in range(1, 11):
            result = fib(i)
            print(result, file = fout)

In [2]:
fout = open('textbook_fib.txt', mode = 'wt')
def fib(num):
    count = 1
    a = 1
    b = 1
    print(count, a, file = fout)
    while(count < num):
        a, b = b, a + b
        count += 1
        print(count, a, file = fout)

fib(10)
fout.close()

# 存取csv檔

**這一節要存取csv檔案內的每一行**
   - 首先要學會開啟檔案
   - 讀取檔案
   - 寫入檔案與關閉檔案
   - 以下介紹模組csv的重要函式

- `csv.writer(csvfile)`: 將csvfile所指定的檔案轉換成csv.writer物件

In [3]:
import csv
with open('99.csv', mode = 'wt', newline = '') as fout:
    writer = csv.writer(fout)
    
# 開啟檔案99.csv，允許寫入資料，並轉換成csv.writer物件

- `csv.reader(csvfile)`: 將csvfile所指定的檔案轉換成csv.reader物件

In [4]:
import csv
with open('99.csv', mode = 'rt') as fin:
    reader = csv.reader(fin)
    
# 開啟檔案99.csv，允許讀取資料，並轉換成csv.reader物件

- `writerows(rows)`: 將rows寫入csv檔

In [6]:
import csv
with open('test.csv', mode = 'wt', newline = '') as fout:
    writer = csv.writer(fout)
    writer.writerows([(1,2,3)])
    
# 開啟test.csv，查看內容是否為1, 2, 3

- `csv.DictReader(csvfile)`: 將csvfile所指定的檔案轉換成csv.DictReader物件

In [7]:
import csv
with open('test.csv', mode = 'wt', newline = '') as fout:
    writer = csv.writer(fout)
    writer.writerows([(1, 2, 3)])
with open('test.csv', mode = 'rt') as fin:
    reader = csv.DictReader(fin, fieldnames = ['a', 'b', 'c'])
    rows = [row for row in reader]
    print(rows)

[{'a': '1', 'b': '2', 'c': '3'}]


- `csv.DictWriter(csvfile)`: 將csvfile所指定的檔案轉換成csv.DictWriter物件
- `writeheader()`: 寫入csv檔的標題列

In [8]:
import csv
with open('test.csv', mode = 'wt', newline = '') as fout:
    writer = csv.writer(fout)
    writer.writerows([(1, 2, 3)])
with open('test.csv', mode = 'rt') as fin:
    reader = csv.DictReader(fin, fieldnames = ['a', 'b', 'c'])
    rows = [row for row in reader]
    print(rows)
    fout = open('test2.csv', mode = 'wt', newline = '')
    writer = csv.DictWriter(fout, fieldnames = ['a', 'b', 'c'])
    writer.writeheader()
    writer.writerows(rows)
    fout.close()
    
# 將檔案test.csv拷貝到檔案test2.csv，加上標題 a,b,c
# 開啟test2.csv會發現檔案內容為 a,b,c,
                              1,2,3

[{'a': '1', 'b': '2', 'c': '3'}]


## 使用模組`csv`對csv檔進行寫入與讀取

- **使用函式open開啟csv檔進行寫入資料，接著利用函式csv.writer產生寫入csv模組的writer物件，將九九乘法表的被乘數、乘數與積寫入到csv檔案**
- **使用函式open開啟csv檔案進行讀取資料，接著利用函式csv.reader產生讀取csv模組的reader物件**
- **使用串列生成式讀取csv檔的reader物件，顯示九九乘法表到螢幕上**

In [11]:
import csv

# 利用函式csv.writer產生寫入csv模組的writer物件，將九九乘法表的被乘數、乘數與積寫入到csv檔案
with open('99_multiply.csv', mode = 'wt', newline = '') as fout:
    writer = csv.writer(fout)
    for i in range(1, 10):
        for j in range(1, 10):
            writer.writerows([(str(i), str(j), str(i*j))])

# 利用函式csv.reader產生讀取csv模組的reader物件
with open('99_multiply.csv', mode = 'rt') as fin:
    reader = csv.reader(fin)
    rows = [row for row in reader] # 使用串列生成式讀取reader的每列資料到串列rows
    print(rows)

[['1', '1', '1'], ['1', '2', '2'], ['1', '3', '3'], ['1', '4', '4'], ['1', '5', '5'], ['1', '6', '6'], ['1', '7', '7'], ['1', '8', '8'], ['1', '9', '9'], ['2', '1', '2'], ['2', '2', '4'], ['2', '3', '6'], ['2', '4', '8'], ['2', '5', '10'], ['2', '6', '12'], ['2', '7', '14'], ['2', '8', '16'], ['2', '9', '18'], ['3', '1', '3'], ['3', '2', '6'], ['3', '3', '9'], ['3', '4', '12'], ['3', '5', '15'], ['3', '6', '18'], ['3', '7', '21'], ['3', '8', '24'], ['3', '9', '27'], ['4', '1', '4'], ['4', '2', '8'], ['4', '3', '12'], ['4', '4', '16'], ['4', '5', '20'], ['4', '6', '24'], ['4', '7', '28'], ['4', '8', '32'], ['4', '9', '36'], ['5', '1', '5'], ['5', '2', '10'], ['5', '3', '15'], ['5', '4', '20'], ['5', '5', '25'], ['5', '6', '30'], ['5', '7', '35'], ['5', '8', '40'], ['5', '9', '45'], ['6', '1', '6'], ['6', '2', '12'], ['6', '3', '18'], ['6', '4', '24'], ['6', '5', '30'], ['6', '6', '36'], ['6', '7', '42'], ['6', '8', '48'], ['6', '9', '54'], ['7', '1', '7'], ['7', '2', '14'], ['7', '3', '

## 使用模組`csv`寫入與讀取csv檔並加上標題

- **產生九九乘法表的csv檔，接著讀取此九九乘法表的csv檔**
- **利用函式csv.DictReader將九九乘法表加上標題「被乘數」、「乘數」與「積」，顯示增加標題的九九乘法表到螢幕上**
- **最後利用函式csv.DictWriter將九九乘法表寫入第二個csv檔，並加上標題「被乘數」、「乘數」與「積」**

In [12]:
import csv
with open('99_multiply.csv', mode = 'wt', newline = '') as fout:
    writer = csv.writer(fout)
    for i in range(1, 10):
        for j in range(1, 10):
            writer.writerows([(str(i), str(j), str(i*j))])

with open('99_multiply.csv', mode = 'rt') as fin:
    reader = csv.DictReader(fin, fieldnames = ['被乘數', '乘數', '積'])
    rows = [row for row in reader]
    print(rows)
    fout = open('99_multiply_add_topic.csv', mode = 'wt', newline = '', encoding = 'utf-8')
    writer = csv.DictWriter(fout, fieldnames = ['被乘數', '乘數', '積'])
    writer.writeheader()
    writer.writerows(rows)
    fout.close()

[{'被乘數': '1', '乘數': '1', '積': '1'}, {'被乘數': '1', '乘數': '2', '積': '2'}, {'被乘數': '1', '乘數': '3', '積': '3'}, {'被乘數': '1', '乘數': '4', '積': '4'}, {'被乘數': '1', '乘數': '5', '積': '5'}, {'被乘數': '1', '乘數': '6', '積': '6'}, {'被乘數': '1', '乘數': '7', '積': '7'}, {'被乘數': '1', '乘數': '8', '積': '8'}, {'被乘數': '1', '乘數': '9', '積': '9'}, {'被乘數': '2', '乘數': '1', '積': '2'}, {'被乘數': '2', '乘數': '2', '積': '4'}, {'被乘數': '2', '乘數': '3', '積': '6'}, {'被乘數': '2', '乘數': '4', '積': '8'}, {'被乘數': '2', '乘數': '5', '積': '10'}, {'被乘數': '2', '乘數': '6', '積': '12'}, {'被乘數': '2', '乘數': '7', '積': '14'}, {'被乘數': '2', '乘數': '8', '積': '16'}, {'被乘數': '2', '乘數': '9', '積': '18'}, {'被乘數': '3', '乘數': '1', '積': '3'}, {'被乘數': '3', '乘數': '2', '積': '6'}, {'被乘數': '3', '乘數': '3', '積': '9'}, {'被乘數': '3', '乘數': '4', '積': '12'}, {'被乘數': '3', '乘數': '5', '積': '15'}, {'被乘數': '3', '乘數': '6', '積': '18'}, {'被乘數': '3', '乘數': '7', '積': '21'}, {'被乘數': '3', '乘數': '8', '積': '24'}, {'被乘數': '3', '乘數': '9', '積': '27'}, {'被乘數': '4', '乘數': '1', '積': '4'}, {'被乘數': 

# 存取二進位檔

**這一節要存取二進位檔案**
   - 首先要學會開啟檔案
   - 讀取檔案
   - 寫入檔案與關閉檔案
   - 以下介紹產生二進位資料的重要函式

- **`bytes`**: 不可變的二進位字串
- **`bytearray`**: 可以修改的二進位字串

In [13]:
mbytes = bytes(range(0, 8))
print(mbytes)

b'\x00\x01\x02\x03\x04\x05\x06\x07'


In [14]:
mbytearray = bytearray(range(0, 8))
print(mbytearray)

bytearray(b'\x00\x01\x02\x03\x04\x05\x06\x07')


## 產生二進位資料

**使用函式`bytes`與`bytearray`產生二進位資料**

In [18]:
mbytes = bytes(range(0, 32))
print(mbytes)
print('=' * 120)

mbytearray = bytearray(range(0, 32))
print(mbytearray)

b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f'
bytearray(b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f')


## 存取二進位檔案

**使用函式`write`與函式`read`存取二進位檔案**

In [19]:
bindata = bytes(range(0, 32))
with open('binfile', mode = 'wb') as fout:
    fout.write(bindata)
with open('binfile', mode = 'rb') as fin:
    binary = fin.read()
    print(binary)

b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f'


## 使用模組`pickle`將物件轉換成二進位檔案

**函式`load`將二進位檔案還原成物件**

In [22]:
import pickle
myList = [a for a in range(1, 10)]
with open('test.pickle', mode = 'wb') as fout:
    pickle.dump(myList, fout) # 使用函式pickle.dump將物件myList寫入檔案fout
    
with open('test.pickle', mode = 'rb') as fin:
    p = pickle.load(fin) # 使用函式pickle.load將二進位檔案fin還原成物件p
    print(p)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


# 習題

## 找出大於100MB的檔案

**找出指定資料夾中大於100MB的檔案**

In [3]:
import os
path = 'C:\\'
bigfiles = []
for root, dirs, files in os.walk(path):
    for file in files:
        if os.path.getsize(os.path.join(root, file)) > 100000000:
            bigfiles.append(os.path.join(root, file))
for file in bigfiles:
    print(file)

C:\hiberfil.sys
C:\pagefile.sys
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$ROEI9TD\AndroidTools_Xamarin.1265E87BF2A7C8F279D5\commandlinetools-win-8512546_latest.zip
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$ROEI9TD\Microsoft.Android.Sdk.net7.33.0.4.3B4EE3A4D49EAA497E95\Microsoft.Android.Sdk.Windows.33.0.4-x64.msi
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$ROEI9TD\Microsoft.ML.ModelBuilder.6ED20329037E3ABB2DC3\Microsoft.ML.ModelBuilder.vsix
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$ROEI9TD\Microsoft.NetCore.Toolset.7.0.102.7EE8A1647D6A345354D6\dotnet-sdk-internal-7.0.102-win-x64.msi
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$ROEI9TD\Microsoft.VisualStudio.AspNetPackages.Msi.9D50F69D31709CE7B615\AspNetWebToolsPackagesVS17_ENU.msi
C:\$Recycle.Bin\S-1-5-21-3935977965-1637398792-515658474-1001\$ROEI9TD\Microsoft.VisualStudio.IntelliCode.30D752E02BB86D206F7C\Microsoft.VisualStudio.IntelliCod

## 計算文字的出現次數

**開啟本章範例檔案`poem_try_except.txt`，內容使用唐詩「黃鶴樓」，作者為「崔顥」，找出這首詩的文字與文字的出現次數，依照出現次數由大到小排列，將結果顯示到螢幕上，並寫到檔案`ex2-poem.txt`**

In [9]:
import re
with open('poem_try_except.txt', mode = 'rt', encoding = 'utf-8') as fin:
    s = fin.read()
    s = re.findall('\w', s) # \w: 匹配一個英文、數字或底線字元，也可以匹配一個中文字元
    print(s)
    print('=' * 120)
    
    wc = [(w, s.count(w)) for w in set(s)]
    print(wc)
    print('=' * 120)
    
    swc = sorted(wc, key = lambda x: x[1], reverse = True)
    print(swc)
    
with open('ex2-poem.txt', mode = 'wt', encoding = 'utf-8') as fout:
    for w, c in swc:
        print(w, c, file = fout)

['昔', '人', '已', '乘', '黃', '鶴', '去', '此', '地', '空', '餘', '黃', '鶴', '樓', '黃', '鶴', '一', '去', '不', '復', '返', '白', '雲', '千', '載', '空', '悠', '悠']
[('空', 2), ('地', 1), ('載', 1), ('此', 1), ('雲', 1), ('人', 1), ('餘', 1), ('乘', 1), ('鶴', 3), ('白', 1), ('不', 1), ('去', 2), ('一', 1), ('返', 1), ('千', 1), ('黃', 3), ('已', 1), ('悠', 2), ('樓', 1), ('昔', 1), ('復', 1)]
[('鶴', 3), ('黃', 3), ('空', 2), ('去', 2), ('悠', 2), ('地', 1), ('載', 1), ('此', 1), ('雲', 1), ('人', 1), ('餘', 1), ('乘', 1), ('白', 1), ('不', 1), ('一', 1), ('返', 1), ('千', 1), ('已', 1), ('樓', 1), ('昔', 1), ('復', 1)]


## 計算文字的出現次數到並儲存到csv檔

**開啟本章範例檔案`poem_try_except.txt`，內容使用唐詩「黃鶴樓」，作者為「崔顥」，找出這首詩的文字與文字的出現次數，依照出現次數由大到小排列，將結果顯示到螢幕上，並寫到檔案`ex3-poem.csv`**

In [13]:
import re
import csv
with open('poem_try_except.txt', mode = 'rt', encoding = 'utf-8') as fin:
    s = fin.read()
    s = re.findall('\w', s)
    wc = [(w, s.count(w)) for w in set(s)]
    swc = sorted(wc, key = lambda x: x[1], reverse = True)
    print(swc)
    with open('ex3-poem.csv', mode = 'wt', newline = '') as fout:
        writer = csv.writer(fout)
        for w, c in swc:
            writer.writerows([str(w), str(c)])

[('鶴', 3), ('黃', 3), ('空', 2), ('去', 2), ('悠', 2), ('地', 1), ('載', 1), ('此', 1), ('雲', 1), ('人', 1), ('餘', 1), ('乘', 1), ('白', 1), ('不', 1), ('一', 1), ('返', 1), ('千', 1), ('已', 1), ('樓', 1), ('昔', 1), ('復', 1)]
