### 檔案系統

檔案是電腦儲存資料的容器，檔案處理是作業系統核心功能之一。電腦的檔案呈現樹狀結構，有目錄所組成，每層目錄又由檔案組成，第一層目錄成為根目錄。例如以下的檔案結構：

<pre>
D:\ ---- address
     |-- friends
     |-- homework ---- hw1 - solution.docx
     |-- test      |-- hw2
                   |-- hw3
</pre>

`solution.docx`為一word檔案，內容為作業1的解答，該檔案在作業1的目錄，作業1為homework目錄的子目錄，homework目錄包含hw1、hw2、及hw3等三個子目錄，homework在跟目錄下，根目錄為`D:\`。`solution.docx`檔案的絕對路徑為`D:\homework\hw2\solution.docx`。`solution.docx`所在的目錄可以用「.」表示，其上層目錄可以用「..」表示。檔案及目錄都可以設定權限，以限制存取。

### os模組

Pythonos模組提供目錄與檔案的處理。

| 函式名稱 | 說明                         |
|:----------|:-----------:                 |
|os.system() | 執行os指令                |
|os.getcwd() | 目前目錄                  |
|os.listdir(path) | 目錄下檔案列表        |
|os.mkdir(path) | 建立新目錄夾            |
|os.remove(path) | 刪除檔案              |
|os.rename(src, dest) | 更改檔案或目錄名稱 |
|os.rmdir(path) | 刪除檔案路徑            |

In [2]:
import os
import shutil

In [4]:
os.listdir() #目前目錄下檔案

['.git',
 '.ipynb_checkpoints',
 '01-PythonOverview.ipynb',
 '02-DataTypes.ipynb',
 '03-variableNexpression.ipynb',
 '04-ProgramStructure.ipynb',
 '05-DataStructure1.ipynb',
 '06-functions.ipynb',
 '07-DataStructure2.ipynb',
 '8-file handling.ipynb',
 'hw2.ipynb',
 'pic',
 'python101.ipynb',
 'README.md',
 'test_dir',
 'Untitled.ipynb']

In [3]:
os.mkdir("test_dir") #建立新目錄

In [3]:
for files in os.listdir():
    if files.endswith(".md"): #針對markdown檔案
        shutil.copy(files, "./test_dir") #拷貝檔案至./test_dir目錄

In [4]:
os.listdir("test_dir")

['README.md', 'test.txt']

In [6]:
os.path.isdir("test_dir") #檢查test_dir是否為目錄？

True

In [8]:
os.chdir("test_dir/") #改變目錄位置

In [10]:
os.getcwd() #讀取路徑

'/Users/jc7qx/pybook/test_dir'

In [12]:
!touch test.txt

In [13]:
os.listdir()

['test.txt']

### python的檔案處理程序
* 開啟檔案
* 讀/寫檔案 
* 關閉檔案

內建函式`open()`用來開啟一個檔案，若開啟檔案不存在，產生「無此檔案或目錄」錯誤。

In [15]:
f = open("test.txt") #f is a handle

In [39]:
f = open("readme.txt") #開啟檔案不存在，產生 FileNotFoundError: [Errno 2] No such file or directory: 'readme.txt'

FileNotFoundError: [Errno 2] No such file or directory: 'readme.txt'

%%html
<style>
  table {margin-left: 0 !important;}
</style>

開啟檔案時可以指定開啟模式，如「r」代表讀取檔案，「w」代表寫入檔案，...。詳細的檔案模式如下表：

模式 | 說明
:-:|:-:
 r  | 開啟檔案讀取資料
 w  | 開啟檔案寫入資料，若檔案存在，發生失敗
 a  | 開啟檔案附加資料，若檔案不存在，建立新檔案
 t  | 開啟文字模式
 b  | 開啟二位元模式
 +  | 開啟檔案更新模式

fp = open("test.txt", 'w') # "w": file mode

In [None]:
fp = open("img.jpeg", 'r+b') #read and write in binary mode

開啟檔案時可指定其內容編碼，windows: cp1252, Linux: utf-8

In [18]:
fp1 = open("test.txt", "r", encoding='utf-8')

開啟檔案處理完成後，必須將檔案關閉，使檔案資源可以歸還給系統。

In [20]:
fp1.close() #close the file test.txt

可以利用`try: ... finally:`結構

In [21]:
try:
    fp1 = open("test.txt", encoding='utf-8')
finally:
    fp1.close()

`with`結構可用來處理檔案，並可自動關閉檔案

In [None]:
with open("test.txt", "w", encoding="utf-8") as fp1:
    fp1.write("my first file\n")
    fp1.write("This is the line\n")
    fp1.write("contains three lines\n")

### 檔案操作

In [24]:
f = open("test.txt", 'r', encoding='utf-8')
f.read(4) #read(size)

'my f'

In [25]:
f.read(4)

'irst'

In [26]:
f.read()

' file\nThis is the line\ncontains three lines\n'

In [27]:
f.read()

''

In [28]:
f.tell() #回傳檔案游標位置

52

In [29]:
f.seek(0) #改變檔案游標位置

0

In [30]:
f.tell()

0

In [31]:
print(f.read())

my first file
This is the line
contains three lines



讀取檔案中行列

In [34]:
f.seek(0)
for line in f:
    print(line, end=" ")

my first file
 This is the line
 contains three lines
 

In [36]:
f.seek(0)
f.readline()

'my first file\n'

In [None]:
f.readline() #讀取一行

In [38]:
f.seek(0)
f.readlines() #將檔案每一行存到一個list中

['my first file\n', 'This is the line\n', 'contains three lines\n']

### 讀取 csv 檔

CSV(Comma Separated Values)代表一個以逗點分隔資料的檔案，這種檔案廣泛用於儲存表格式、以行為主的資料。Python的csv模組可以讀取與寫入CSV表格式的資料檔案。例如，以下資料表

學號 | 姓名 | 手機 | 年齡
----|-----|------|-----------------
107143001 | 王大明 | 0912123432 | 18
107143022 | 胡曉君 | 0930982345 | 17
107143099 | 陳大同 | 0911982670 | 18
106143002 | 李小明 | 0933651285 | 19


In [12]:
import csv

with open("student.csv") as csvf:
    next(csvf, None)
    csv_reader = csv.reader(csvf, delimiter=',')
    for row in csv_reader:
        print(row[0], row[1], row[2], row[3])

107143001  王大明  0912123432  18
107143022  胡曉君  0930982345  17
107143099  陳大同  0911982670  18
106143002  李小明  0933651285  19 
