### **讀寫檔案**

本章要介紹python在硬碟上的建立、讀取和儲存檔案

#### **匯入os模組**

讀取檔案需要與作業系統進行互動，因此會應用到os模組

python--os模組：https://docs.python.org/zh-tw/3/library/os.html#module-os

In [1]:
import os
#os模組有許多大量的應用函數，可透過dir以及help來查看

#dir(os)

#help(os)

#### **關於檔案與路徑**

檔案有著兩個關鍵的性質：「檔名」和「路徑」。其中路徑顯示了檔案在電腦中的位置。例如：我的電腦中有一份「2330.csv」，路徑為「C:\Users\c6610」，其中Users、c66101都是我的資料夾(目錄)

而像是下圖，某台Windows電腦中的檔案目錄很可能會長這樣。

<img src=https://s3.ap-northeast-1.wasabisys.com/img.tw511.com/202008/20200811135725465iibrhfp0zen.png>

**補充：Windows的反斜線與 OS和Linux上的斜線**

在Windows上，路徑是採用反斜線(\)作為分隔，但在OS和Linux系統上則是採用斜線(/)做為分隔符號，因此要讓程式能在各系統上運作就要處理這種情況。而我們這次要用的os模組大多數都有辦法處理這種問題。

os模組可以用一個簡單的函式處理這種問題：「os.path.join()」，會將輸入進去的字串回傳出路徑(字串型態)」

**編寫路徑**

In [2]:
#import os #前面已經匯入過了
os.path.join('users','new_Folder','spam')

#只所以會是兩個斜線，是因為每個反斜線都要用一個反斜線來轉譯

'users\\new_Folder\\spam'

如果是在OS系統和Linux系統運作，則會回傳「users/new_Folder/spam」

假設我們要閱覽多份文件，這種方式可以確保我們路徑正確

In [3]:
myFiles=['檔案1.txt','檔案2.csv','檔案3.docx'] #假設我們有這三份檔案

for filename in myFiles:
    print(os.path.join('C:\\Users\\new_Folder',filename))
    #透過os.path可以確保路徑正確
    #print是直接顯示出來，不需要用兩個反斜線

C:\Users\new_Folder\檔案1.txt
C:\Users\new_Folder\檔案2.csv
C:\Users\new_Folder\檔案3.docx


**目前的工作目錄**

每個電腦的程式都會有所謂的「當前工作目錄(current working directory，簡稱cwd或cd)」

我們可以透過「os.getcwd()」來得到當前的目錄，並且採用「os.chdir()」來切換變更。

要注意os.chdir()要有符合的對應位置，否則會報錯

In [4]:
os.getcwd() #取得當前工作目錄位置

'C:\\Users\\c6610'

In [5]:
os.chdir("C:\\Users\\c6610\\新下載位置\\IMG") 
#更改至輸入字串的位置 
#可以自己新增資料夾來測試。

os.getcwd() #檢查是否更改

'C:\\Users\\c6610\\新下載位置\\IMG'

#### **絕對路徑與相對路徑**

主要有兩種指定檔案路徑的方式

1. 絕對路徑：從根目錄開始

2. 相對路徑：相對於程式的目前工作目錄

<img src=https://s3.ap-northeast-1.wasabisys.com/img.tw511.com/202008/20200811135725465iibrhfp0zen.png>

In [6]:
os.chdir('C:\\測試OS模組') 
os.getcwd()

'C:\\測試OS模組'

**改路徑的方式：絕對路徑**

In [7]:
os.chdir('C:\\測試OS模組\\檔案包2') #從根目錄(電腦C槽)完整寫到目標位置
os.getcwd()

'C:\\測試OS模組\\檔案包2'

**改路徑的方式：相對路徑**

In [8]:
os.chdir('.\\') #相對路徑的方式，從原本的目標位置開始寫

# 「.\\」：當前工作位置  

#前面額外追加一個「.」：「回到上一個資料夾」

# 「\\」：回到根目錄

os.getcwd() #回到上上個資料夾

'C:\\測試OS模組\\檔案包2'

In [9]:
os.chdir('..\\檔案包1')  
#從原本的「檔案包2」資料夾，回到上一個資料夾，指定前往另一個資料夾「檔案包1」

os.getcwd() 

'C:\\測試OS模組\\檔案包1'

#### **處理絕對路徑和相對路徑**

我們可以透過os.path模組，依據需求將轉換成絕對路徑或相對路徑

**絕對路徑**

os.path.abspath(path)

In [10]:
os.path.abspath('.\\')  #一個點是當前資料夾

#將相對路徑改成決對路徑

'C:\\測試OS模組\\檔案包1'

In [11]:
os.path.abspath('..\\') #兩個點代表回到上上個資料夾

'C:\\測試OS模組'

In [12]:
os.path.abspath('..\\檔案2.txt\\檔案3.csv\\檔案4.docx')

#要注意的是，os.path大多數只負責轉譯路徑，不符合格式也會轉譯

'C:\\測試OS模組\\檔案2.txt\\檔案3.csv\\檔案4.docx'

**檢查絕對路徑**

os.path.isabs(path)

In [13]:
os.path.isabs('.\\') #輸入相對路徑 False

False

In [14]:
os.path.isabs('C:\\測試OS模組\\檔案2\\檔案3\\檔案4') 
#輸入絕對路徑 True  (只會檢查字串，不會檢查是否真的存在於電腦)

True

**轉換成相對路徑**

os.path.relpath(path,start)

要如何從「start」轉到「path」的相對路徑

「start」不輸入的情況下，默認將現在的絕對路徑轉換成鄉對路徑

In [15]:
os.path.relpath('C:\\測試OS模組\\檔案包2','C:\\測試OS模組\\檔案包1')
#如何從

'..\\檔案包2'

**建立新的資料夾**



os.mkdirs(path)

在提供的path路徑上，若不存在該資料夾(目錄)，則會直接新建

In [16]:
try:
    os.makedirs('C:\\測試OS模組\\檔案包2\\檔案包new\\檔案dir')
    #在檔案二
except:
    print('資料夾已存在')

#如果檔案已經存在則會報錯

資料夾已存在


**檢查檔案是否存在**

os.path.isfile(path)

In [17]:
os.getcwd()

'C:\\測試OS模組\\檔案包1'

In [18]:
os.path.isfile('檔案3.txt')

True

In [19]:
os.chdir('C:\\測試OS模組')

In [20]:
os.getcwd()

'C:\\測試OS模組'

In [21]:
os.path.isfile('檔案包1\\檔案3.txt')

True

In [22]:
os.chdir('C:\\測試OS模組\\檔案包1')
os.getcwd()

'C:\\測試OS模組\\檔案包1'

In [23]:
os.path.isfile('..\\檔案1.txt') #相對路徑找其他檔案

True

**檢查資料夾內容**

os.listdir()

In [24]:
print(os.getcwd())
#檔案包1裡面只有一個「檔案3.txt」
os.listdir() 

C:\測試OS模組\檔案包1


['檔案3.txt']

In [25]:
os.chdir('..\\')
os.listdir()

['DNDicon.ico', '檔案1.txt', '檔案2.txt', '檔案包1', '檔案包2']

In [26]:
for i in os.listdir():
    print(i)

DNDicon.ico
檔案1.txt
檔案2.txt
檔案包1
檔案包2


#### **檢查檔案大小**

os.path.getsize(path)

In [27]:
os.getcwd()

'C:\\測試OS模組'

In [28]:
os.path.getsize('DNDicon.ico') #回傳占用的位元組大小

67646

在常見的應用方法是檢查檔案是否存在

In [29]:
import os
print(os.getcwd()) #顯示當前的檔案位置


file = "檔案1.txt"  
print(os.path.isfile(file)) #檢查該路境內的檔案是否存在


if os.path.isfile(file):
    print("檔案已存在。") #已存在，跳過目前檔案讀寫，準備抓取下一份檔案
    #跳過目前的檔案讀寫
else:
    print("檔案不存在。")
    #檔案不存在狀況下，繼續原本的複寫圖案動作

C:\測試OS模組
True
檔案已存在。
