# 資料來源與檔案存取

* 資料來源與取得
* 開放資料
* 資料儲存格式
* Python 存取檔案

## 作業目標

* 1.（簡答題）檔案、API、爬蟲三種取得資料方式有什麼不同？
* 2.（實作）完成一個程式，需滿足下列需求：
    * 下載指定檔案到 Data 資料夾，存成檔名 Homework.txt
    * 檢查 Data 資料夾是否有 Homework.txt 檔名之檔案
    * 將「Hello World」字串覆寫到 Homework.txt 檔案
    * 檢查 Homework.txt 檔案字數是否符合 Hello World 字數


### 1.（簡答題）檔案、API、爬蟲三種取得資料方式有什麼不同？
|  取得資料方式  | 有接口  | 可選取要下載的部分 |
|  ----  | ----  |----  |
| 檔案  | 有，下載連結 | 無，資料被包成檔案 |
| API  | 有，程式化檔案接口 | 依照API文件 |
| 爬蟲 | 無，需使用爬蟲程式 | 可 |

### 2.（實作）完成一個程式，需滿足下列需求：
    * 下載指定檔案到 Data 資料夾，存成檔名 Homework.txt
    * 檢查 Data 資料夾是否有 Homework.txt 檔名之檔案
    * 將「Hello World」字串覆寫到 Homework.txt 檔案
    * 檢查 Homework.txt 檔案字數是否符合 Hello World 字數


In [29]:
# 根據需求引入正確的 Library
from urllib.request import urlretrieve, urlopen
import os, sys
from io import BytesIO
from zipfile import ZipFile
import shutil 
from pathlib import Path 

In [28]:
# 下載檔案到 Data 資料夾，存成檔名 Homework.txt

url = 'http://pycrawler.cupoy.com/file-download/part01/example.zip'
file_path = './Data'

with urlopen(url) as zipresp:
    with ZipFile(BytesIO(zipresp.read())) as zfile:
        zfile.extractall(file_path)
        print(zfile.namelist())
        
filenames =['./Data/example1.txt', './Data/example2.txt']
try:
    with open('./Data/Homework.txt', "w") as outfile: 
        for fname in filenames: 
            with open(fname) as infile:
                outfile.write(infile.readline())
except:
    print('發生錯誤！')

['example1.txt', '__MACOSX/._example1.txt', 'example2.txt', '__MACOSX/._example2.txt']


In [30]:
# 檢查 Data 資料夾是否有 Homework.txt 檔名之檔案

files = []
dirs = os.listdir( './Data')
for file in dirs:
    files.append(file)

if 'Homework.txt' in files:
    print('[O] 檢查 Data 資料夾是否有 Homework.txt 檔名之檔案')
else:
    print('[X] 檢查 Data 資料夾是否有 Homework.txt 檔名之檔案')

[O] 檢查 Data 資料夾是否有 Homework.txt 檔名之檔案


In [42]:
# 將「Hello World」字串覆寫到 Homework.txt 檔案

with open("./Data/Homework.txt", "w") as fh:
    fh.write('Hello World')

try:
    with open("./Data/Homework.txt", "r") as fh:
        fh.read()
except EnvironmentError: # parent of IOError, OSError *and* WindowsError where available
    pass    

In [44]:
# 檢查 Homework.txt 檔案字數是否符合 Hello World 字數
with open('./Data/Homework.txt', 'r') as f:
    data = f.readline()
    if len('Hello World') == len(data):
        print('[O] 檢查 Homework.txt 檔案字數是否符合 Hello World 字數')
    else:
        print('[X] 檢查 Homework.txt 檔案字數是否符合 Hello World 字數')

[O] 檢查 Homework.txt 檔案字數是否符合 Hello World 字數
