Skip to content
Danny Lin edited this page May 16, 2021 · 18 revisions

WebScrapBook 與 ScrapBook X 的差異

以下簡介 WebScrapBook (0.87.0) 及前作 ScrapBook X (1.14.7) 的主要功能差異。

功能改良

  • 跨平台支援
    • 除 Firefox 桌面版以外,亦支援 Chromium 系瀏覽器及行動瀏覽器(Firefox for Android、Kiwi browser、Yandex browser 等)。
    • 編輯器加入的註記在多數瀏覽器,包括行動瀏覽器及未安裝網頁剪貼簿的瀏覽器,皆可正常瀏覽。
    • 瀏覽器不須特殊設定即可在本機使用靜態網頁的全文檢索功能。
  • 遠端存取支援
    • 後端伺服器經適當設定後,可從多部機器遠端存取剪貼簿。
  • 更多客製化擷取功能
    • 圖片、多媒體、樣式表等元素支援連結、移除、儲存使用、儲存現用等更多種擷取方式。
    • 支援對樣式表圖片、最愛圖示、畫布、EMBED、OBJECT 元素、及影子物件等的擷取設定。
    • 支援用擷取助手預先處理擷取頁面,或客製針對特定網站的擷取方式。
  • 強化批次擷取
    • 可選取多個分頁或多個超連結批次擷取。
    • 批次擷取管理員可對所有或個別擷取工作自訂擷取模式或選項。
  • 更靈活的儲存格式及架構
    • 擷取網頁的 ID 改為基於 UTC 時間,不同時區的擷取資料可彼此合併而不致衝突。
    • 擷取的網頁可儲存為不同形式的檔名,例如日期時間、網頁標題、來源網域、UUID,也能儲存到子資料夾。
    • 網頁除了儲存為資料夾,還可以儲存為 ZIP 壓縮格式(HTZ、MAFF)或單一 HTML 檔案。
  • 更靈活的剪貼簿
    • 剪貼簿目錄樹中任意類型的項目皆可存放子項目。
    • 剪貼簿目錄樹中的項目可歸至多個項目之下。
    • 從剪貼簿刪除的項目會放到回收筒,可在需要時還原,保障資料安全。
    • 支援更多對多個選取項目的操作,如開啟頁面、開啟原始網址、在檔案管理員檢視、搜尋下層項目、排序、重新擷取。
    • 支援跨剪貼簿的項目定位、全文搜尋、已擷取網頁提示及尋找。
  • 強化全文索引
    • 全文搜尋快取搭配後端伺服器處理,檢索速度大幅提升。
    • 擷取及編輯頁面時會自動更新全文索引。

限制

  • 相較於 ScrapBook X 使用的 XUL/XPCOM 框架,WebScrapBook 使用的 WebExtension 瀏覽器擴充框架限制較多,有些功能瀏覽器不支援,必須依賴後端伺服器輔助,因而效能較差,例如組織及管理剪貼簿。(由於現代瀏覽器效能多有提升,未必能感受到明顯差異)

  • 以下功能理論上可實做,但目前仍有大量困難的技術問題需要解決,短期內不考慮實行:

    • 互動式的深層擷取
    • 合併精靈

相容性

ScrapBook X 與 WebScrapBook 資料結構不同,無法直接使用,可用 PyWebScrapBook 提供的雙向轉換工具自動轉換。

安裝 Python 和 PyWebScrapBook,然後在命令列執行以下命令,即可將 ScrapBook X 或 ScrapBook 建立的剪貼簿轉換為 WebScrapBook 支援的格式:

wsb convert sb2wsb /path/to/scrapbook /path/to/webscrapbook

先前用其他方式由 ScrapBook X 轉為 WebScrapBook 可能不夠完全,可用以下指令進一步轉換:

wsb convert migrate /path/to/webscrapbook [/path/to/output]

此工具可省略輸出路徑做原地轉換,但為防止出錯,建議輸出至另一路徑,或用其他版本控制工具管理。

也可以反過來把網頁剪貼簿資料轉回 ScrapBook X 規格:

wsb convert wsb2sb /path/to/webscrapbook /path/to/scrapbook

由於 WebScrapBook 資料結構較靈活,ScrapBook X 轉 WebScrapBook 不會損失資訊,後者轉前者則可能損失部分資訊,例如:

  • 歸屬於多個項目的項目(只會保留第一次出現位置)
  • 回收筒中的項目
  • 檔案儲存路徑會改變,因此剪貼簿項目之間的交互連結可能不再有效

此外,轉換工具的相容性檢驗是以 ScrapBook X 為準,由 WebScrapBook 轉換為 ScrapBook X 的剪貼簿若使用於其他版本的舊版 ScrapBook,可能會有一些相容性問題,例如:

  • 筆記:舊版 ScrapBook 對特殊字元(如 <&>)的處理方式不一致,ScrapBook X 則統一只接受純文字格式。
  • 筆記頁面
  • 非屬資料夾型態的容器項目
  • 檔名含有中文或某些特殊字元的檔案