Skip to content
No description, website, or topics provided.
Ruby
Branch: master
Clone or download
Pull request Compare This branch is 7 commits ahead, 1 commit behind ddbc:master.
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
J add X 卍續藏, J 嘉興藏 Feb 22, 2019
T Merge remote-tracking branch 'upstream/master' Aug 12, 2019
X add X 卍續藏, J 嘉興藏 Feb 22, 2019
bin
.gitignore 新增 T33..T85 Feb 2, 2016
README.md Update README.md Feb 22, 2019

README.md

CBETA_TAFxml

以「量化語言統計」為目的之簡化版漢文佛典 XML,由 CBETA XML P5 (https://github.com/cbeta-org/xml-p5.git) 經程式轉出。

專案主持人:洪振洲
轉換程式撰寫:周邦信
法鼓佛教學院

資料更新紀錄:

  • 2019.02.22 以當時最新 CBETA XMP P5,進行本資料集更新,並新增CBETA收錄之卍續藏(X)與嘉興藏(J)資料。

XML 資料格式簡介

標記 意義 使用規範
<ab> 用來紀錄文獻內的文字內容。
對映至原文獻之<p>(純散文)、
<lg>(韻文、偈頌) <p type="dharani">(咒語)。
對於卷的結構,僅改用
<ab type=”juan”>表示卷起始、結束之資訊
<ab type="prose"> 散文 </ab>(原<p>)
<ab type="verse"> 韻文</ab> (偈頌, 原 <lg>)
<ab type="dharani"> 咒語</ab>
(原<p type="dharani">)
<ab type="juan">佛說長阿含經卷第十七</ab>
(表示卷 起始、結束之資訊)
<body> TEI 文件內容容器 與原有CBETA XML、TEI P5 規範使用方式相同
<byline> 用保留譯者資訊 <byline>長安釋僧肇述</byline>
<div> 用以表示文獻結構,以type與level 屬性表示文件所屬型態與階層 <div type="fen" level="2"> 第二層div 結構,分</div>
<div type="pin " level="3"> 第三層div 結構,品</div>
<head> 置於各div 元素之下,紀錄各層次文字區塊之標題。 <head>(一)第一分初大本經第一</head>
<lb> 用以紀錄大正藏的行號資訊,以便作為原始資料之對應。 <lb n="0114b06" ed="T"/>
You can’t perform that action at this time.