Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

新增轉換:驒→騨 #694

Merged
merged 2 commits into from
Jun 13, 2022
Merged

新增轉換:驒→騨 #694

merged 2 commits into from
Jun 13, 2022

Conversation

SteveLz
Copy link
Contributor

@SteveLz SteveLz commented Jun 9, 2022

No description provided.

@ayaka14732 ayaka14732 merged commit 7bcef1c into BYVoid:master Jun 13, 2022
@danny0838
Copy link
Contributor

最近轉換方針似乎有改變?

按過去的討論,t2jp 應該是轉換為符合日本標準字體規範的用字。日本標準字體規範主要有《常用漢字表》、《人名用漢字表》、《表外漢字字體表》。

「騨」是所謂的「擴張新字體」(基於《常用漢字表》的類推簡化)。由於「驒」已經是《表外漢字字體表》定義的日本標準字體,轉成「騨」反而不符合日本標準,按理是不應轉換的。 #685, #686, #687, #688 也有同樣問題。

我之前在 #494 也有提到加入 t2jpx,以應付不同的需求:

  • t2jp: 轉換為最符合日本標準字體規範的用字 (JPVariants.txt)
    • 若某字未收錄於日本標準,則不做轉換。
  • t2jpx: 在符合日本標準字體規範的前提下盡可能使用最簡字體,字典檔是 JPVariants.txt + JPVariantsEx.txt,具體來說:
    • 若某字已收錄於日本標準,而日本標準有定義簡慣字體,則輸出簡慣字體。例如 啞=>唖
    • 若某字已收錄於日本標準,而日本標準未定義簡慣字體,則輸出標準字體、擴張新字體。例如本例 驒=>驒 騨
    • 若某字未收錄於日本標準,則輸出擴張新字體。例如 踁=>𨀃

不過一直未被採納。

ayaka14732 added a commit that referenced this pull request Jun 13, 2022
ayaka14732 added a commit that referenced this pull request Jun 13, 2022
@ayaka14732
Copy link
Collaborator

revert 了,準備儘快解決 t2jpx

@BYVoid
Copy link
Owner

BYVoid commented Aug 14, 2022

是否有日本擴張新字體的列表?

@MrCorn0-0
Copy link

@BYVoid
日本擴張新字體列表在這裡有找到,請參考:http://t2publisher.xrea.jp/forme/kakushin_seiji_ver2.pdf
左邊是擴張字體,右邊是標準字體。

我也期待增加t2jpx的支援。補充説明下 @danny0838 的説法,簡易慣用字和擴張新字體的產生是日本簡化字流程中出現的問題。

根據 常用漢字表の字体・字形に関する指針(報告)について(2016年)

  • 1978年日本漢字編碼JIS code制定。

  • 1981年『常用漢字表』公示。記載了簡化的字體。但是關於『常用漢字表』之外的漢字是否參照此表擴展沒作做結論。

  • 1983年JIS Code改訂。略字主義,表外漢字的字體採用了擴展的簡化體(組成部分根據『常用漢字表』而簡化),此為「拡張新字体」。

  • 2000年關於「表外漢字字体表」的答覆會上決定了包括表外漢字的標準字體「印刷標準字体」,裡面只承認了少數可以替用印刷標準字體的簡化字「簡易慣用字体」。第22期国語審議会表外漢字字体表付録:表外漢字字体表の漢字一覧(含2010年追加採用)

  • 後來JIS也根據最新標準有所增訂,但是「拡張新字体」們有被留下來。所以現在「拡張新字体」是一部分雖然不是標準字體但被承認的「簡易慣用字体」,另一部分就被看作為用了20年的不標準的俗字了。

希望用t2jpx的原因就是,這些俗字在日常中用的更多,更容易被看懂。而這點似乎和t2jp的原則有悖。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

None yet

5 participants