日本語辞書tooltipつきRust RFC生成

Experimental
現在は仕組みができて辞書のデータをこれから充実させていこうという段階です。

生成されたHTMLはここでホストしているのでカーソルを struct とかに当ててみて試してみてください

内容

以下のように、単語にカーソルが来ると訳が浮かび上がります。

参考、ライセンスなど

submoduleとして存在している2つのリポジトリについては、それぞれのライセンスの指示に従ってください。

rust-lang/rfcs MIT, Apache version 2.0 のいずれかで提供されています
DQNEO/gospec-analyzer

また、gospec-analyzerを全面的に参考・使用しています。DQNEOさんありがとうございます。

手順

辞書において無視する単語や訳語などのデータは data/ にはいっています。(現在は一時的にgospecのものを使用しています) これをgospec-analyzerで用いるため gospec-analyzer/data/ を消去して、 data/ を代わりに配置します。

rm -rf gospec-analyzer/data/
cp -r data gospec-analyzer/

次に、gospec-analyzerをビルドします。makeとgoが必要です。次に生成されたバイナリを移動させます。

cd gospec-analyzer
# バイナリ生成
make bin/s2t
make bin/tokenizer
make gospec
make bin/tsv2json

cd ../ # rust-rfc-with-ja-dict-script $
# 移動
cp gospec-analyzer/bin/* bin/
cp gospec-analyzer/gospec bin/

Rust RFC bookを生成して持ってくる(bookは別リポジトリで配信しているためignore)

cd rfcs
./generate-book.sh # book/に生成物ができる
cd .. # rust-rfc-with-ja-dict-script $
cp -r rfcs/book book

word2stem.js(語形の変化を吸収する単語対応表)と、頻度表などを作る
(割と時間がかかります)

python3 generate-word2stemjs.py

HTMLにtooltip用のコードを追加します

python3 inject-to-html.py

generate dic.ja.js

bin/tsv2json data/dic.ja.tsv > docs/dic.ja.json
echo 'var dic = ' > docs/dic.ja.js
cat docs/dic.ja.json >> docs/dic.ja.js
cp docs/dic.ja.js addon/

cp addon

mkdir addon/word2stem
cp docs/word2stem-*-*-*.js addon/word2stem/
cp -r addon book/

補足

python3 dictionary.py でdict.csvとhist.txtが生成されます。これらはそれぞれ、登場する全単語(ただし、is のように一般的なものや訳す必要のない技術用語を除く)、その単語の登場回数が記録されています。
- 頻度 hist.txt
今後 dict.csv を頻度の高い順に埋めていけば辞書付きRFCが充実していきますが、どのようにcsvに書き込む仕組みを整えたらよいかはまだ分かってないです。何かアドバイスありましたらお願いします。 Twitter @kaito_tateyama

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
addon		addon
bin		bin
data		data
gospec-analyzer @ 042ecee		gospec-analyzer @ 042ecee
rfcs @ c22ffd7		rfcs @ c22ffd7
.gitignore		.gitignore
.gitmodules		.gitmodules
README.md		README.md
dictionary.py		dictionary.py
generate-word2stemjs.py		generate-word2stemjs.py
img-readme.png		img-readme.png
inject-to-html.py		inject-to-html.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

日本語辞書tooltipつきRust RFC生成

内容

参考、ライセンスなど

手順

補足

About

Releases

Packages

Languages

uta8a/rust-rfc-with-ja-dict-script

Folders and files

Latest commit

History

Repository files navigation

日本語辞書tooltipつきRust RFC生成

内容

参考、ライセンスなど

手順

補足

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages