2012KE
Ruby
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
data
README.md
random_select.rb
ranking_for_term.rb
ranking_in_document.rb
tfidf_calculator.rb

README.md

tfidf_calculator.rb

TF・IDFを計算するクラス TFIDFCalculator が書かれている。

random_select.rb

TFIDFCalculatorクラスの使用例その1。 ランダムに索引語を選択してTFIDF値とともに出力。

ranking_in_document.rb

TFIDFCalculatorクラスの使用例その2。 001.txtから010.txtぐらいまで、それぞれのファイルのなかでTFIDFが高い索引語を上位5つぐらい出力するプログラムが書かれている。

ranking_for_term.rb

TFIDFCalculatorクラスの使用例その3。 引数として受け取ったキーワードで全文書を対象にTFIDFを計算。その中からTFIDF値が高いファイルを上位5つほど表示。 引数を指定しなかった場合ランダムに索引語を選んで実行。 レポートのデータ作成に使用。