# かな入力方式を評価する

In [4]:
import kana_arranger as ka

## コーパスを用意する

`cutoff` は出現数の最小値。デバッグ時は大きい値（1000とか）、評価時は小さい値（1～2）にする。

In [None]:
corpus_dir = './corpus'
cutoff = 1 # 頻度がこの値未満の語彙を無視する
corpus = ka.KkcBccwjCore(corpus_dir, cutoff)

内容確認

In [None]:
corpus.freq.most_common(10)

 ` [('た。', 6959), ('る。', 4924), ...]`
 のように文字列と数値のペアのリストが表示されればOK

## かな入力方式を定義する

### 既存のかな入力方式を使う

`Romaji` が使える。

In [None]:
romaji = ka.Romaji()

動作確認

In [None]:
romaji.apply('ふぃんあんかんにんにゃんんゔゅー☆、「くぇっあっかっにっにゃっんっゔぉー」。')

`'finnankannninnnyannnvyu-☆,「qextuakkaxtunixtunyaxtunvvo-」.'`
と表示されればOK

### 独自のかな入力方式を作る

例: 「あいうえお」だけのローマ字入力を作る。

In [None]:
table = {
    'あ':'a', 'い':'i', 'う':'u', 'え':'e', 'お':'o',
}
aiueo = ka.Transliterator('aiueo', table)

動作確認

In [None]:
aiueo.apply('ふぃんあんかんにんにゃんんゔゅー☆、「くぇっあっかっにっにゃっんっゔぉー」。')

## キーボードを定義する

### 既存のキーボードを使う

`JisKeyboard`, `MicrotronKeyboard` が使える。

In [None]:
keyboard = ka.JisKeyboard()

### 独自のキーボードを作る

例: JISキーボードを作る。

In [None]:
"""
┏━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃1 │2 │3 │4 │5 ┃6 │7 │8 │9 │0 │- │^ │| │┃
┃│q │w │e │r │t ┃y │u │i │o │p │@ │[ │  ┃
┃ │a │s │d │f │g ┃h │j │k │l │; │: │] │ ┃
┃S  │z │x │c │v │b ┃n │m │, │. │/ │_ │S  ┃
┗━━━━━━━━━━━━━━━━━━━━━━━━━━┛
"""
jisx6002 = ka.Keyboard(
    # レイアウト名（Heatmapのレイアウト名に合わせる）
    'QWERTY',
    # キー
    '1234567890-^|qwertyuiop@[asdfghjkl;:]zxcvbnm,./_',
    # 担当手（<=左手, >=右手）
    '<<<<<>>>>>>>><<<<<>>>>>>><<<<<>>>>>>><<<<<>>>>>>',
    # 担当指（a=左小指, ..., d=左人差指, e=左親指, f=右親指, g=右人差指, ..., j=右小指）
    'abcddgghijjjjabcddgghijjjabcddgghijjjabcddgghijj',
    # 段（0=親指, 1=下段, 2=中段, 3=上段, 4=最上段）
    '444444444444433333333333322222222222211111111111',
    # 列（..., Q=左手最右列, R=右手最左列, ...）
    'MNOPQRSTUVWXYMNOPQRSTUVWXMNOPQRSTUVWXMNOPQRSTUVW',
    # アルペジオに含める列
    'MNOPSTUV'
)

ヒートマップを描画するには、次の作業を別途行う必要がある。

- `kana_arranger/img/<レイアウト名>.png` に800×373ピクセルの画像を作る。
- `kana_arranger/lib/keyboard-layouts.js` に画像上の各キーの中心座標を書く。

## 定量評価する

In [None]:
r = keyboard.evaluate(corpus, romaji)
print(r)

ヒートマップ

In [None]:
r.heatmap()

キーごとの打鍵数

In [None]:
print(r.c_key)

その他の統計値

In [None]:
# TODO: Pandasで集計する