 # Classifierアルゴリズム
 
 ## `Classifier()`
 
SDR 分類器は、単層の分類ネットワークの形をしています。SDRを入力として受け取り、カテゴリの予測分布を出力します。
 
カテゴリは、符号なし整数でラベル付けされます。 他のデータ型は、列挙するか、正整数に変換する必要があります。 出力単位は、最大カテゴリラベルの数だけあります。

推論の間、出力は最初にすべての入力の加重和を行い、その後、カテゴリーラベルの予測分布を得るためにソフトマックス非線形関数を実行することによって計算されます。

学習中、入力ユニットと出力ユニット間の接続重みは、モデルの尤度を最大化するように調整される。

### メソッド

`infer(...)`：

引数パターンは、アクティブな入力ビットを含む SDRです。

PDF（Probablility Distribution Function）は、カテゴリの確率分布関数を返します。PDF は、合計が 1 になる確率のリストです。

このリストの**各インデックスはカテゴリのラベル**であり、**各値はそのカテゴリの尤度**である。確率が最も高いカテゴリを見つけるには、`numpy.argmax`を使用してください。

## カテゴリ分類器

In [4]:
import numpy as np
from htm.bindings.sdr import SDR
from htm.bindings.algorithms import Classifier

categories = { 'A': 0, 'B': 1, 'C': 2, 'D': 3 }

# ランダムなSDRを作成し、カテゴリに関連付けます。
inputData  = SDR( dimensions = (1000 , ) ).randomize( 0.02 )
print("-"*70 )
print("inputData: ",inputData)
clsr = Classifier()
clsr.learn( inputData, categories['D'] )
print("-"*70 )
print("PDF: ",clsr.infer( inputData ) )
print("-"*70 )
predict = np.argmax( clsr.infer( inputData ) )  #->  categories['B']
print("predict index: ",predict)

predict_key = [k for k, v in categories.items() if v == predict]
print("-"*70 )
print("predict lebel: ",predict_key[0])


----------------------------------------------------------------------
inputData:  SDR( 1000 ) 12, 18, 23, 91, 231, 292, 382, 422, 453, 476, 480, 529, 553, 554, 648, 687, 746, 763, 876, 950
----------------------------------------------------------------------
PDF:  [0.248743755155006, 0.248743755155006, 0.248743755155006, 0.2537687125734917]
----------------------------------------------------------------------
predict index:  3
----------------------------------------------------------------------
predict lebel:  D


In [7]:
import numpy as np
from htm.bindings.sdr import SDR
from htm.bindings.algorithms import Classifier

categories = { 'A': 0, 'B': 1, 'C': 2, 'D': 3 }

for n in range(100):
    for i in categories:
        # ランダムなSDRを作成し、カテゴリに関連付けます。
        inputData  = SDR( dimensions = (1000 , ) ).randomize( 0.02 )
        print("-"*70 )
        print("inputData: ",inputData)
        clsr = Classifier()
        clsr.learn( inputData, categories[i] )

        print("-"*70 )
        print("PDF: ",clsr.infer( inputData ) )
        print("-"*70 )
        predict = np.argmax( clsr.infer( inputData ) )  #->  categories['B']
        print("predict index: ",predict)

        predict_key = [k for k, v in categories.items() if v == predict]
        print("-"*70 )
        print("predict lebel: ",predict_key[0])

----------------------------------------------------------------------
inputData:  SDR( 1000 ) 78, 130, 132, 186, 252, 270, 286, 294, 347, 356, 394, 440, 447, 503, 661, 673, 691, 783, 841, 921
----------------------------------------------------------------------
PDF:  [1.0]
----------------------------------------------------------------------
predict index:  0
----------------------------------------------------------------------
predict lebel:  A
----------------------------------------------------------------------
inputData:  SDR( 1000 ) 5, 27, 164, 199, 238, 246, 253, 272, 374, 389, 465, 518, 539, 633, 656, 691, 701, 762, 849, 936
----------------------------------------------------------------------
PDF:  [0.49500017907770616, 0.504999846488284]
----------------------------------------------------------------------
predict index:  1
----------------------------------------------------------------------
predict lebel:  B
-----------------------------------------------------------

----------------------------------------------------------------------
predict lebel:  B
----------------------------------------------------------------------
inputData:  SDR( 1000 ) 12, 89, 140, 199, 222, 233, 262, 344, 457, 480, 491, 672, 709, 752, 754, 764, 807, 811, 848, 983
----------------------------------------------------------------------
PDF:  [0.3311037647153171, 0.3311037647153171, 0.33779250477135586]
----------------------------------------------------------------------
predict index:  2
----------------------------------------------------------------------
predict lebel:  C
----------------------------------------------------------------------
inputData:  SDR( 1000 ) 2, 33, 122, 124, 176, 218, 296, 316, 346, 383, 388, 414, 498, 686, 754, 826, 900, 933, 948, 959
----------------------------------------------------------------------
PDF:  [0.248743755155006, 0.248743755155006, 0.248743755155006, 0.2537687125734917]
--------------------------------------------------------

----------------------------------------------------------------------
inputData:  SDR( 1000 ) 103, 116, 208, 229, 299, 335, 378, 397, 607, 649, 657, 682, 753, 782, 889, 898, 938, 939, 954, 992
----------------------------------------------------------------------
PDF:  [1.0]
----------------------------------------------------------------------
predict index:  0
----------------------------------------------------------------------
predict lebel:  A
----------------------------------------------------------------------
inputData:  SDR( 1000 ) 5, 32, 98, 184, 188, 205, 245, 283, 318, 328, 432, 450, 460, 699, 834, 847, 922, 951, 964, 988
----------------------------------------------------------------------
PDF:  [0.49500017907770616, 0.504999846488284]
----------------------------------------------------------------------
predict index:  1
----------------------------------------------------------------------
predict lebel:  B
-----------------------------------------------------------

----------------------------------------------------------------------
inputData:  SDR( 1000 ) 40, 163, 178, 305, 396, 482, 537, 607, 639, 679, 751, 752, 753, 757, 873, 876, 895, 919, 921, 982
----------------------------------------------------------------------
PDF:  [0.3311037647153171, 0.3311037647153171, 0.33779250477135586]
----------------------------------------------------------------------
predict index:  2
----------------------------------------------------------------------
predict lebel:  C
----------------------------------------------------------------------
inputData:  SDR( 1000 ) 47, 83, 107, 158, 190, 206, 290, 328, 381, 478, 500, 546, 568, 573, 601, 665, 677, 856, 986, 988
----------------------------------------------------------------------
PDF:  [0.248743755155006, 0.248743755155006, 0.248743755155006, 0.2537687125734917]
----------------------------------------------------------------------
predict index:  3
------------------------------------------------------

In [8]:
sampleData  = SDR( dimensions = (1000 , ) ).randomize( 0.02 )
print("-"*70 )
print("sampleData: ",sampleData)
print("-"*70 )
print("PDF: ",clsr.infer( sampleData) )
print("-"*70 )
predict = np.argmax( clsr.infer( sampleData ) ) 
print("predict index: ",predict)

----------------------------------------------------------------------
sampleData:  SDR( 1000 ) 27, 103, 184, 242, 260, 324, 381, 429, 538, 557, 590, 788, 804, 854, 883, 905, 907, 932, 935, 939
----------------------------------------------------------------------
PDF:  [0.25, 0.25, 0.25, 0.25]
----------------------------------------------------------------------
predict index:  0


## スカラー分類器

In [9]:
import numpy as np
from htm.bindings.sdr import SDR
from htm.bindings.algorithms import Classifier

# スカラー値を推定します． 
# Classifierはカテゴリしか受け付けないので、
# 最小値を引き算して解像度で割ることで、
# 実数値の入力をビン(別名バケツ)に入れてください。
scalar     = 567.8
minimum    = 500
resolution = 10

inputData  = SDR( dimensions = (1000 , ) ).randomize( 0.02 )
print("-"*70 )
print("inputData: ",inputData)
clsr.learn( inputData, int((scalar - minimum) / resolution) )
predict = np.argmax( clsr.infer( inputData ) ) * resolution + minimum  #->  560
print("-"*70 )
print("predict : ",predict)

----------------------------------------------------------------------
inputData:  SDR( 1000 ) 79, 95, 132, 174, 191, 313, 350, 472, 473, 489, 560, 573, 591, 658, 732, 761, 859, 869, 881, 975
----------------------------------------------------------------------
predict :  560


In [25]:
import numpy as np
from htm.bindings.sdr import SDR
from htm.bindings.algorithms import Classifier
import random

# スカラー値を推定します． 
# Classifierはカテゴリしか受け付けないので、
# 最小値を引き算して解像度で割ることで、
# 実数値の入力をビン(別名バケツ)に入れてください。


minimum    = 500
resolution = 10

for i in range(4):
    scalar     = random.uniform(500, 600)
    print("-"*70 )
    print("scalar: ", scalar)
    inputData  = SDR( dimensions = (1000 , ) ).randomize( 0.02 )
    print("-"*70 )
    print("inputData: ",inputData)
    clsr.learn( inputData, int((scalar - minimum) / resolution) )
    predict = np.argmax( clsr.infer( inputData ) ) * resolution + minimum  #->  560
    print("-"*70 )
    print("predict : ",predict)

----------------------------------------------------------------------
scalar:  504.5772223401718
----------------------------------------------------------------------
inputData:  SDR( 1000 ) 38, 127, 173, 180, 193, 301, 423, 445, 466, 519, 585, 739, 755, 774, 794, 808, 849, 858, 891, 962
----------------------------------------------------------------------
predict :  500
----------------------------------------------------------------------
scalar:  541.5178914857975
----------------------------------------------------------------------
inputData:  SDR( 1000 ) 54, 91, 125, 212, 247, 251, 253, 281, 319, 447, 540, 552, 585, 611, 709, 761, 763, 818, 940, 958
----------------------------------------------------------------------
predict :  540
----------------------------------------------------------------------
scalar:  541.0315526250993
----------------------------------------------------------------------
inputData:  SDR( 1000 ) 15, 128, 156, 172, 255, 288, 307, 317, 346, 444, 461, 