### パターン２の位置情報を予測する
<img src="./RSSI取得実験図/pattern2.png" alt="パターン2">

##### パターン２では発信機の場所は常に固定であるため受信したデータから発信機の番号を予測することで位置情報の予測とする。

In [211]:
# 必要なライブラリの読み込み
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [102]:
# データセット読み込み (pattern2 = p2)
p2 = pd.read_csv("./取得データセット/pattern2.csv")
p2.columns = ["UUIDs","Major","Minor","Accuracy","Proximity","TxPower","RSSI","device_name","timestamp"]
# 発信機ごとに種類分け
p2_1 = p2[p2['UUIDs']  == "10000000aaaa41441111110000000000"]
p2_2 = p2[p2['UUIDs']  == "20000000aaaa41441111110000000000"]
p2_3 = p2[p2['UUIDs']  == "30000000aaaa41441111110000000000"]
p2_4 = p2[p2['UUIDs']  == "40000000aaaa41441111110000000000"]

In [103]:
df = p2
# 生データ
df.head()

Unnamed: 0,UUIDs,Major,Minor,Accuracy,Proximity,TxPower,RSSI,device_name,timestamp
0,10000000aaaa41441111110000000000,2,38,1.210637,near,-78,-82,rasp2,2017/10/03 15:39:27
1,40000000aaaa41441111110000000000,2,35,1.77436,near,-78,-90,rasp2,2017/10/03 15:39:27
2,20000000aaaa41441111110000000000,2,40,1.397251,near,-78,-85,rasp2,2017/10/03 15:39:27
3,10000000aaaa41441111110000000000,2,38,1.465642,near,-78,-86,rasp2,2017/10/03 15:39:27
4,10000000aaaa41441111110000000000,2,38,1.210637,near,-78,-82,rasp2,2017/10/03 15:39:27


#### 各ラベルの情報：  
UUIDs,Major,Minor : 発信機の特定に使われる  
Accuracy : 推定距離のばらつきを示す  
Proximity : 1M地点でビーコンが発する信号の強さ  
RSSI : 電波強度  
device_name : 受信機名  
timestamp : 受信時の時間を記録

### 発信機情報とRSSIを用いて位置情報推定を行う

##### 前処理 :

In [169]:
#　オブジェクト型の目的変数を数値情報に変換

# UUIDsを変換
import sklearn.preprocessing as sp
le = sp.LabelEncoder()
le.fit(df[df.columns[0]].unique())
df["locate"] = le.transform(df[df.columns[0]])

# timestampを変換
le = sp.LabelEncoder()
le.fit(df[df.columns[8]].unique())
df["date_label"] = le.transform(df[df.columns[8]])

In [171]:
# 訓練用データとテストデータを用意
import sklearn.cross_validation as crv
X_train, X_test, y_train, y_test = crv.train_test_split(df[["RSSI","date_label"]], np.array(df["locate"]), test_size=0.2)

#### XGBoostを用いて学習

In [172]:
# Xgboostのライブラリを読み込み
import xgboost as xgb
from sklearn.metrics import accuracy_score

# オブジェクトを作成し学習
mod = xgb.XGBClassifier()
mod.fit(X_train,y_train)

XGBClassifier(base_score=0.5, colsample_bylevel=1, colsample_bytree=1,
       gamma=0, learning_rate=0.1, max_delta_step=0, max_depth=3,
       min_child_weight=1, missing=None, n_estimators=100, nthread=-1,
       objective='multi:softprob', reg_alpha=0, reg_lambda=1,
       scale_pos_weight=1, seed=0, silent=True, subsample=1)

In [173]:
# クローズドテスト
pred = mod.predict(X_train)
closed_score = accuracy_score(pred,y_train)

In [177]:
# オープンテスト
pred = mod.predict(X_test)
open_score = accuracy_score(pred,y_test)

In [178]:
closed_score

0.76325675925355674

In [179]:
open_score

0.76305418719211826

### 反射波の影響を取り除いて学習

#### 受信機ごとのRSSI値に対してクラスタリングを行い反射波との分布をみる

非階層的クラスタリング  
非階層的クラスタリング (例: K-Means 法) では、決められたクラスタ数にしたがって、近い属性のデータをグループ化します。  
<img src="./RSSI取得実験図/tech_mining_img96.jpg" alt="パターン2">

In [213]:
# KMeansライブラリをインポート
from sklearn.cluster import KMeans
# RSSIとlocate情報を使用してクラスタリング
df["cluster"] = KMeans().fit_predict(df[["RSSI","locate"]])

In [216]:
df

Unnamed: 0,UUIDs,Major,Minor,Accuracy,Proximity,TxPower,RSSI,device_name,timestamp,locate,date_label,cluster
0,10000000aaaa41441111110000000000,2,38,1.210637,near,-78,-82,rasp2,2017/10/03 15:39:27,0,0,4
1,40000000aaaa41441111110000000000,2,35,1.774360,near,-78,-90,rasp2,2017/10/03 15:39:27,3,0,2
2,20000000aaaa41441111110000000000,2,40,1.397251,near,-78,-85,rasp2,2017/10/03 15:39:27,1,0,0
3,10000000aaaa41441111110000000000,2,38,1.465642,near,-78,-86,rasp2,2017/10/03 15:39:27,0,0,0
4,10000000aaaa41441111110000000000,2,38,1.210637,near,-78,-82,rasp2,2017/10/03 15:39:27,0,0,4
5,40000000aaaa41441111110000000000,2,35,1.774360,near,-78,-90,rasp2,2017/10/03 15:39:27,3,0,2
6,20000000aaaa41441111110000000000,2,40,1.332051,near,-78,-84,rasp2,2017/10/03 15:39:27,1,0,0
7,10000000aaaa41441111110000000000,2,38,1.210637,near,-78,-82,rasp2,2017/10/03 15:39:28,0,1,4
8,30000000aaaa41441111110000000000,2,34,1.861210,near,-78,-91,rasp2,2017/10/03 15:39:28,2,1,2
9,20000000aaaa41441111110000000000,2,40,1.332051,near,-78,-84,rasp2,2017/10/03 15:39:28,1,1,0
