# Tutorial for jupyterhack
実験データやグラフ等をまとめてファイル化するパッケージjupyterhackのチュートリアルです。

それぞれのセルはshift+Enterで実行可能です。

## 0 準備
### 0.0 インストール
anacondaのプロンプトで以下のコマンドを打つことでインストールできます。

`conda install -c threemeninaboat3247 jupyterhack`

### 0.1 Jupyter側の準備
jupyterhackはPyQt5というGUIパッケージを使用しており、これを使うことをJupyterに宣言する必要があります。


In [1]:
%gui qt

jhという名前でjupyterhackを`import`することで以降はjhという名前でパッケージにアクセス可能になります。

In [2]:
import jupyterhack as jh

## 1 主な機能
jupyterhackが提供する主な機能はグラフやデータのファイル化です。ユーザはツリー構造にてデータを保持するデータブラウザに様々なデータやグラフを追加していき、それらをまとめてファイル化することができます。

### 1.0 データブラウザを作成する
`getRoot()`でデータブラウザを作成することができます。ダイアログが開くので適当な場所にファイルを作成して下さい。以下では作成したデータブラウザを`r`という変数で受けています。

In [3]:
r=jh.getRoot()

### 1.1 フォルダと作業フォルダ
データブラウザに追加するデータはフォルダにいれてまとめて管理することが出来ます。フォルダはデータブラウザ上の青いボダンで追加と削除が行え、typeという列でfolderと表示されます。

このfolderという文字をダブルクリックすることでそのフォルダを作業フォルダに設定することができ、作業フォルダへはコードから`r.cur`でアクセスすることが出来ます。（`r`はデータブラウザを受けた変数名なので変わり得る）

作業フォルダはピンク色でハイライトされます。

### 1.2 データやグラフの追加
データブラウザ内のフォルダにはpickleというモジュールでファイル化できるデータ（自作クラス等でない限りは大体大丈夫）を追加することが出来ます。グラフは後に述べるjupyterhackで用意したクラスを使って下さい

文字列を作成してデータブラウザに追加してみましょう。

In [4]:
test='This is a string'

データの追加にはフォルダの`add`メソッドを用います。

In [5]:
r.cur.add(test)

作業フォルダにtestというラベルで文字列が追加されたと思います。この文字列には次のように`r.cur`+`ラベル名`でアクセスすることが出来ます。

In [6]:
r.cur.test

'This is a string'

フォルダやデータのラベル名はダブルクリックすることで変更可能です。またドラッグアンドドロップで別のフォルダへ移動することも可能です。

### 1.3 csvファイルの読み込み
`r.cur`へはcsvファイルから直接データを読み込むことも可能です。このチュートリアルに添付してあるファイルからデータを読み込んでみましょう。以下のコマンドでダイアログが開くのでraw_dataフォルダ内にあるファイルを指定して下さい。（Ctrlを押しながらクリックで複数選択可能）

In [7]:
r.cur.loadFiles()

指定したファイル名でラベルされたフォルダが作業フォルダ内に作成されて、その中に各データがpandasというモジュールのSeriesというクラスとして入っています。

### 1.4 セーブ
以下のコマンドでデータブラウザを作成する時に指定した場所へとデータのファイル化が行われ、一度Jupyterを閉じた後も再度データブラウザ内に追加したデータを復元することができます。

In [8]:
r.save()

Saved To::
C:/Users/Yuki/Dropbox/python/Analysis/Tutorial/tutorial.jh


`r.save(True)`とするとダイアログが開いて新しい場所へファイルを作ってセーブすることが出来ます。

### 1.5 再読み込み
作成したファイルの復元は`getRoot()`で開くダイアログでファイルを指定することで行われます。

In [9]:
r=jh.getRoot()

## 2 グラフ
データブラウザに追加するグラフとしてjupyterhackにはGraphWindowというクラスが定義されています。GraphWindowは入っているフォルダの折り畳みの切り替えによって表示、非表示を切り替えることが出来ます。

### 2.0 グラフウィンドウの作成
以下のようにして空のグラフウィンドウを作成することが出来ます。

In [4]:
graph=jh.GraphWindow()

### 2.1 プロット
先程ファイルから読み込んだデータ（Biの電気抵抗）をプロットしてみましょう。赤文字のfolderをダブルクリックして作業フォルダを`Bi_arai_161024.txt`にして下さい。以下のようにして先程作成した空のグラフウィンドウへBiの電気抵抗の圧力依存性をプロットすることが出来ます。

In [6]:
graph.plot(r.cur.pressure,r.cur.resistivity,marker='o',color='r',mew=0)

`plot`メソッドに渡す変数はmatplotlibというグラフパッケージのmatplotlib.pyplot.plotに渡す変数と同じです。[ここ](http://matplotlib.org/api/pyplot_api.html?highlight=plot#module-matplotlib.pyplot)を参照してください。

### 2.2 グラフィカルなデータ点の選択
GraphWindowには指定したデータ点の座標を取得するための方法が用意されています。

#### 2.2.0 一点選択
GraphWindowのツールバーの右側にあるpointerを押すと下部にx,y座標を表示するボックスが現れます。グラフ上の点をクリックするとその座標が表示されます。キーボードの左右キーで点を左右に移動させることが出来ます。

#### 2.2.1 複数点の選択
同様にツールバーのlassoを使うと複数の点の座標を取得できます。lassoを押した後にグラフをグラフをクリックするとグラフ全体が半透明になります。この状態でマウスをドラッグするとその曲線で囲まれた領域内の点が選択状態になります。選択されている点とそれ以外の点の座標はそれぞれ次のコマンドで取得することが出来ます。

In [7]:
graph.getSelected()

array([[ 0.34184399,  0.00736718]])

In [8]:
graph.getUnSelected()

array([[  1.97565479e-02,   8.75423110e-03],
       [  1.97414961e-02,   8.75456360e-03],
       [  1.97487463e-02,   8.75456360e-03],
       ..., 
       [  1.45925041e+00,   1.36174290e-03],
       [  1.45923238e+00,   1.36076070e-03],
       [  1.45920218e+00,   1.36054160e-03]])

### 2.3 フォルダへの追加
以下のコマンドで作業フォルダにグラフを追加して作業フォルダを畳んで再度展開してみてください。グラフの表示、非表示が切り替わります。

In [9]:
r.cur.add(graph)

## 3 関数
まだ数は少ないですがjupyterhackに用意されている関数について説明します。

### 3.0 微分
二つの要素数が同じ数列（listやnumpy.array)があった時にdy/dxを求めるには`differentiate(x,y)`を使います。Biの電気抵抗を圧力で微分してみましょう。

In [10]:
result=jh.differentiate(r.cur.pressure,r.cur.resistivity)

In [11]:
result

{'df': array([ 1.80483365,  0.32923112,  0.23752053, ...,  0.27013947,
         0.29254578,  0.64247531]),
 'sorted_xs': array([ 0.0196703 ,  0.01967153,  0.0196717 , ...,  1.45967949,
         1.45968238,  1.45968338]),
 'sorted_ys': array([ 0.00875206,  0.00875265,  0.0087557 , ...,  0.0013613 ,
         0.00136464,  0.00136323])}

返り値について説明すると、'sorted_xs','sorted_ys'というはx,yの対応を保ったままxの昇順に並べ変えたものです。各点での微分はその点と前後の数点を含めた点について最小二乗法でフィッティングしてその傾きを微分値としているため並べ変えが必要です。'df'というのが結果です。結果をフォルダに追加して抵抗値とその微分値のグラフを並べてプロットするには次のようにします。

In [12]:
r.cur.add(result['df'],'dR/dpress')

In [14]:
r.cur.add(result['sorted_xs'],'sorted_pressure')

In [15]:
g=jh.GraphWindow()

In [16]:
ax=g.fig.add_subplot(211)
ax2=g.fig.add_subplot(212)
ax.set_title('Bi_first')
ax.plot(r.cur.get('pressure'),r.cur.get('resistivity'),'-o',color='r',mec='None',picker=5)
ax.set_xlabel('pressure/V')
ax.set_ylabel('Resistance/V')
ax2.plot(r.cur.get('sorted_pressure'),r.cur.get('dR/dpress'),'-',color='k',mec='None',picker=5)
ax2.set_ylabel('dR/dpress')
g.setWindowTitle('Bi_first')
g.canvas.draw()

In [17]:
r.cur.add(g)

### 3.1 自作関数の定義
サンプルデータを含むraw_dataフォルダには同様な`Bi_arai_161024.txt`と同様の形式のファイルが後４つ入っています。これらに対して上でやった操作と同じ操作を適用するためにこの操作を関数化しておくと便利です。次のように作業フォルダ、色、グラフタイトルを引数にとる関数を定義してやると良いでしょう。

In [22]:
def toGraph(cur,color,name):
    result=jh.differentiate(cur.get('pressure'),cur.get('resistivity'))
    cur.add(result['df'],'dR/dpress')
    cur.add(result['sorted_xs'],'sorted_pressure')
    g=jh.GraphWindow()
    ax=g.fig.add_subplot(211)
    ax2=g.fig.add_subplot(212)
    ax.set_title(name)
    ax.plot(cur.get('pressure'),cur.get('resistivity'),'-o',color=color,mec='None',picker=5)
    ax.set_xlabel('pressure/V')
    ax.set_ylabel('Resistance/V')
    ax2.plot(cur.get('sorted_pressure'),cur.get('dR/dpress'),'-',color='k',mec='None',picker=5)
    ax2.set_ylabel('dR/dpress')
    g.setWindowTitle(name)
    cur.add(g)

残りの４つのファイルをrootフォルダに読み込んでそれぞれに作業フォルダを設定してから上の関数を呼び出すことで同じ操作を適用することが出来ます。

In [20]:
r.cur.loadFiles()

作業フォルダを`Bi_arai_161026.txt`に設定してください。

In [23]:
toGraph(r.cur,'b','Bi_second')

作業フォルダを`Bi_arai_161031.txt`に設定してください。

In [25]:
toGraph(r.cur,'g','Bi_third')

作業フォルダを`Te_arai_161018_ver6.txt`に設定してください。

In [26]:
toGraph(r.cur,'c','Te_first')

作業フォルダを`Te_arai_161102.txt`に設定してください。

In [27]:
toGraph(r.cur,'m','Te_second')

### 3.2 フィッティング
BiとTeの電気抵抗の跳びは構造相転移によるものです。それぞれについて複数回のrunの結果を平均して標準偏差を求め、２次元空間における重み付きのフィッティングを行ってみましょう。

In [3]:
import numpy as np
Bi_first=np.array([[0.34184399,0.0073671806],
                  [0.36881295,0.0031339758],
                   [1.34416593,0.0028033748]])
Bi_second=np.array([[0.32176141,0.0036031655],
                    [0.35077007,0.0012848195],
                    [1.29179838,0.0017429291]])
Bi_third=np.array([[0.32647466,0.0473289645],
                   [0.3582042,0.0096264855],
                   [1.3089004,0.0063657301]])

Te_first=np.array([[0.526322796,1.90673008]])
Te_second=np.array([[0.56930603,2.73762661]])

#Bi,Teそれぞれについての構造相転移点の電圧値とその標準偏差ｘ
Bi_vol=(Bi_first[:,0]+Bi_second[:,0]+Bi_third[:,0])/3
Bi_vol_error=np.array([np.std([Bi_first[0,0],Bi_second[0,0],Bi_third[0,0]]),np.std([Bi_first[1,0],Bi_second[1,0],Bi_third[1,0]]),\
                       np.std([Bi_first[2,0],Bi_second[2,0],Bi_third[2,0]])])
Te_vol=(Te_first[:,0]+Te_second[:,0])/2
Te_vol_error=np.array([np.std([Te_first[0,0],Te_second[0,0]])])

#文献値と文献値の標準偏差
Bi_lite=np.array([2.55,2.77,7.68])
Bi_lite_error=np.array([0.006,0.005,0.01])
Te_lite=np.array([4])
Te_lite_error=np.array([0.2])

Bi,Teの結果をまとめます。

In [4]:
x=np.r_[Bi_vol,Te_vol]
y=np.r_[Bi_lite,Te_lite]
x_e=np.r_[Bi_vol_error,Te_vol_error]
y_e=np.r_[Bi_lite_error,Te_lite_error]

以上によって２次元空間内の標準偏差付きの点の系列を定義できました。プロットしてみましょう。

In [5]:
g=jh.GraphWindow()
ax=g.fig.add_subplot(111)
ax.errorbar(Bi_vol,Bi_lite,xerr=Bi_vol_error,yerr=Bi_lite_error,fmt='ro',markersize=4,ecolor='g',label='Bi')
ax.errorbar(Te_vol,Te_lite,xerr=Te_vol_error,yerr=Te_lite_error,fmt='yo',markersize=4,ecolor='g',label='Te')
ax.set_ylabel('pressure/GPa')
ax.set_xlabel('voltage/V')
ax.legend(loc='upper left')

<matplotlib.legend.Legend at 0x1398b6576a0>

これらの点に対してフィッティングを行ってみましょう。フィッティングのためには関数と定義域、初期値が必要です。ここでは2次関数でフィッティングを行ってみます。まずは2次関数を定義します。

In [6]:
def quadratic(params,x):
    return params[0]*x**2+params[1]*x+params[2]
xlist=np.arange(-0.5,2,0.01)

関数の引数に与えたparamsというlistが最適化するべきパラメータです。xlistは関数の定義域であり、-0.5から2.0までを幅0.01で区切ったリストを定義しています。この関数で先程の標準偏差付きのデータ点にフィッティングを行うには次のように`MyFitting.fit`を呼び出します。

In [7]:
result=jh.MyFitting.fit(x,y,quadratic,xlist,[-1,4,0],x_e,y_e)

  if (x_e==None) or (y_e==None): #標準偏差が指定されない場合は全て同じ重みで計算


In [8]:
result

{'function result': <function jupyterhack.MyFunctions.MyFitting.fit.<locals>.func_result>,
 'graph': <jupyterhack.MyGraph.MyGraphWindow at 0x1398a76d1f8>,
 'params result': array([ -1.07786671e+00,   7.24274448e+00,  -3.69405466e-03])}

返り値にはフィッティング結果の関数やパラメータが入っています。