In [None]:
# パッケージの読み込み
using Plots # データの可視化パッケージ

# データ処理の方法

このノートでは，

- ファイルの書き込み・読み込み
- 平均,分散，標準偏差の計算
- いろんな種類のプロット
- 線形フィット

などについて説明する。



まず，通常のテキストファイルを読み取ることを考える。
例として，スペースで区切られた各列に何かの物理量の時系列データが記録されている[./data/press.txt](./data/press.txt)を読み込んで処理してみる。

まずは読み込みのための関数を示す。

In [None]:
function readdata(filename; k=1) 
    data= Float64[] 
    fp = open(filename,"r") 
    for line in eachline(fp) 
        #println(line)
        row=split(line)
        #println(row)
        e = parse(Float64,row[k])
        println(e)
        push!(data,e)
    end
    close(fp)
    return data
end

In [None]:
ns=readdata("./data/therm.txt");

In [None]:
filename = "./data/therm.txt"
tote=readdata(filename,k=2)
px=readdata(filename,k=3)
py=readdata(filename,k=4)
typeof(ns)

nsを横軸に，toteを縦軸にしてグラフをプロットしたいならば以下のようにする。

In [None]:
plot(ns,tote,xlabel="n",ylabel="TotE",label="TotE")

`tote`のインデックスを横軸に，値を縦軸にプロットするだけならば

In [None]:
plot(tote)

のようにすれば良い。

pxとpyのグラフを重ねてプロットしたいならば，

In [None]:
plot(ns,px,label="px")
plot!(ns,py,label="py")

$50$個目から$1001$個目の`tote`の値$E_i$の平均値$\mu$を計算し，$|E_i-\mu|$をプロットすることを考える。

In [None]:
μ = sum(tote[50:1001])/length(tote[50:1001]) 

In [None]:
using Statistics # 統計処理のパッケージ
# mean() 引数に配列を与えるとその平均を計算してくれる
μ = mean(tote[50:end]) # 1001個が最後なので，endでも指定可能

In [None]:
s = sqrt(var(tote[50:end])) # var()は不偏分散(n-1で割るほう)を計算してくれる,標本分散(nで割るほう)を計算したいならvar(tote[50:end],corrected=false)とする

In [None]:
sqrt(var(tote[50:end],corrected=false))

In [None]:
sabun=abs.(tote.-μ)

In [None]:
plot(ns,sabun,yscale=:log10)

横軸の領域を$0$から$25000$までに絞りたいときは，

In [None]:
plot(ns,sabun,yscale=:log10,xlims=(0,25000))

ここに，
$$
    y = Ae^{-n/n_r}
$$
を重ねてプロットしたいときは，

In [None]:
f(n) = 1000*ℯ^(-n/1000)

In [None]:
plot!(f)

In [None]:
# sampn=range(1,10000,length=3)
# plot!(sampn,f.(sampn))

縦線や横線をひきたいときは，

In [None]:
vline!([0.25*10^4,0.5*10^4])

In [None]:
hline!([1,100],label=false)

のようにする。

ヒストグラムの扱いかたを，`tote`のヒストグラムを例に示す。

In [None]:
histogram(tote[50:end]) 

In [None]:
histogram(tote[50:end],bin=-15900:50:-15100,fa=0.3, lc="#FFFFFF" ,label="-15900:50:-15100") # 特にbin幅を指定する方法

In [None]:
histogram!(tote[50:end],bin=-15900:25:-15100,fa=0.3, lc="#FFFFFF" ,label="-15900:25:-15100")
histogram!(tote[50:end],bin=-15900:12.5:-15100,fa=0.3, lc="#FFFFFF" ,label="-15900:12.5:-15100")

確率分布にしたいならば，

In [None]:
histogram(tote[50:end],bin=-15900:50:-15100,fa=0.3, lc="#FFFFFF" ,label="-15900:50:-15100",norm=true)
histogram!(tote[50:end],bin=-15900:25:-15100,fa=0.3, lc="#FFFFFF" ,label="-15900:25:-15100",norm=true)
histogram!(tote[50:end],bin=-15900:12.5:-15100,fa=0.3, lc="#FFFFFF" ,label="-15900:12.5:-15100",norm=true)

- グラフの細かい制御や他の種類のグラフの描き方は[https://docs.juliaplots.org/latest/tutorial/](https://docs.juliaplots.org/latest/tutorial/)を見てがんばる
- [https://docs.makie.org/stable/](https://docs.makie.org/stable/)を使えば動的な描画などの高度な機能が使える
- 凝ったグラフを描きたいときは自分で実装することも考える
- [Statistics.jl](https://juliastats.org/Statistics.jl/dev/)の他の機能も便利