[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/kyorin-phys/joho/blob/main/p4.ipynb)

### 応用問題2 (ヘモグロビンの飽和曲線)
データファイル(p2.csv) に酸素分圧(mmHg)とヘモグロビンの酸素飽和度(%)のデータがある。

(1) データを読み込み、散布図でプロットする。

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import japanize_matplotlib
from numpy import log, exp
from scipy.stats import linregress 

In [None]:
df = pd.read_csv('p2.csv')
df.head()

In [None]:
x = df.iloc[:,0]
y = df.iloc[:,1]
plt.scatter(x, y)
plt.xlabel('酸素分圧[mmHg]')
plt.ylabel('酸素飽和度(%)')
plt.grid()
plt.show()


Hillの式
$$
y = 100 \frac{ax^n}{1+ax^n}
$$
で近似して$a, n$の値を実験データから求めたい。
曲線のままでは非線形回帰が必要だが、この関数は次のようなロジット変換で直線になる。
$$
\ln{\frac{y}{100-y}} = n\ln{x} + \ln{a}
$$
$X = \ln{x}, Y = \ln{\frac{y}{100-y}}$ とおくと、
$Y = nX + \ln{a}$ となり、傾き$n$, y切片$\ln{a}$の直線を表す。

$X, Y$の関係をプロットして確認せよ。


In [None]:
X = log(x)
Y = log(y/(100-y))
plt.scatter(X, Y)
plt.xlabel('$X$')
plt.ylabel('$Y$')
plt.grid()
plt.show()

In [None]:
# 変数変換で対数を取らずに両対数グラフにしても同じ形であるが、線形回帰でパラメータを求めるときは対数を取る
X1 = x 
Y1 = y/(100-y)
plt.scatter(X1, Y1)
plt.xscale('log')
plt.yscale('log')
plt.xlabel('$x$')
plt.ylabel('$y/(100-y)$')
plt.grid()
plt.show()

In [None]:
lr = linregress(X, Y)
print(lr)
n = lr.slope
lna = lr.intercept
a = exp(lna)
print(n, a)
xth = np.linspace(0, 120)
yth = 100*a*xth**n/(1+a*xth**n)
plt.scatter(x, y, label='実験値')
plt.plot(xth, yth, label='理論値')
plt.xlabel('酸素分圧[mmHg]')
plt.ylabel('飽和度[%]')
plt.legend()
plt.show()

In [None]:
# XYのグラフで直線がよい近似となるのは中間部なので、最初と最後の直線から外れた3点を除外して近似してみる
lr1 = linregress(X[3:-3], Y[3:-3])
print(lr1)
n1 = lr1.slope
a1 = exp(lr1.intercept)
y1 = 100*a1*xth**n1/(1+a1*xth**n1)
plt.scatter(x, y, label='実験値')
plt.plot(xth, y1, label='理論値')
plt.xlabel('酸素分圧[mmHg]')
plt.ylabel('飽和度[%]')
plt.legend()
plt.show()
# このようにすると酸素分圧20mmHgあたりのずれが改善した。