<a href="https://colab.research.google.com/github/Ryoya1012/Data-Analysis/blob/main/interpolateynb.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# エクセルファイルの読み込み
file_path = 'まとめ.xlsx'  # ここをエクセルファイルのパスに置き換えてください
data = pd.read_excel(file_path)

# データの取得
data2 = data['Data2'].values
data1 = data['Data1'].values
data4 = data['Data4'].values
data3 = data['Data3'].values
data6 = data['Data6'].values
data5 = data['Data5'].values

# データのクリーニング関数を定義
def clean_data(x, y):
    # NaN, inf のチェックと削除
    df = pd.DataFrame({'x': x, 'y': y})
    df = df.dropna()  # 欠損値を削除
    df = df.replace([np.inf, -np.inf], np.nan)  # 無限大をNaNに置き換え
    df = df.dropna()  # 再度欠損値を削除

    # xの値が全く同じか、yの値が全く同じでないかを確認
    if len(df['x'].unique()) == 1 or len(df['y'].unique()) == 1:
        raise ValueError("データにバリエーションがなく、線形回帰ができません。")

    return df['x'].values, df['y'].values

# 切片を0に固定した線形回帰を行う関数
def linear_fit_with_zero_intercept(x, y):
    # 最小二乗法で傾きを計算（切片を0に固定）
    a = np.sum(x * y) / np.sum(x * x)
    return a

# 散布図と1次近似の計算を行う関数
def plot_and_fit(x, y, label):
    try:
        # データをクリーンアップ
        x_clean, y_clean = clean_data(x, y)

        # 散布図を描画
        plt.scatter(x_clean, y_clean, label=f'Scatter {label}')

        # 1次近似（切片0で線形回帰）の計算
        slope = linear_fit_with_zero_intercept(x_clean, y_clean)

        # 近似線を描画
        x_range = np.linspace(min(x_clean), max(x_clean), 500)
        plt.plot(x_range, slope * x_range, label=f'Fit {label}: y = {slope:.2f}x')

        # 近似式を表示
        print(f'{label} の1次近似式 (切片0固定): y = {slope:.2f}x')
    except ValueError as e:
        print(f'{label} のデータに問題があります: {e}')

# 図の設定
plt.figure(figsize=(12, 8))
plot_and_fit(data2, data1, '(Data2, Data1)')
plot_and_fit(data4, data3, '(Data4, Data3)')
plot_and_fit(data6, data5, '(Data6, Data5)')

# グラフの装飾
plt.title('Scatter Plots with Linear Fit (Zero Intercept)')
plt.xlabel('X values')
plt.ylabel('Y values')
plt.legend()
plt.grid(True)
plt.savefig('scatter_plot_with_fit.png', dpi=300)
plt.show()
