**Разработка программы для анализа временных рядов и построения линейной модели**

Процесс создания линейной многофакторной модели (ЛМФМ) для анализа данных временных рядов и факторов с использованием библиотеки pandas для работы с данными и statsmodels для статистического анализа и построения модели.

In [2]:
import pandas as pd
import statsmodels.api as sm

# Временные ряды
data = pd.DataFrame({
    'Time': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    'y': [200.0, 210.0, 220.0, 230.0, 240.0, 250.0, 260.0, 270.0, 280.0, 290.0],
    'X1': [30.0, 32.0, 34.0, 36.0, 38.0, 40.0, 42.0, 44.0, 46.0, 48.0],
    'X2': [45.0, 46.0, 47.0, 48.0, 49.0, 50.0, 51.0, 52.0, 53.0, 54.0],
    'X3': [70.0, 72.0, 74.0, 76.0, 78.0, 80.0, 82.0, 84.0, 86.0, 88.0],
    'X4': [5.0, 5.5, 6.0, 6.5, 7.0, 7.5, 8.0, 8.5, 9.0, 9.5],
    'X5': [15.0, 16.0, 17.0, 18.0, 19.0, 20.0, 21.0, 22.0, 23.0, 24.0]
})
# Создаем матрицу факторов и добавляем константу
X = data[['X1', 'X2', 'X3', 'X4', 'X5']]
X = sm.add_constant(X)

# Модель линейной регрессии
y = data['y']
model = sm.OLS(y, X).fit()

# Вывод результатов
print(model.summary())


                            OLS Regression Results                            
Dep. Variable:                      y   R-squared:                       1.000
Model:                            OLS   Adj. R-squared:                  1.000
Method:                 Least Squares   F-statistic:                 6.697e+29
Date:                Mon, 11 Nov 2024   Prob (F-statistic):          5.57e-117
Time:                        18:11:20   Log-Likelihood:                 285.22
No. Observations:                  10   AIC:                            -566.4
Df Residuals:                       8   BIC:                            -565.8
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         -0.0414   2.73e-16  -1.52e+14      0.0

  return hypotest_fun_in(*args, **kwds)


2. **Построение линейной многофакторной модели**

In [3]:
import statsmodels.api as sm

# Зависимая переменная (отклик)
y = data['y']
# Независимые переменные (факторы)
X = data[['X1', 'X2', 'X3', 'X4', 'X5']]
X = sm.add_constant(X)  # Добавляем константу для смещения

# Построение модели
model = sm.OLS(y, X).fit()
print("Результаты оценки параметров модели:")
display(model.summary())


Результаты оценки параметров модели:


  return hypotest_fun_in(*args, **kwds)


0,1,2,3
Dep. Variable:,y,R-squared:,1.0
Model:,OLS,Adj. R-squared:,1.0
Method:,Least Squares,F-statistic:,6.697e+29
Date:,"Mon, 11 Nov 2024",Prob (F-statistic):,5.57e-117
Time:,18:11:26,Log-Likelihood:,285.22
No. Observations:,10,AIC:,-566.4
Df Residuals:,8,BIC:,-565.8
Df Model:,1,,
Covariance Type:,nonrobust,,

0,1,2,3,4,5,6
,coef,std err,t,P>|t|,[0.025,0.975]
const,-0.0414,2.73e-16,-1.52e+14,0.000,-0.041,-0.041
X1,2.8307,8.17e-15,3.46e+14,0.000,2.831,2.831
X2,0.1719,4.11e-15,4.18e+13,0.000,0.172,0.172
X3,1.1728,2.76e-15,4.24e+14,0.000,1.173,1.173
X4,0.8113,2.73e-15,2.98e+14,0.000,0.811,0.811
X5,1.4154,4.09e-15,3.46e+14,0.000,1.415,1.415

0,1,2,3
Omnibus:,2.321,Durbin-Watson:,0.107
Prob(Omnibus):,0.313,Jarque-Bera (JB):,1.541
Skew:,0.844,Prob(JB):,0.463
Kurtosis:,2.078,Cond. No.,7.8e+18


3. **Продолжение с отбором факторов и оценки модели**  
Продолжим с фильтрации значимых факторов, корреляции и оценки адекватности модели:

In [5]:
# Уровень значимости, заданный пользователем
alpha = 0.05
significant_factors = model.pvalues[model.pvalues < alpha]
print("Значимые факторы по уровню значимости:")
display(significant_factors)

# Корреляция между факторами и откликом
correlation_matrix = data.corr()
print("Корреляционная матрица:")
display(correlation_matrix)

# Извлечение корреляции отклика y с факторами
y_correlations = correlation_matrix['y'].drop('y')
print("Корреляция отклика y с факторами:")
display(y_correlations)

# Коэффициент детерминации (R²)
r_squared = model.rsquared
print(f"Коэффициент детерминации (R²): {r_squared:.3f}")

# Проверка статистической значимости модели (F-статистика)
f_pvalue = model.f_pvalue
if f_pvalue < alpha:
    print("Модель адекватна (статистически значима).")
else:
    print("Модель неадекватна (не статистически значима).")


Значимые факторы по уровню значимости:


const    3.976729e-111
X1       5.399889e-114
X2       1.194761e-106
X3       1.067046e-114
X4       1.816065e-113
X5       5.399889e-114
dtype: float64

Корреляционная матрица:


Unnamed: 0,Time,y,X1,X2,X3,X4,X5
Time,1.0,1.0,1.0,1.0,1.0,1.0,1.0
y,1.0,1.0,1.0,1.0,1.0,1.0,1.0
X1,1.0,1.0,1.0,1.0,1.0,1.0,1.0
X2,1.0,1.0,1.0,1.0,1.0,1.0,1.0
X3,1.0,1.0,1.0,1.0,1.0,1.0,1.0
X4,1.0,1.0,1.0,1.0,1.0,1.0,1.0
X5,1.0,1.0,1.0,1.0,1.0,1.0,1.0


Корреляция отклика y с факторами:


Time    1.0
X1      1.0
X2      1.0
X3      1.0
X4      1.0
X5      1.0
Name: y, dtype: float64

Коэффициент детерминации (R²): 1.000
Модель адекватна (статистически значима).


4. **Вычисление ошибки (RMSE)**

In [6]:
import numpy as np

# RMSE
predicted_y = model.predict(X)
rmse = np.sqrt(((y - predicted_y) ** 2).mean())
print(f"Среднеквадратичная ошибка (RMSE): {rmse:.3f}")


Среднеквадратичная ошибка (RMSE): 0.000


**Прогнозирование на новых данных**

Создаем новый набор данных для прогнозирования. Этот набор содержит значения факторов, которые не входят в исходные данные, и мы будем использовать модель для предсказания отклика y.

In [7]:
# Новый набор данных для прогнозирования
new_data = pd.DataFrame({
    'X1': [3.2, 3.8],
    'X2': [2.8, 3.2],
    'X3': [1.5, 1.6],
    'X4': [4.1, 4.3],
    'X5': [2.2, 2.4]
})
new_data = sm.add_constant(new_data)

# Прогнозирование
y_pred_new = model.predict(new_data)
print("Предсказанные значения:", y_pred_new)


Предсказанные значения: 0    17.697609
1    20.027428
dtype: float64


    **Сохранение результатов в текстовый файл**

В завершение сохраняем все результаты анализа в текстовый файл для удобного просмотра и отчетности.

In [27]:
with open('results.txt', 'w') as f:
    f.write(str(model.summary()))
    f.write(f"\nОшибка E = {E}")
    f.write(f"\nRMSE = {RMSE}")
    f.write(f"\nПредсказанные значения:\n{y_pred_new}")
