#Линейный тренд

Задача:

1. Рассчитать основные статистические оценки.
2. Построить график линии тренда (линейная аппроксимация) для каждой станции.
3. Проанализировать и сравнить результаты, полученные для разных участков Балтийского моря.


In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

In [None]:
# Загрузка данных из CSV-файла
df = pd.read_csv("Baltic Sea 1991-2000.csv", sep=";", header=0)

In [None]:
# Определение количества дней
n_days = len(df)

In [None]:
# Создание массива с номерами дней, где сумма всех номеров равна 0
days = np.arange(-(n_days // 2), (n_days // 2) + 1) if n_days % 2 != 0 else np.arange(-(n_days // 2), (n_days // 2))
summa = np.add.reduce(days**2, dtype=np.int64)

In [None]:
# Добавление нового столбца в DataFrame
df['Day'] = days

In [None]:
# Расчет основных статистических оценок
df_stats = df.drop(columns=['Day']).describe()
print(df_stats)

In [None]:
strings = np.arange(len(df))

In [None]:
# Построение линии тренда для каждой станции
stations = ['Near Yantarnii', 'Near SPB', 'Near Finland']
for station in stations:
    # Используем новый столбец 'Day' для оси x
    x = df['Day'].values
    y = df[station].values

    # Вычисление коэффициентов линейной регрессии
    a0 = np.sum(y) / len(df)
    a1 = np.sum(x * y) / summa

    # Построение линии тренда
    plt.figure(figsize=(10, 6))
    plt.plot(strings, y, label='Средняя температура')
    plt.plot(strings, a1 * x + a0, label='Линия тренда', color='orange')
    plt.title(f'Температура в районе {station}')
    plt.xlabel('День')
    plt.ylabel('Средняя температура')
    plt.legend()
    plt.show()

    # Вывод уравнения линии тренда
    print(f'Уравнение линии тренда для {station}:')
    print(f'{a1:.5f}x + {a0:.5f}')

    # Анализ тенденций
    if a1 > 0:
        print(f'Наблюдается положительная тенденция в районе {station}, температура повышается.')
    elif a1 < 0:
        print(f'Наблюдается отрицательная тенденция в районе {station}, температура понижается.')
    else:
        print(f'В районе {station} отсутствует выраженная тенденция, температура стабильна.')

    print('-' * 30)
