### Отримання метеорологічних даних від NOAA

Завантажуємо CSV файл з сайту https://www.ncdc.noaa.gov/cag/

Посилання на файл:
https://www.ncei.noaa.gov/access/monitoring/climate-at-a-glance/city/time-series/USH00305801/tavg/1/1/1895-2022.csv?base_prd=true&begbaseyear=1991&endbaseyear=2020

В файлі знаходяться дані січневих температур Нью-Йорка починаючи з 1895 року

Прибираємо зайві стовпці і рядки, називаємо стовпці відповідними іменами

In [None]:
import pandas as pd

temperatures = pd.read_csv("https://www.ncei.noaa.gov/access/monitoring/climate-at-a-glance/city/time-series/USH00305801/tavg/1/1/1895-2022.csv?base_prd=true&begbaseyear=1991&endbaseyear=2020",
                           usecols=[0, 1, 2],
                            names=["Date", "Temperature", "Anomaly"],
                            skiprows=5,
                           )
temperatures.head()


### Обробка даних

Оскільки дати знаходяться в форматі YYYYMM, то приберемо з них місяць, оскільки відомо, що вони всі січні

In [None]:
temperatures.Date = temperatures.Date.floordiv(100)
temperatures.head()

### Прогнози на 2019-2022 роки

Спрогнозуємо температуру на 2019-2022 роки за допомогою регресійної прямої, для цього використаємо бібліотеку scipy, яка містить функцію stats.linregress:

In [None]:
from scipy import stats

linear_regression = stats.linregress(temperatures.Date, temperatures.Temperature)

Цей об'єкт містить в собі дві змінні: slope та intercept, які відповідають коефіцієнтам прямої m та b в рівнянні прямої

$$ y=mx+b $$

Визначимо функцію, яка буде приймати рік і повертати прогнозовану температуру

In [None]:
def predict(year):
    return linear_regression.slope * year + linear_regression.intercept

# Predicted temperatures for the 2019-2022
print({year: predict(year) for year in range(2019, 2023)})

#### Припущення за 1890 рік

In [None]:
print({1890: predict(1890)})

### Візуалізація даних

Побудуємо регресійну пряму, що представляє графік зміни обраних показників за період 1895-2022 років.

In [None]:
import seaborn as sns

sns.set_style("whitegrid")

plot = sns.regplot(x="Date", y="Temperature", data=temperatures, line_kws={"color": "green"})

plot.figure.canvas.draw()

### Масштабування

Відобразимо дані в іншому масштабі, щоб краще бачити зміни температури і нахил прямої

In [None]:
plot = sns.regplot(x="Date", y="Temperature", data=temperatures, line_kws={"color": "green"})
plot.set_ylim(0, 60)