## ДЗ 1 (ОБЯЗАТЕЛЬНОЕ): Анализ температурных данных и мониторинг текущей температуры через OpenWeatherMap API

**Описание задания:**  
Вы аналитик в компании, занимающейся изучением климатических изменений и мониторингом температур в разных городах. Вам нужно провести анализ исторических данных о температуре для выявления сезонных закономерностей и аномалий. Также необходимо подключить API OpenWeatherMap для получения текущей температуры в выбранных городах и сравнить её с историческими данными.


### Цели задания:
1. Провести **анализ временных рядов**, включая:
   - Вычисление скользящего среднего и стандартного отклонения для сглаживания температурных колебаний.
   - Определение аномалий на основе отклонений температуры от $ \text{скользящее среднее} \pm 2\sigma $.
   - Построение долгосрочных трендов изменения температуры.
   - Любые дополнительные исследования будут вам в плюс.

2. Осуществить **мониторинг текущей температуры**:
   - Получить текущую температуру через OpenWeatherMap API.
   - Сравнить её с историческим нормальным диапазоном для текущего сезона.

3. Разработать **интерактивное приложение**:
   - Дать пользователю возможность выбрать город.
   - Отобразить результаты анализа температур, включая временные ряды, сезонные профили и аномалии.
   - Провести анализ текущей температуры в контексте исторических данных.


### Описание данных
Исторические данные о температуре содержатся в файле `temperature_data.csv`, включают:
  - `city`: Название города.
  - `timestamp`: Дата (с шагом в 1 день).
  - `temperature`: Среднесуточная температура (в °C).
  - `season`: Сезон года (зима, весна, лето, осень).

Код для генерации файла вы найдете ниже.

### Этапы выполнения

1. **Анализ исторических данных**:
   - Вычислить **скользящее среднее** температуры с окном в 30 дней для сглаживания краткосрочных колебаний.
   - Рассчитать среднюю температуру и стандартное отклонение для каждого сезона в каждом городе.
   - Выявить аномалии, где температура выходит за пределы $ \text{среднее} \pm 2\sigma $.
   - Попробуйте распараллелить проведение этого анализа. Сравните скорость выполнения анализа с распараллеливанием и без него.

2. **Мониторинг текущей температуры**:
   - Подключить OpenWeatherMap API для получения текущей температуры города. Для получения API Key (бесплатно) надо зарегистрироваться на сайте. Обратите внимание, что API Key может активироваться только через 2-3 часа, это нормально. Посему получите ключ заранее.
   - Получить текущую температуру для выбранного города через OpenWeatherMap API.
   - Определить, является ли текущая температура нормальной, исходя из исторических данных для текущего сезона.
   - Данные на самом деле не совсем реальные (сюрпрайз). Поэтому на момент эксперимента погода в Берлине, Каире и Дубае была в рамках нормы, а в Пекине и Москве аномальная. Протестируйте свое решение для разных городов.
   - Попробуйте для получения текущей температуры использовать синхронные и асинхронные методы. Что здесь лучше использовать?

3. **Создание приложения на Streamlit**:
   - Добавить интерфейс для загрузки файла с историческими данными.
   - Добавить интерфейс для выбора города (из выпадающего списка).
   - Добавить форму для ввода API-ключа OpenWeatherMap. Когда он не введен, данные для текущей погоды не показываются. Если ключ некорректный, выведите на экран ошибку (должно приходить `{"cod":401, "message": "Invalid API key. Please see https://openweathermap.org/faq#error401 for more info."}`).
   - Отобразить:
     - Описательную статистику по историческим данным для города, можно добавить визуализации.
     - Временной ряд температур с выделением аномалий (например, точками другого цвета).
     - Сезонные профили с указанием среднего и стандартного отклонения.
   - Вывести текущую температуру через API и указать, нормальна ли она для сезона.

### Критерии оценивания

- Корректное проведение анализа данных – 1 балл.
- Исследование распараллеливания анализа – 1 балл.
- Корректный поиск аномалий – 1 балл.
- Подключение к API и корректность выполнения запроса – 1 балл.
- Проведение эксперимента с синхронным и асинхронным способом запроса к API – 1 балл.
- Создание интерфейса приложения streamlit в соответствии с описанием – 3 балла.
- Корректное отображение графиков и статистик, а также сезонных профилей – 1 балл.
- Корректный вывод текущей температуры в выбранном городе и проведение проверки на ее аномальность – 1 балл.
- Любая дополнительная функциональность приветствуется и оценивается бонусными баллами (не более 2 в сумме) на усмотрение проверяющего.

### Формат сдачи домашнего задания

Решение нужно развернуть в Streamlit Cloud (бесплатно)

*   Создаем новый репозиторий на GitHub.  
*   Загружаем проект.
*   Создаем аккаунт в [Streamlit Cloud](https://streamlit.io/cloud).
*   Авторизуемся в Streamlit Cloud.
*   Создаем новое приложение в Streamlit Cloud и подключаем GitHub-репозиторий.
*   Deploy!

Сдать в форму необходимо:
1. Ссылку на развернутое в Streamlit Cloud приложение.
2. Ссылку на код. Все выводы про, например, использование параллельности/асинхронности опишите в комментариях.

Не забудьте удалить ключ API и иную чувствительную информацию.

### Полезные ссылки
*   [Оформление задачи Титаник на Streamlit](https://github.com/evgpat/streamlit_demo)
*   [Документация Streamlit](https://docs.streamlit.io/)
*   [Блог о Streamlit](https://blog.streamlit.io/)

In [1]:
import pandas as pd
import numpy as np
import time
import concurrent.futures
from sklearn.linear_model import LinearRegression
import warnings
warnings.filterwarnings('ignore')
import requests
import aiohttp
from datetime import datetime

In [2]:
# Реальные средние температуры (примерные данные) для городов по сезонам
seasonal_temperatures = {
    "New York": {"winter": 0, "spring": 10, "summer": 25, "autumn": 15},
    "London": {"winter": 5, "spring": 11, "summer": 18, "autumn": 12},
    "Paris": {"winter": 4, "spring": 12, "summer": 20, "autumn": 13},
    "Tokyo": {"winter": 6, "spring": 15, "summer": 27, "autumn": 18},
    "Moscow": {"winter": -10, "spring": 5, "summer": 18, "autumn": 8},
    "Sydney": {"winter": 12, "spring": 18, "summer": 25, "autumn": 20},
    "Berlin": {"winter": 0, "spring": 10, "summer": 20, "autumn": 11},
    "Beijing": {"winter": -2, "spring": 13, "summer": 27, "autumn": 16},
    "Rio de Janeiro": {"winter": 20, "spring": 25, "summer": 30, "autumn": 25},
    "Dubai": {"winter": 20, "spring": 30, "summer": 40, "autumn": 30},
    "Los Angeles": {"winter": 15, "spring": 18, "summer": 25, "autumn": 20},
    "Singapore": {"winter": 27, "spring": 28, "summer": 28, "autumn": 27},
    "Mumbai": {"winter": 25, "spring": 30, "summer": 35, "autumn": 30},
    "Cairo": {"winter": 15, "spring": 25, "summer": 35, "autumn": 25},
    "Mexico City": {"winter": 12, "spring": 18, "summer": 20, "autumn": 15},
}

# Сопоставление месяцев с сезонами
month_to_season = {12: "winter", 1: "winter", 2: "winter",
                   3: "spring", 4: "spring", 5: "spring",
                   6: "summer", 7: "summer", 8: "summer",
                   9: "autumn", 10: "autumn", 11: "autumn"}

# Генерация данных о температуре
def generate_realistic_temperature_data(cities, num_years=10):
    dates = pd.date_range(start="2010-01-01", periods=365 * num_years, freq="D")
    data = []

    for city in cities:
        for date in dates:
            season = month_to_season[date.month]
            mean_temp = seasonal_temperatures[city][season]
            # Добавляем случайное отклонение
            temperature = np.random.normal(loc=mean_temp, scale=5)
            data.append({"city": city, "timestamp": date, "temperature": temperature})

    df = pd.DataFrame(data)
    df['season'] = df['timestamp'].dt.month.map(lambda x: month_to_season[x])
    return df

# Генерация данных
data = generate_realistic_temperature_data(list(seasonal_temperatures.keys()))
data.to_csv('temperature_data.csv', index=False)


In [3]:
data.head()

Unnamed: 0,city,timestamp,temperature,season
0,New York,2010-01-01,-5.935926,winter
1,New York,2010-01-02,3.196601,winter
2,New York,2010-01-03,6.441794,winter
3,New York,2010-01-04,-3.928996,winter
4,New York,2010-01-05,0.065011,winter


In [4]:
data.city.unique()

array(['New York', 'London', 'Paris', 'Tokyo', 'Moscow', 'Sydney',
       'Berlin', 'Beijing', 'Rio de Janeiro', 'Dubai', 'Los Angeles',
       'Singapore', 'Mumbai', 'Cairo', 'Mexico City'], dtype=object)

# Этап 1. Анализ исторических данных


   - Вычислить **скользящее среднее** температуры с окном в 30 дней для сглаживания краткосрочных колебаний.
   - Рассчитать среднюю температуру и стандартное отклонение для каждого сезона в каждом городе.
   - Выявить аномалии, где температура выходит за пределы $ \text{среднее} \pm 2\sigma $.
   - Попробуйте распараллелить проведение этого анализа. Сравните скорость выполнения анализа с распараллеливанием и без него.

In [25]:
def main_func(data):
    city = data['city'].iloc[0]

    # 1. рассчитываем скользящее среднее
    mean_rolling30 = data['temperature'].rolling(window=30).mean()
    std_rolling30 = data['temperature'].rolling(window=30).std()

    # 2. выявляем аномалии
    upper_bound = mean_rolling30 + 2 * std_rolling30
    lower_bound = mean_rolling30 - 2 * std_rolling30
    anomalies = data[(data['temperature'] > upper_bound) | 
                           (data['temperature'] < lower_bound)]
    all_anomalies = anomalies.index.tolist()

    # 3. делаем там же groupby по сезону и считаете mean и std для исходной температуры, чтобы получить профиль сезона
    season_profile = data.groupby('season')['temperature'].agg(['mean', 'std'])

    # 4. ищем тренд
    X = np.array(range(len(data))).reshape(-1, 1)
    y = data['temperature'].values
    lr_model = LinearRegression().fit(X, y)
    trend = "positive" if lr_model.coef_[0] > 0 else "negative"
    slope = lr_model.coef_[0]

    # 5. вычисляем среднюю, мин и макс температуру за всё время
    average_temp = data['temperature'].mean()
    min_temp = data['temperature'].min()
    max_temp = data['temperature'].max()

    return {
        "city": city,
        "average_temp": average_temp,
        "min_temp": min_temp,
        "min_temp": max_temp,
        "season_profile": season_profile.to_dict(),
        "trend": trend,
        "trend_slope": slope,
        "anomalies indexes": all_anomalies
    }

In [26]:
# все города
all_cities = list(data.city.unique())

#### Замеряем время работы функции БЕЗ параллельных вычислений

In [27]:
start_time = time.time()
original_res = []
for city in all_cities:
    original_res.append(main_func(data[data["city"] == city]))
end_time = time.time()
original_time = end_time - start_time
print("Время работы функции без параллельных вычислений: %s секунд" % round((original_time), 4))

Время работы функции без параллельных вычислений: 0.1171 секунд


In [28]:
original_res[0]

{'city': 'New York',
 'average_temp': 12.474279742999125,
 'min_temp': 39.49157120854954,
 'season_profile': {'mean': {'autumn': 14.87170061266731,
   'spring': 10.020355527465142,
   'summer': 24.94218691607518,
   'winter': -0.18629504848616124},
  'std': {'autumn': 4.932325990466357,
   'spring': 4.929778301612184,
   'summer': 5.130984435480831,
   'winter': 5.054471303736978}},
 'trend': 'positive',
 'trend_slope': 0.00028010327507109993,
 'anomalies indexes': [29,
  38,
  60,
  117,
  118,
  119,
  129,
  147,
  151,
  152,
  153,
  158,
  162,
  196,
  220,
  244,
  245,
  249,
  252,
  294,
  300,
  324,
  334,
  335,
  337,
  338,
  339,
  391,
  424,
  427,
  433,
  461,
  470,
  471,
  477,
  503,
  516,
  518,
  523,
  546,
  570,
  606,
  610,
  615,
  677,
  690,
  699,
  700,
  766,
  782,
  790,
  791,
  792,
  795,
  828,
  834,
  843,
  882,
  884,
  911,
  976,
  987,
  1065,
  1066,
  1068,
  1124,
  1134,
  1164,
  1172,
  1187,
  1189,
  1217,
  1221,
  1247,
  12

In [44]:
start_time = time.time()
parallel_res = []
with concurrent.futures.ThreadPoolExecutor() as executor:
    parallel_res = list(executor.map(main_func, [data[data["city"] == city] for city in all_cities]))
end_time = time.time()
parallel_time = end_time - start_time
print("Время работы функции c параллельными вычислениями: %s секунд" % round((parallel_time), 4))

Время работы функции c параллельными вычислениями: 0.0662 секунд


#### Вывод: с параллельными вычислениями функция работает быстрее

# Этап 2: Мониторинг текущей температуры

   - Подключить OpenWeatherMap API для получения текущей температуры города. Для получения API Key (бесплатно) надо зарегистрироваться на сайте. Обратите внимание, что API Key может активироваться только через 2-3 часа, это нормально. Посему получите ключ заранее.
   - Получить текущую температуру для выбранного города через OpenWeatherMap API.
   - Определить, является ли текущая температура нормальной, исходя из исторических данных для текущего сезона.
   - Данные на самом деле не совсем реальные (сюрпрайз). Поэтому на момент эксперимента погода в Берлине, Каире и Дубае была в рамках нормы, а в Пекине и Москве аномальная. Протестируйте свое решение для разных городов.
   - Попробуйте для получения текущей температуры использовать синхронные и асинхронные методы. Что здесь лучше использовать?

In [45]:
API_KEY = ...

In [46]:
# 1. получаем текущую температуру через OpenWeatherMap API (синхронно)
def get_current_temperature(city, api_key):
    url = "http://api.openweathermap.org/data/2.5/weather"
    params = {
        "q": city,
        "appid": api_key,
        "units": "metric"
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        data = response.json()
        return data["main"]["temp"]
    else:
        print(f"Ошибка: {response.status_code}, {response.json()}")
        return None

# 2. провеярем аномальность текущей температуры
def is_temperature_anomalous(current_temp, historical_data, season):
    season_data = historical_data[historical_data['season'] == season]
    mean_temp = season_data['temperature'].mean()
    std_temp = season_data['temperature'].std()

    lower_bound = mean_temp - 2 * std_temp
    upper_bound = mean_temp + 2 * std_temp

    print(f"Время года: {season}, Средняя температура: {mean_temp:.2f}, Стандартное отклонение: {std_temp:.2f}")
    print(f"Диапазон нормальной температуры: [{lower_bound:.2f}, {upper_bound:.2f}]")

    return not (lower_bound <= current_temp <= upper_bound)

In [47]:
current_temp = get_current_temperature(city, API_KEY)

for city in all_cities:
    if current_temp is not None:
        print(f"Текущая температура в {city}: {current_temp:.2f} °C")
        today = datetime.now()
        current_season = {12: "winter", 1: "winter", 2: "winter",
                        3: "spring", 4: "spring", 5: "spring",
                        6: "summer", 7: "summer", 8: "summer",
                        9: "autumn", 10: "autumn", 11: "autumn"}[today.month]

        anomalous = is_temperature_anomalous(current_temp, data[data['city'] == city], current_season)
        if anomalous:
            print(f"Текущая температура в {city} является аномальной для сезона {current_season}.")
        else:
            print(f"Текущая температура в {city} находится в пределах нормы для сезона {current_season}.")


Текущая температура в New York: 10.53 °C
Время года: winter, Средняя температура: -0.19, Стандартное отклонение: 5.05
Диапазон нормальной температуры: [-10.30, 9.92]
Текущая температура в New York является аномальной для сезона winter.
Текущая температура в London: 10.53 °C
Время года: winter, Средняя температура: 5.04, Стандартное отклонение: 4.89
Диапазон нормальной температуры: [-4.75, 14.82]
Текущая температура в London находится в пределах нормы для сезона winter.
Текущая температура в Paris: 10.53 °C
Время года: winter, Средняя температура: 4.01, Стандартное отклонение: 4.96
Диапазон нормальной температуры: [-5.90, 13.93]
Текущая температура в Paris находится в пределах нормы для сезона winter.
Текущая температура в Tokyo: 10.53 °C
Время года: winter, Средняя температура: 6.21, Стандартное отклонение: 5.19
Диапазон нормальной температуры: [-4.16, 16.59]
Текущая температура в Tokyo находится в пределах нормы для сезона winter.
Текущая температура в Moscow: 10.53 °C
Время года: win

### Асинхронная работа функции получения текущей температуры

In [48]:
async def get_current_temperature_async(city_name, api_key):
    url = "http://api.openweathermap.org/data/2.5/weather"
    params = {
        "q": city_name,
        "appid": api_key,
        "units": "metric"
    }

    try:
        async with aiohttp.ClientSession() as session:
            async with session.get(url, params=params, timeout=10) as response:
                response.raise_for_status()
                data = await response.json()
                return data['main']['temp']
    except aiohttp.ClientError as e:
        print(f"Ошибка для города {city_name}: {e}")
        return None

In [49]:
current_temp_async = await get_current_temperature_async(city, API_KEY)

for city in all_cities:
    if current_temp is not None:
        print(f"Текущая температура в {city}: {current_temp_async:.2f} °C")
        today = datetime.now()
        current_season = {12: "winter", 1: "winter", 2: "winter",
                        3: "spring", 4: "spring", 5: "spring",
                        6: "summer", 7: "summer", 8: "summer",
                        9: "autumn", 10: "autumn", 11: "autumn"}[today.month]

        anomalous = is_temperature_anomalous(current_temp_async, data[data['city'] == city], current_season)
        if anomalous:
            print(f"Текущая температура в {city} является аномальной для сезона {current_season}.")
        else:
            print(f"Текущая температура в {city} находится в пределах нормы для сезона {current_season}.")

Текущая температура в New York: 10.53 °C
Время года: winter, Средняя температура: -0.19, Стандартное отклонение: 5.05
Диапазон нормальной температуры: [-10.30, 9.92]
Текущая температура в New York является аномальной для сезона winter.
Текущая температура в London: 10.53 °C
Время года: winter, Средняя температура: 5.04, Стандартное отклонение: 4.89
Диапазон нормальной температуры: [-4.75, 14.82]
Текущая температура в London находится в пределах нормы для сезона winter.
Текущая температура в Paris: 10.53 °C
Время года: winter, Средняя температура: 4.01, Стандартное отклонение: 4.96
Диапазон нормальной температуры: [-5.90, 13.93]
Текущая температура в Paris находится в пределах нормы для сезона winter.
Текущая температура в Tokyo: 10.53 °C
Время года: winter, Средняя температура: 6.21, Стандартное отклонение: 5.19
Диапазон нормальной температуры: [-4.16, 16.59]
Текущая температура в Tokyo находится в пределах нормы для сезона winter.
Текущая температура в Moscow: 10.53 °C
Время года: win

# Этап 3. Создание приложения (в app.py)

- Добавить интерфейс для загрузки файла с историческими данными.
- Добавить интерфейс для выбора города (из выпадающего списка).
- Добавить форму для ввода API-ключа OpenWeatherMap. Когда он не введен, данные для текущей погоды не показываются. Если ключ некорректный, выведите на экран ошибку (должно приходить `{"cod":401, "message": "Invalid API key. Please see https://openweathermap.org/faq#error401 for more info."}`).
- Отобразить:
  - Описательную статистику по историческим данным для города, можно добавить визуализации.
  - Временной ряд температур с выделением аномалий (например, точками другого цвета).
  - Сезонные профили с указанием среднего и стандартного отклонения.
- Вывести текущую температуру через API и указать, нормальна ли она для сезона.