## ДЗ 1 (ОБЯЗАТЕЛЬНОЕ): Анализ температурных данных и мониторинг текущей температуры через OpenWeatherMap API

**Описание задания:**  
Вы аналитик в компании, занимающейся изучением климатических изменений и мониторингом температур в разных городах. Вам нужно провести анализ исторических данных о температуре для выявления сезонных закономерностей и аномалий. Также необходимо подключить API OpenWeatherMap для получения текущей температуры в выбранных городах и сравнить её с историческими данными.


### Цели задания:
1. Провести **анализ временных рядов**, включая:
   - Вычисление скользящего среднего и стандартного отклонения для сглаживания температурных колебаний.
   - Определение аномалий на основе отклонений температуры от $ \text{скользящее среднее} \pm 2\sigma $.
   - Построение долгосрочных трендов изменения температуры.
   - Любые дополнительные исследования будут вам в плюс.

2. Осуществить **мониторинг текущей температуры**:
   - Получить текущую температуру через OpenWeatherMap API.
   - Сравнить её с историческим нормальным диапазоном для текущего сезона.

3. Разработать **интерактивное приложение**:
   - Дать пользователю возможность выбрать город.
   - Отобразить результаты анализа температур, включая временные ряды, сезонные профили и аномалии.
   - Провести анализ текущей температуры в контексте исторических данных.


### Описание данных
Исторические данные о температуре содержатся в файле `temperature_data.csv`, включают:
  - `city`: Название города.
  - `timestamp`: Дата (с шагом в 1 день).
  - `temperature`: Среднесуточная температура (в °C).
  - `season`: Сезон года (зима, весна, лето, осень).

Код для генерации файла вы найдете ниже.

### Этапы выполнения

1. **Анализ исторических данных**:
   - Вычислить **скользящее среднее** температуры с окном в 30 дней для сглаживания краткосрочных колебаний.
   - Рассчитать среднюю температуру и стандартное отклонение для каждого сезона в каждом городе.
   - Выявить аномалии, где температура выходит за пределы $ \text{среднее} \pm 2\sigma $.
   - Попробуйте распараллелить проведение этого анализа. Сравните скорость выполнения анализа с распараллеливанием и без него.

2. **Мониторинг текущей температуры**:
   - Подключить OpenWeatherMap API для получения текущей температуры города. Для получения API Key (бесплатно) надо зарегистрироваться на сайте. Обратите внимание, что API Key может активироваться только через 2-3 часа, это нормально. Посему получите ключ заранее.
   - Получить текущую температуру для выбранного города через OpenWeatherMap API.
   - Определить, является ли текущая температура нормальной, исходя из исторических данных для текущего сезона.
   - Данные на самом деле не совсем реальные (сюрпрайз). Поэтому на момент эксперимента погода в Берлине, Каире и Дубае была в рамках нормы, а в Пекине и Москве аномальная. Протестируйте свое решение для разных городов.
   - Попробуйте для получения текущей температуры использовать синхронные и асинхронные методы. Что здесь лучше использовать?

3. **Создание приложения на Streamlit**:
   - Добавить интерфейс для загрузки файла с историческими данными.
   - Добавить интерфейс для выбора города (из выпадающего списка).
   - Добавить форму для ввода API-ключа OpenWeatherMap. Когда он не введен, данные для текущей погоды не показываются. Если ключ некорректный, выведите на экран ошибку (должно приходить `{"cod":401, "message": "Invalid API key. Please see https://openweathermap.org/faq#error401 for more info."}`).
   - Отобразить:
     - Описательную статистику по историческим данным для города, можно добавить визуализации.
     - Временной ряд температур с выделением аномалий (например, точками другого цвета).
     - Сезонные профили с указанием среднего и стандартного отклонения.
   - Вывести текущую температуру через API и указать, нормальна ли она для сезона.

### Критерии оценивания

- Корректное проведение анализа данных – 1 балл.
- Исследование распараллеливания анализа – 1 балл.
- Корректный поиск аномалий – 1 балл.
- Подключение к API и корректность выполнения запроса – 1 балл.
- Проведение эксперимента с синхронным и асинхронным способом запроса к API – 1 балл.
- Создание интерфейса приложения streamlit в соответствии с описанием – 3 балла.
- Корректное отображение графиков и статистик, а также сезонных профилей – 1 балл.
- Корректный вывод текущей температуры в выбранном городе и проведение проверки на ее аномальность – 1 балл.
- Любая дополнительная функциональность приветствуется и оценивается бонусными баллами (не более 2 в сумме) на усмотрение проверяющего.

### Формат сдачи домашнего задания

Решение нужно развернуть в Streamlit Cloud (бесплатно)

*   Создаем новый репозиторий на GitHub.  
*   Загружаем проект.
*   Создаем аккаунт в [Streamlit Cloud](https://streamlit.io/cloud).
*   Авторизуемся в Streamlit Cloud.
*   Создаем новое приложение в Streamlit Cloud и подключаем GitHub-репозиторий.
*   Deploy!

Сдать в форму необходимо:
1. Ссылку на развернутое в Streamlit Cloud приложение.
2. Ссылку на код. Все выводы про, например, использование параллельности/асинхронности опишите в комментариях.

Не забудьте удалить ключ API и иную чувствительную информацию.

### Полезные ссылки
*   [Оформление задачи Титаник на Streamlit](https://github.com/evgpat/streamlit_demo)
*   [Документация Streamlit](https://docs.streamlit.io/)
*   [Блог о Streamlit](https://blog.streamlit.io/)

In [None]:
import pandas as pd
import numpy as np

# Реальные средние температуры (примерные данные) для городов по сезонам
seasonal_temperatures = {
    "New York": {"winter": 0, "spring": 10, "summer": 25, "autumn": 15},
    "London": {"winter": 5, "spring": 11, "summer": 18, "autumn": 12},
    "Paris": {"winter": 4, "spring": 12, "summer": 20, "autumn": 13},
    "Tokyo": {"winter": 6, "spring": 15, "summer": 27, "autumn": 18},
    "Moscow": {"winter": -10, "spring": 5, "summer": 18, "autumn": 8},
    "Sydney": {"winter": 12, "spring": 18, "summer": 25, "autumn": 20},
    "Berlin": {"winter": 0, "spring": 10, "summer": 20, "autumn": 11},
    "Beijing": {"winter": -2, "spring": 13, "summer": 27, "autumn": 16},
    "Rio de Janeiro": {"winter": 20, "spring": 25, "summer": 30, "autumn": 25},
    "Dubai": {"winter": 20, "spring": 30, "summer": 40, "autumn": 30},
    "Los Angeles": {"winter": 15, "spring": 18, "summer": 25, "autumn": 20},
    "Singapore": {"winter": 27, "spring": 28, "summer": 28, "autumn": 27},
    "Mumbai": {"winter": 25, "spring": 30, "summer": 35, "autumn": 30},
    "Cairo": {"winter": 15, "spring": 25, "summer": 35, "autumn": 25},
    "Mexico City": {"winter": 12, "spring": 18, "summer": 20, "autumn": 15},
}

# Сопоставление месяцев с сезонами
month_to_season = {12: "winter", 1: "winter", 2: "winter",
                   3: "spring", 4: "spring", 5: "spring",
                   6: "summer", 7: "summer", 8: "summer",
                   9: "autumn", 10: "autumn", 11: "autumn"}

# Генерация данных о температуре
def generate_realistic_temperature_data(cities, num_years=10):
    dates = pd.date_range(start="2010-01-01", periods=365 * num_years, freq="D")
    data = []

    for city in cities:
        for date in dates:
            season = month_to_season[date.month]
            mean_temp = seasonal_temperatures[city][season]
            # Добавляем случайное отклонение
            temperature = np.random.normal(loc=mean_temp, scale=5)
            data.append({"city": city, "timestamp": date, "temperature": temperature})

    df = pd.DataFrame(data)
    df['season'] = df['timestamp'].dt.month.map(lambda x: month_to_season[x])
    return df

# Генерация данных
data = generate_realistic_temperature_data(list(seasonal_temperatures.keys()))
data.to_csv('temperature_data.csv', index=False)

# 1. Анализ исторических данных

Вычислить скользящее среднее температуры с окном в 30 дней для сглаживания краткосрочных колебаний.

Рассчитать среднюю температуру и стандартное отклонение для каждого сезона в каждом городе.

Выявить аномалии, где температура выходит за пределы  среднее±2σ.

Попробуйте распараллелить проведение этого анализа. Сравните скорость выполнения анализа с распараллеливанием и без него.

In [None]:
import pandas as pd
import numpy as np
from multiprocessing import Pool
import time

import warnings
warnings.filterwarnings('ignore')

In [None]:
# Загрузка данных
data = pd.read_csv("temperature_data.csv")
data['timestamp'] = pd.to_datetime(data['timestamp'])
data = data.sort_values(by=['city', 'timestamp'])

In [None]:
# Функция для анализа одного города
def analyze_city(city_data):
    # Вычисление скользящего среднего
    city_data['rolling_mean'] = city_data['temperature'].rolling(window=30, min_periods=1).mean()

    # Расчет средней температуры и стандартного отклонения по сезонам
    stats = city_data.groupby('season')['temperature'].agg(['mean', 'std']).reset_index()

    # Выявление аномалий
    city_data = city_data.merge(stats, on='season', how='left')
    city_data['is_anomaly'] = (city_data['temperature'] < (city_data['mean'] - 2 * city_data['std'])) | \
                              (city_data['temperature'] > (city_data['mean'] + 2 * city_data['std']))
    return city_data

In [None]:
# Распараллеливание анализа
cities = data['city'].unique()
city_data = [data[data['city'] == city] for city in cities]

start_parallel = time.time()
with Pool() as pool:
    results = pool.map(analyze_city, city_data)
processed_data_parallel = pd.concat(results)
end_parallel = time.time()

In [None]:
# Последовательный анализ
start_sequential = time.time()
processed_data_sequential = pd.concat([analyze_city(data[data['city'] == city]) for city in cities])
end_sequential = time.time()

In [None]:
# Вывод времени выполнения
print("Время выполнения (распараллеливание):", end_parallel - start_parallel, "сек")
print("Время выполнения (последовательно):", end_sequential - start_sequential, "сек")

Время выполнения (распараллеливание): 0.28670740127563477 сек
Время выполнения (последовательно): 0.28431177139282227 сек


In [None]:
# Пример проверки данных
processed_data_parallel.head()

Unnamed: 0,city,timestamp,temperature,season,rolling_mean,mean,std,is_anomaly
0,Beijing,2010-01-01,-5.281976,winter,-5.281976,-1.992485,5.081199,False
1,Beijing,2010-01-02,-1.391355,winter,-3.336666,-1.992485,5.081199,False
2,Beijing,2010-01-03,-4.641946,winter,-3.771759,-1.992485,5.081199,False
3,Beijing,2010-01-04,-8.620139,winter,-4.983854,-1.992485,5.081199,False
4,Beijing,2010-01-05,12.645134,winter,-1.458057,-1.992485,5.081199,True


In [None]:
processed_data_sequential.head()

Unnamed: 0,city,timestamp,temperature,season,rolling_mean,mean,std,is_anomaly
0,Beijing,2010-01-01,-5.281976,winter,-5.281976,-1.992485,5.081199,False
1,Beijing,2010-01-02,-1.391355,winter,-3.336666,-1.992485,5.081199,False
2,Beijing,2010-01-03,-4.641946,winter,-3.771759,-1.992485,5.081199,False
3,Beijing,2010-01-04,-8.620139,winter,-4.983854,-1.992485,5.081199,False
4,Beijing,2010-01-05,12.645134,winter,-1.458057,-1.992485,5.081199,True


In [None]:
processed_data_sequential.to_csv('result.csv')

# 2. Осуществить мониторинг текущей температуры

In [None]:
import requests
import pandas as pd
from datetime import datetime
import aiohttp
import asyncio
import time

In [None]:
def get_current_temperature(city, api_key):
    """
    Получить текущую температуру для заданного города через OpenWeatherMap API (синхронно)
    """
    url = "http://api.openweathermap.org/data/2.5/weather"
    params = {
        "q": city,
        "units": "metric",
        "appid": api_key
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        data = response.json()
        return data["main"]["temp"]
    else:
        print(f"Ошибка при получении данных для города {city}: {response.status_code}")
        return None


async def get_current_temperature_async(city, api_key):
    """
    Получить текущую температуру для заданного города через OpenWeatherMap API (асинхронно)
    """
    url = "http://api.openweathermap.org/data/2.5/weather"
    params = {
        "q": city,
        "units": "metric",
        "appid": api_key
    }
    async with aiohttp.ClientSession() as session:
        async with session.get(url, params=params) as response:
            if response.status == 200:
                data = await response.json()
                return data["main"]["temp"]
            else:
                print(f"Ошибка при получении данных для города {city}: {response.status}")
                return None


def get_current_season(date):
    """
    Определить текущий сезон на основе месяца
    """
    month = date.month
    if month in [12, 1, 2]:
        return "winter"
    elif month in [3, 4, 5]:
        return "spring"
    elif month in [6, 7, 8]:
        return "summer"
    else:
        return "autumn"


def compare_with_historical(city, current_temp, season, historical_data):
    """
    Сравнить текущую температуру с нормальным диапазоном для данного сезона
    """
    city_season_data = historical_data[(historical_data["city"] == city) & (historical_data["season"] == season)]
    if not city_season_data.empty:
        mean_temp = city_season_data["mean"].values[0]
        std_temp = city_season_data["std"].values[0]
        lower_bound = mean_temp - 2 * std_temp
        upper_bound = mean_temp + 2 * std_temp

        if lower_bound <= current_temp <= upper_bound:
            return f"Температура {current_temp}°C в городе {city} является нормальной для сезона {season}."
        else:
            return f"Температура {current_temp}°C в городе {city} аномальна для сезона {season}!"
    else:
        return f"Нет исторических данных для города {city} и сезона {season}."

In [28]:
API_KEY = "83158d6579e25f85a631c47027c8b64a"
cities = ["Moscow", "Berlin", "Cairo", "Dubai", "Beijing"]  # Города для мониторинга

# Синхронное получение температуры
start_sync = time.time()
for city in cities:
    current_temp = get_current_temperature(city, API_KEY)
    if current_temp is not None:
        current_date = datetime.now()
        current_season = get_current_season(current_date)

        # Используем предварительно обработанные исторические данные
        historical_data = processed_data_parallel.groupby(["city", "season"]).agg(
            mean=("temperature", "mean"),
            std=("temperature", "std")
        ).reset_index()

        result = compare_with_historical(city, current_temp, current_season, historical_data)
        print(result)
end_sync = time.time()
print(f"Синхронное выполнение заняло: {end_sync - start_sync:.2f} секунд")

# Асинхронное выполнение температуры
async def async_main():
    start_async = time.time()
    tasks = [get_current_temperature_async(city, API_KEY) for city in cities]
    temperatures = await asyncio.gather(*tasks)

    for city, current_temp in zip(cities, temperatures):
        if current_temp is not None:
            current_date = datetime.now()
            current_season = get_current_season(current_date)

            # Используем предварительно обработанные исторические данные
            historical_data = processed_data_parallel.groupby(["city", "season"]).agg(
                mean=("temperature", "mean"),
                std=("temperature", "std")
            ).reset_index()

            result = compare_with_historical(city, current_temp, current_season, historical_data)
            print(result)
    end_async = time.time()
    print(f"Асинхронное выполнение заняло: {end_async - start_async:.2f} секунд")

# Для запуска в Google Colab
import nest_asyncio
nest_asyncio.apply()

await async_main()

Температура -0.52°C в городе Moscow является нормальной для сезона winter.
Температура 1.04°C в городе Berlin является нормальной для сезона winter.
Температура 18.42°C в городе Cairo является нормальной для сезона winter.
Температура 22.96°C в городе Dubai является нормальной для сезона winter.
Температура -7.06°C в городе Beijing является нормальной для сезона winter.
Синхронное выполнение заняло: 0.51 секунд
Температура -0.52°C в городе Moscow является нормальной для сезона winter.
Температура 1.04°C в городе Berlin является нормальной для сезона winter.
Температура 18.42°C в городе Cairo является нормальной для сезона winter.
Температура 22.96°C в городе Dubai является нормальной для сезона winter.
Температура -7.06°C в городе Beijing является нормальной для сезона winter.
Асинхронное выполнение заняло: 0.19 секунд


# Создание приложения на Streamlit

In [None]:
import streamlit as st
import pandas as pd
import requests
from datetime import datetime
import matplotlib.pyplot as plt


# Функция для определения сезона
def get_current_season(date):
    month = date.month
    if month in [12, 1, 2]:
        return "winter"
    elif month in [3, 4, 5]:
        return "spring"
    elif month in [6, 7, 8]:
        return "summer"
    else:
        return "autumn"


# Функция для получения текущей температуры через OpenWeatherMap API
def get_current_temperature(city, api_key):
    url = "http://api.openweathermap.org/data/2.5/weather"
    params = {
        "q": city,
        "units": "metric",
        "appid": api_key
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        data = response.json()
        return data["main"]["temp"], None
    elif response.status_code == 401:
        return None, "Invalid API key"
    else:
        return None, f"Error: {response.status_code}"


# Функция для сравнения текущей температуры с историческими данными
def compare_with_historical(city, current_temp, season, historical_data):
    city_season_data = historical_data[(historical_data["city"] == city) & (historical_data["season"] == season)]
    if not city_season_data.empty:
        mean_temp = city_season_data["temperature"].mean()
        std_temp = city_season_data["temperature"].std()
        lower_bound = mean_temp - 2 * std_temp
        upper_bound = mean_temp + 2 * std_temp

        if lower_bound <= current_temp <= upper_bound:
            return f"Температура {current_temp}°C является нормальной для сезона {season}.", "normal"
        else:
            return f"Температура {current_temp}°C аномальна для сезона {season}!", "anomalous"
    else:
        return "Нет исторических данных для выбранного города и сезона.", "no_data"


# Интерфейс Streamlit
st.title("Приложение для анализа температур")

# Загрузка файла с историческими данными
uploaded_file = st.file_uploader("Загрузите файл с историческими данными (CSV):")
if uploaded_file is not None:
    historical_data = pd.read_csv(uploaded_file)
    historical_data["timestamp"] = pd.to_datetime(historical_data["timestamp"])
    historical_data["season"] = historical_data["timestamp"].apply(get_current_season)

    # Выбор города
    cities = historical_data["city"].unique()
    selected_city = st.selectbox("Выберите город:", cities)

    # Отображение описательной статистики
    city_data = historical_data[historical_data["city"] == selected_city]
    st.subheader(f"Описательная статистика для {selected_city}")
    st.write(city_data.describe())

    # Построение временного ряда
    st.subheader("Временной ряд температур с выделением аномалий")
    city_data["rolling_mean"] = city_data["temperature"].rolling(window=30).mean()
    mean = city_data["temperature"].mean()
    std = city_data["temperature"].std()
    city_data["is_anomaly"] = (city_data["temperature"] < (mean - 2 * std)) | \
                              (city_data["temperature"] > (mean + 2 * std))

    plt.figure(figsize=(10, 6))
    plt.plot(city_data["timestamp"], city_data["temperature"], label="Температура")
    plt.scatter(city_data["timestamp"][city_data["is_anomaly"]],
                city_data["temperature"][city_data["is_anomaly"]],
                color="red", label="Аномалии")
    plt.plot(city_data["timestamp"], city_data["rolling_mean"], label="Скользящее среднее", linestyle="--")
    plt.legend()
    plt.xlabel("Дата")
    plt.ylabel("Температура (°C)")
    plt.title(f"Температурный ряд для {selected_city}")
    st.pyplot(plt)

    # Построение сезонных профилей
    st.subheader("Сезонные профили температур")
    seasonal_stats = city_data.groupby("season")["temperature"].agg(["mean", "std"])
    st.bar_chart(seasonal_stats)

    # Ввод API-ключа
    api_key = st.text_input("Введите API-ключ OpenWeatherMap:")
    if api_key:
        current_temp, error = get_current_temperature(selected_city, api_key)
        if error:
            st.error(error)
        elif current_temp is not None:
            current_date = datetime.now()
            current_season = get_current_season(current_date)
            result, status = compare_with_historical(selected_city, current_temp, current_season, historical_data)
            st.subheader("Текущая температура")
            st.write(f"Текущая температура в городе {selected_city}: {current_temp}°C")
            st.write(result)
else:
    st.info("Пожалуйста, загрузите файл с историческими данными.")
