## ДЗ 1 (ОБЯЗАТЕЛЬНОЕ): Анализ температурных данных и мониторинг текущей температуры через OpenWeatherMap API

**Описание задания:**  
Вы аналитик в компании, занимающейся изучением климатических изменений и мониторингом температур в разных городах. Вам нужно провести анализ исторических данных о температуре для выявления сезонных закономерностей и аномалий. Также необходимо подключить API OpenWeatherMap для получения текущей температуры в выбранных городах и сравнить её с историческими данными.


### Цели задания:
1. Провести **анализ временных рядов**, включая:
   - Вычисление скользящего среднего и стандартного отклонения для сглаживания температурных колебаний.
   - Определение аномалий на основе отклонений температуры от $ \text{скользящее среднее} \pm 2\sigma $.
   - Построение долгосрочных трендов изменения температуры.
   - Любые дополнительные исследования будут вам в плюс.

2. Осуществить **мониторинг текущей температуры**:
   - Получить текущую температуру через OpenWeatherMap API.
   - Сравнить её с историческим нормальным диапазоном для текущего сезона.

3. Разработать **интерактивное приложение**:
   - Дать пользователю возможность выбрать город.
   - Отобразить результаты анализа температур, включая временные ряды, сезонные профили и аномалии.
   - Провести анализ текущей температуры в контексте исторических данных.


### Описание данных
Исторические данные о температуре содержатся в файле `temperature_data.csv`, включают:
  - `city`: Название города.
  - `timestamp`: Дата (с шагом в 1 день).
  - `temperature`: Среднесуточная температура (в °C).
  - `season`: Сезон года (зима, весна, лето, осень).

Код для генерации файла вы найдете ниже.

### Этапы выполнения

1. **Анализ исторических данных**:
   - Вычислить **скользящее среднее** температуры с окном в 30 дней для сглаживания краткосрочных колебаний.
   - Рассчитать среднюю температуру и стандартное отклонение для каждого сезона в каждом городе.
   - Выявить аномалии, где температура выходит за пределы $ \text{среднее} \pm 2\sigma $.
   - Попробуйте распараллелить проведение этого анализа. Сравните скорость выполнения анализа с распараллеливанием и без него.

2. **Мониторинг текущей температуры**:
   - Подключить OpenWeatherMap API для получения текущей температуры города. Для получения API Key (бесплатно) надо зарегистрироваться на сайте. Обратите внимание, что API Key может активироваться только через 2-3 часа, это нормально. Посему получите ключ заранее.
   - Получить текущую температуру для выбранного города через OpenWeatherMap API.
   - Определить, является ли текущая температура нормальной, исходя из исторических данных для текущего сезона.
   - Данные на самом деле не совсем реальные (сюрпрайз). Поэтому на момент эксперимента погода в Берлине, Каире и Дубае была в рамках нормы, а в Пекине и Москве аномальная. Протестируйте свое решение для разных городов.
   - Попробуйте для получения текущей температуры использовать синхронные и асинхронные методы. Что здесь лучше использовать?

3. **Создание приложения на Streamlit**:
   - Добавить интерфейс для загрузки файла с историческими данными.
   - Добавить интерфейс для выбора города (из выпадающего списка).
   - Добавить форму для ввода API-ключа OpenWeatherMap. Когда он не введен, данные для текущей погоды не показываются. Если ключ некорректный, выведите на экран ошибку (должно приходить `{"cod":401, "message": "Invalid API key. Please see https://openweathermap.org/faq#error401 for more info."}`).
   - Отобразить:
     - Описательную статистику по историческим данным для города, можно добавить визуализации.
     - Временной ряд температур с выделением аномалий (например, точками другого цвета).
     - Сезонные профили с указанием среднего и стандартного отклонения.
   - Вывести текущую температуру через API и указать, нормальна ли она для сезона.

### Критерии оценивания

- Корректное проведение анализа данных – 1 балл.
- Исследование распараллеливания анализа – 1 балл.
- Корректный поиск аномалий – 1 балл.
- Подключение к API и корректность выполнения запроса – 1 балл.
- Проведение эксперимента с синхронным и асинхронным способом запроса к API – 1 балл.
- Создание интерфейса приложения streamlit в соответствии с описанием – 3 балла.
- Корректное отображение графиков и статистик, а также сезонных профилей – 1 балл.
- Корректный вывод текущей температуры в выбранном городе и проведение проверки на ее аномальность – 1 балл.
- Любая дополнительная функциональность приветствуется и оценивается бонусными баллами (не более 2 в сумме) на усмотрение проверяющего.

### Формат сдачи домашнего задания

Решение нужно развернуть в Streamlit Cloud (бесплатно)

*   Создаем новый репозиторий на GitHub.  
*   Загружаем проект.
*   Создаем аккаунт в [Streamlit Cloud](https://streamlit.io/cloud).
*   Авторизуемся в Streamlit Cloud.
*   Создаем новое приложение в Streamlit Cloud и подключаем GitHub-репозиторий.
*   Deploy!

Сдать в форму необходимо:
1. Ссылку на развернутое в Streamlit Cloud приложение.
2. Ссылку на код. Все выводы про, например, использование параллельности/асинхронности опишите в комментариях.

Не забудьте удалить ключ API и иную чувствительную информацию.

### Полезные ссылки
*   [Оформление задачи Титаник на Streamlit](https://github.com/evgpat/streamlit_demo)
*   [Документация Streamlit](https://docs.streamlit.io/)
*   [Блог о Streamlit](https://blog.streamlit.io/)

In [26]:
import pandas as pd
import numpy as np

# Реальные средние температуры (примерные данные) для городов по сезонам
seasonal_temperatures = {
    "New York": {"winter": 0, "spring": 10, "summer": 25, "autumn": 15},
    "London": {"winter": 5, "spring": 11, "summer": 18, "autumn": 12},
    "Paris": {"winter": 4, "spring": 12, "summer": 20, "autumn": 13},
    "Tokyo": {"winter": 6, "spring": 15, "summer": 27, "autumn": 18},
    "Moscow": {"winter": -10, "spring": 5, "summer": 18, "autumn": 8},
    "Sydney": {"winter": 12, "spring": 18, "summer": 25, "autumn": 20},
    "Berlin": {"winter": 0, "spring": 10, "summer": 20, "autumn": 11},
    "Beijing": {"winter": -2, "spring": 13, "summer": 27, "autumn": 16},
    "Rio de Janeiro": {"winter": 20, "spring": 25, "summer": 30, "autumn": 25},
    "Dubai": {"winter": 20, "spring": 30, "summer": 40, "autumn": 30},
    "Los Angeles": {"winter": 15, "spring": 18, "summer": 25, "autumn": 20},
    "Singapore": {"winter": 27, "spring": 28, "summer": 28, "autumn": 27},
    "Mumbai": {"winter": 25, "spring": 30, "summer": 35, "autumn": 30},
    "Cairo": {"winter": 15, "spring": 25, "summer": 35, "autumn": 25},
    "Mexico City": {"winter": 12, "spring": 18, "summer": 20, "autumn": 15},
}

# Сопоставление месяцев с сезонами
month_to_season = {12: "winter", 1: "winter", 2: "winter",
                   3: "spring", 4: "spring", 5: "spring",
                   6: "summer", 7: "summer", 8: "summer",
                   9: "autumn", 10: "autumn", 11: "autumn"}

# Генерация данных о температуре
def generate_realistic_temperature_data(cities, num_years=10):
    dates = pd.date_range(start="2010-01-01", periods=365 * num_years, freq="D")
    data = []

    for city in cities:
        for date in dates:
            season = month_to_season[date.month]
            mean_temp = seasonal_temperatures[city][season]
            # Добавляем случайное отклонение
            temperature = np.random.normal(loc=mean_temp, scale=5)
            data.append({"city": city, "timestamp": date, "temperature": temperature})

    df = pd.DataFrame(data)
    df['season'] = df['timestamp'].dt.month.map(lambda x: month_to_season[x])
    return df

# Генерация данных
data = generate_realistic_temperature_data(list(seasonal_temperatures.keys()))
data.to_csv('temperature_data.csv', index=False)


## Анализ исторических данных:

In [27]:
import pandas as pd

data = pd.read_csv("/content/temperature_data.csv")

In [28]:
df = data.copy()
df["timestamp"] = pd.to_datetime(df["timestamp"])

### Вычислить скользящее среднее температуры с окном в 30 дней для сглаживания краткосрочных колебаний.

In [29]:
df["mov_aver_temp_30"] = df.groupby("city")["temperature"].transform(lambda x: x.rolling(window=30).mean())
df.head(5)

Unnamed: 0,city,timestamp,temperature,season,mov_aver_temp_30
0,New York,2010-01-01,-7.993162,winter,
1,New York,2010-01-02,-1.106362,winter,
2,New York,2010-01-03,-0.890816,winter,
3,New York,2010-01-04,-1.968388,winter,
4,New York,2010-01-05,3.706578,winter,


### Рассчитать среднюю температуру и стандартное отклонение для каждого сезона в каждом городе.

In [30]:
# средняя температура для каждого сезона в каждом городе
df["av_temp_season_city"] = df.groupby(["city", "season"])["temperature"].transform(lambda x: x.mean())
df.head(5)

Unnamed: 0,city,timestamp,temperature,season,mov_aver_temp_30,av_temp_season_city
0,New York,2010-01-01,-7.993162,winter,,-0.162924
1,New York,2010-01-02,-1.106362,winter,,-0.162924
2,New York,2010-01-03,-0.890816,winter,,-0.162924
3,New York,2010-01-04,-1.968388,winter,,-0.162924
4,New York,2010-01-05,3.706578,winter,,-0.162924


In [31]:
# стандартное отклонение для каждого сезона в каждом городе
df["std_season_city"] = df.groupby(["season", "city"])["temperature"].transform(lambda x: x.std())
df.head(5)

Unnamed: 0,city,timestamp,temperature,season,mov_aver_temp_30,av_temp_season_city,std_season_city
0,New York,2010-01-01,-7.993162,winter,,-0.162924,4.913228
1,New York,2010-01-02,-1.106362,winter,,-0.162924,4.913228
2,New York,2010-01-03,-0.890816,winter,,-0.162924,4.913228
3,New York,2010-01-04,-1.968388,winter,,-0.162924,4.913228
4,New York,2010-01-05,3.706578,winter,,-0.162924,4.913228


### Выявить аномалии, где температура выходит за пределы  среднее±2σ .

In [32]:
df["temp_up_limit"] = df["av_temp_season_city"] + 2 * df["std_season_city"]
df["temp_down_limit"] = df["av_temp_season_city"] - 2 * df["std_season_city"]
df["is_anomale"] = (df["temperature"] > df["temp_up_limit"] ) | (df["temperature"] < df["temp_down_limit"])
df[df["is_anomale"] == True].head(5)

Unnamed: 0,city,timestamp,temperature,season,mov_aver_temp_30,av_temp_season_city,std_season_city,temp_up_limit,temp_down_limit,is_anomale
12,New York,2010-01-13,-10.831935,winter,,-0.162924,4.913228,9.663532,-9.98938,True
38,New York,2010-02-08,10.087682,winter,0.135483,-0.162924,4.913228,9.663532,-9.98938,True
42,New York,2010-02-12,11.585385,winter,0.653859,-0.162924,4.913228,9.663532,-9.98938,True
60,New York,2010-03-02,21.300185,spring,1.812476,9.920307,5.057453,20.035214,-0.194599,True
96,New York,2010-04-07,-0.262744,spring,9.33291,9.920307,5.057453,20.035214,-0.194599,True


## Мониторинг текущей температуры:

### Подключить OpenWeatherMap API для получения текущей температуры города. Для получения API Key (бесплатно) надо зарегистрироваться на сайте. Обратите внимание, что API Key может активироваться только через 2-3 часа, это нормально. Посему получите ключ заранее.

In [33]:
API_KEY = "da896315ea22ae56bf396661494f76de" # ВАШ ключ

In [34]:
URL="https://api.openweathermap.org/data/2.5/weather" # адрес запроса

### Получить текущую температуру для выбранного города через OpenWeatherMap API.

In [40]:
import requests

city_name = "New York" # название города

def get_current_temp(city_name):
    '''
    Функция делает запрос к апи, полученный ответ содержит
    текущую температуру в укзанном городе.
    Параметры:
        city_name - название города для которого хотим узнать температуру
        appid - ключ
        units - metric  -- указание единиц измерения (Цельсий)
    '''

    params={
        "q": city_name,
        "appid": API_KEY,
        'units': 'metric'
    }

    current_temp = requests.get(url=URL, params=params).json()["main"]["temp"]
    return current_temp

print(get_current_temp(city_name))

5.42


### Определить, является ли текущая температура нормальной, исходя из исторических данных для текущего сезона.

In [41]:
current_season = "winter"

def is_normal(city_name, current_temp):
    '''
    Функция сравниет текущую температуру с порогами верхним и нижним,
    и на основе этого возвращает либо True - температура нормальная,
    либо False - температура аномальная
    Параметры:
        city_name - название города
        current_temp - текущая температура
    '''
    limit_up = df[(df["city"] == city_name) & (df["season"] == current_season)]["temp_up_limit"].iloc[0] # верхний порог
    limit_down = df[(df["city"] == city_name) & (df["season"] == current_season)]["temp_down_limit"].iloc[0] # нижний порог
    return (current_temp < limit_up) or (current_temp > limit_down) #возвращает True если температура нормальная

print(is_normal(city_name, get_current_temp(city_name)))

True


Температура является нормальной, исходя из исторических данных для текущего сезона

### Данные на самом деле не совсем реальные (сюрпрайз). Поэтому на момент эксперимента погода в Берлине, Каире и Дубае была в рамках нормы, а в Пекине и Москве аномальная. Протестируйте свое решение для разных городов.

In [42]:
cities = seasonal_temperatures.keys() # список всех городов

temp = []
normal = []

for city in cities:
    cur_temp = get_current_temp(city)
    temp.append(cur_temp)
    normal.append(is_normal(city, cur_temp))

In [43]:
pd.DataFrame({
    "city": cities,
    "cur_temp": temp,
    "is_norm": normal
})

Unnamed: 0,city,cur_temp,is_norm
0,New York,5.42,True
1,London,2.47,True
2,Paris,3.49,True
3,Tokyo,3.91,True
4,Moscow,-1.08,True
5,Sydney,20.72,True
6,Berlin,0.23,True
7,Beijing,-6.06,True
8,Rio de Janeiro,25.06,True
9,Dubai,22.96,True


### Попробуйте для получения текущей температуры использовать синхронные и асинхронные методы. Что здесь лучше использовать?

In [44]:
%%time
# асинхронный способ получения текущей температуры по всем городам
import asyncio
import aiohttp
import nest_asyncio

nest_asyncio.apply()

async def async_get_temp(session, city):
    params={
        "q": city,
        "appid": API_KEY,
        'units': 'metric'
    }
    async with session.get(URL, params=params) as response:
        temp = await response.json()
        print(temp["main"]["temp"], f" -- {city}")

async def main():
    async with aiohttp.ClientSession() as session:
        tasks = []
        for city in cities:
            tasks.append(async_get_temp(session, city))
        await asyncio.gather(*tasks)

asyncio.run(main())

-1.08  -- Moscow
17.42  -- Cairo
23.99  -- Mumbai
25.06  -- Rio de Janeiro
16.64  -- Mexico City
20.72  -- Sydney
23.2  -- Singapore
2.47  -- London
22.96  -- Dubai
0.23  -- Berlin
5.42  -- New York
-6.06  -- Beijing
18.51  -- Los Angeles
3.49  -- Paris
3.91  -- Tokyo
CPU times: user 101 ms, sys: 13 ms, total: 114 ms
Wall time: 405 ms


In [45]:
%%time
# сихронный способ получения текущей температуры по всем городам
for city in cities:
    print(get_current_temp(city), f" -- {city}")

5.42  -- New York
2.47  -- London
3.49  -- Paris
3.91  -- Tokyo
-1.08  -- Moscow
20.72  -- Sydney
0.23  -- Berlin
-6.06  -- Beijing
25.06  -- Rio de Janeiro
22.96  -- Dubai
18.51  -- Los Angeles
23.2  -- Singapore
23.99  -- Mumbai
17.42  -- Cairo
16.64  -- Mexico City
CPU times: user 173 ms, sys: 9.09 ms, total: 182 ms
Wall time: 4.87 s


Ясно видно, что асинхронный способ предпочтительнее. Он намного быстрее