# Группировка данных о погоде

### Импорт библиотеки

In [23]:
import pandas as pd

### Загрузка данных

In [24]:
df = pd.read_csv("Weather_new.csv", index_col=False, sep=';')

### Обработка даты

In [25]:
df['RRR'] = df['RRR'].replace(['Осадков нет','Следы осадков'], 0).astype(float)
df['Дата'] = pd.to_datetime(df['Дата'], dayfirst=True)
df = df.select_dtypes(exclude=['object'])
df = df.drop(columns=['ff10', 'ff3', 'VV', 'Td', 'tR', 'Tg'])

### Создание группировки по месяцам

In [26]:
df['Год-Месяц-День'] = df['Дата'].dt.to_period('d')

In [27]:
df.columns

Index(['Дата', 'T', 'Po', 'P', 'Pa', 'U', 'Ff', 'Tn', 'Tx', 'RRR',
       'Год-Месяц-День'],
      dtype='object')

### Агрегация данных

In [28]:
grouped = df.groupby('Год-Месяц-День').agg({
    'Tx': 'max',
    'Tn': 'min',
    'T': 'mean',
    'RRR': 'sum',
    'U': 'mean',
    'P': 'mean',
    'Po': 'mean',
    'Ff': 'mean'
}).reset_index()

### Преобразование периода в строку

In [30]:
grouped['Год-Месяц-День'] = grouped['Год-Месяц-День'].astype(str)

### Сохранение и вывод

In [32]:
grouped.to_csv("weather_grouped_daily_new.csv", index=False)
print(f"Данные успешно обработаны. Результат сохранен в {"weather_grouped_daily_new.csv"}")
print(f"Обработано {len(grouped)} дней данных")

Данные успешно обработаны. Результат сохранен в weather_grouped_daily_new.csv
Обработано 3654 дней данных
