In [3]:
import urllib.request
import datetime
import os
import pandas as pd


Функці для завантаження VHI даних

In [21]:
def download_vhi_data():
    for i in range(1, 29):  
        url = f"https://www.star.nesdis.noaa.gov/smcd/emb/vci/VH/get_TS_admin.php?country=UKR&provinceID={i}&year1=1981&year2=2024&type=Mean"
        print(f"Крок {i}: Формую URL для області {i}: {url}")
        
        
        data_sign = datetime.datetime.now().strftime("%Y%m%d%H%M%S")
        filename = f"VHI_{i}_{data_sign}.csv"
        
        if not os.path.exists(filename):
            print(f"Крок {i}:Файл не існує.")
            try:
                response = urllib.request.urlopen(url)
                my_data = response.read()
                print(f"Крок {i}: Дані успішно завантажені.")
                
                with open(filename, "wb") as file:
                    file.write(my_data)
                print(f"Крок {i}: Файл збережено: {filename}")
            except Exception as e:
                print(f"Крок {i}: Помилка при завантаженні даних: {e}")
        else:
            print(f"Крок {i}: Файл {filename} вже існує.")
            
download_vhi_data()



Крок 1: Формую URL для області 1: https://www.star.nesdis.noaa.gov/smcd/emb/vci/VH/get_TS_admin.php?country=UKR&provinceID=1&year1=1981&year2=2024&type=Mean
Крок 1:Файл не існує.
Крок 1: Дані успішно завантажені.
Крок 1: Файл збережено: VHI_1_20250410125832.csv
Крок 2: Формую URL для області 2: https://www.star.nesdis.noaa.gov/smcd/emb/vci/VH/get_TS_admin.php?country=UKR&provinceID=2&year1=1981&year2=2024&type=Mean
Крок 2:Файл не існує.
Крок 2: Дані успішно завантажені.
Крок 2: Файл збережено: VHI_2_20250410125833.csv
Крок 3: Формую URL для області 3: https://www.star.nesdis.noaa.gov/smcd/emb/vci/VH/get_TS_admin.php?country=UKR&provinceID=3&year1=1981&year2=2024&type=Mean
Крок 3:Файл не існує.
Крок 3: Дані успішно завантажені.
Крок 3: Файл збережено: VHI_3_20250410125834.csv
Крок 4: Формую URL для області 4: https://www.star.nesdis.noaa.gov/smcd/emb/vci/VH/get_TS_admin.php?country=UKR&provinceID=4&year1=1981&year2=2024&type=Mean
Крок 4:Файл не існує.
Крок 4: Дані успішно завантажені.
К

Зчитуєсо CSV-файлі у DataFrame   

In [25]:
def load_data_to_dataframe():
    headers = ['Year', 'Week', 'SMN', 'SMT', 'VCI', 'TCI', 'VHI', 'empty']
    
    files = [file for file in os.listdir() if file.endswith(".csv")]
    df_list = []
    
    for file in files:
        df = pd.read_csv(file, header=1, names=headers) 
        df = df.drop(columns=['empty'], errors='ignore')
        df = df.drop(df[df['VHI'] == -1].index)  
        df['area'] = files.index(file) + 1  
        df_list.append(df)
    
    df = pd.concat(df_list, ignore_index=True)
    return df



In [56]:
df = load_data_to_dataframe()
print(df)

                Year  Week    SMN     SMT    VCI    TCI    VHI  area
0      <tt><pre>1982   1.0  0.059  258.24  51.11  48.78  49.95     1
1               1982   2.0  0.063  261.53  55.89  38.20  47.04     1
2               1982   3.0  0.063  263.45  57.30  32.69  44.99     1
3               1982   4.0  0.061  265.10  53.96  28.62  41.29     1
4               1982   5.0  0.058  266.42  46.87  28.57  37.72     1
...              ...   ...    ...     ...    ...    ...    ...   ...
61231           2024  49.0  0.133  277.08  57.71  10.86  34.29    28
61232           2024  50.0  0.130  276.49  59.45   8.68  34.07    28
61233           2024  51.0  0.128  276.45  62.53   5.55  34.04    28
61234           2024  52.0  0.129  276.48  66.13   3.71  34.92    28
61235    </pre></tt>   NaN    NaN     NaN    NaN    NaN    NaN    28

[61236 rows x 8 columns]


Замінюємо індекси

In [54]:
def update_area_indexes(df):
    index_map = {
        1: 'Вінницька', 2: 'Волинська', 3: 'Дніпропетровська', 4: 'Донецька',
        5: 'Житомирська', 6: 'Закарпатська', 7: 'Запорізька', 8: 'Івано-Франківська',
        9: 'Київська', 10: 'Кіровоградська', 11: 'Луганська', 12: 'Львівська',
        13: 'Миколаївська', 14: 'Одеська', 15: 'Полтавська', 16: 'Рівенська',
        17: 'Сумська', 18: 'Тернопільська', 19: 'Харківська', 20: 'Херсонська',
        21: 'Хмельницька', 22: 'Черкаська', 23: 'Чернівецька', 24: 'Чернігівська',
        25: 'Республіка Крим'
    }

    print(f"Unique area values before mapping: {df['area'].unique()}")
    
    df["area"] = df["area"].map(index_map)

    
    return df


In [57]:
df = update_area_indexes(df)
print(df)

Unique area values before mapping: [ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
 25 26 27 28]
                Year  Week    SMN     SMT    VCI    TCI    VHI       area
0      <tt><pre>1982   1.0  0.059  258.24  51.11  48.78  49.95  Вінницька
1               1982   2.0  0.063  261.53  55.89  38.20  47.04  Вінницька
2               1982   3.0  0.063  263.45  57.30  32.69  44.99  Вінницька
3               1982   4.0  0.061  265.10  53.96  28.62  41.29  Вінницька
4               1982   5.0  0.058  266.42  46.87  28.57  37.72  Вінницька
...              ...   ...    ...     ...    ...    ...    ...        ...
61231           2024  49.0  0.133  277.08  57.71  10.86  34.29        NaN
61232           2024  50.0  0.130  276.49  59.45   8.68  34.07        NaN
61233           2024  51.0  0.128  276.45  62.53   5.55  34.04        NaN
61234           2024  52.0  0.129  276.48  66.13   3.71  34.92        NaN
61235    </pre></tt>   NaN    NaN     NaN    NaN    NaN    NaN  

Отримаємо ряд VHI для області та року

In [None]:
def get_vhi_for_year(df, area_name, year):
    print(f"VHI для області {area_name} у {year} році:")
    result = df[(df["area"] == area_name) & (df["Year"] == year)][["Week", "VHI"]]
    return result  




In [63]:
vhi_for_year = get_vhi_for_year(df, 'Вінницька', '1982')
print(vhi_for_year)




Ряд VHI для області Вінницька у 1982 році:
    Week    VHI
1    2.0  47.04
2    3.0  44.99
3    4.0  41.29
4    5.0  37.72
5    6.0  34.91
6    7.0  33.14
7    8.0  32.72
8    9.0  32.77
9   10.0  32.23
10  11.0  30.38
11  12.0  31.12
12  13.0  31.65
13  14.0  32.61
14  15.0  35.49
15  16.0  39.19
16  17.0  41.14
17  18.0  39.50
18  19.0  37.07
19  20.0  37.88
20  21.0  40.99
21  22.0  43.36
22  23.0  45.31
23  24.0  46.30
24  25.0  48.85
25  26.0  50.88
26  27.0  51.83
27  28.0  51.68
28  29.0  51.61
29  30.0  49.93
30  31.0  46.00
31  32.0  43.56
32  33.0  41.20
33  34.0  38.42
34  35.0  39.22
35  36.0  39.13
36  37.0  37.25
37  38.0  36.38
38  39.0  35.99
39  40.0  34.87
40  41.0  29.96
41  42.0  28.16
42  43.0  27.39
43  44.0  25.05
44  45.0  23.80
45  46.0  22.82
46  47.0  24.41
47  48.0  27.34
48  49.0  28.53
49  50.0  27.87
50  51.0  29.83
51  52.0  31.99


Шукаємо екстремуми (min, max, avg, median)

In [64]:
def analyze_vhi_extremes(df, area_name, year):
    data = df[(df["area"] == area_name) & (df["Year"] == year)]["VHI"]
    print(f"Статистика для {area_name} у {year} році:")
    print(f"Мінімум: {data.min()}")
    print(f"Максимум: {data.max()}")
    print(f"Середнє: {data.mean():.2f}")
    print(f"Медіана: {data.median()}")


In [65]:
analyze_vhi_extremes(df, 'Одеська', '2010')

Статистика для Одеська у 2010 році:
Мінімум: 40.61
Максимум: 67.25
Середнє: 52.76
Медіана: 52.55


Ряд VHI за діапазон років

In [66]:
def get_vhi_range(df, area_name, year_start, year_end):
    result = df[(df["area"] == area_name) & (df["Year"].between(year_start, year_end))][["Year", "Week", "VHI"]]
    display(result)


In [67]:
get_vhi_range(df, 'Івано-Франківська', '2005', '2010')


Unnamed: 0,Year,Week,VHI
16456,2005,1.0,51.15
16457,2005,2.0,50.31
16458,2005,3.0,48.75
16459,2005,4.0,46.95
16460,2005,5.0,45.68
...,...,...,...
16762,2010,48.0,50.83
16763,2010,49.0,51.73
16764,2010,50.0,50.61
16765,2010,51.0,47.62


Виявляємо екстремальні посухі

In [73]:
def detect_extreme_drought_years(df, percent_threshold=0.2):
    drought_df = df[df["VHI"] <= 15]
    
    if drought_df.empty:
        print("Немає даних про екстремальні посухи (VHI <= 15).")
        return [], pd.DataFrame()
    
    grouped = drought_df.groupby(["Year", "area"]).size().reset_index(name="drought_weeks")
    
    drought_years = grouped.groupby("Year").count()
    
    threshold = int(25 * percent_threshold)
    print(f"Поріг для порівняння: {threshold} областей.")
    
    affected_years = drought_years[drought_years["area"] > threshold].index.tolist()

    affected_data = grouped[grouped["Year"].isin(affected_years)]
    
    if affected_years:
        print(f"Роки з екстремальними посухами (> {threshold} областей): {affected_years}")
    else:
        print("Не знайдено років, де більше ніж 5 областей постраждали від екстремальних посух.")
    
    return affected_years, affected_data





In [74]:
affected_years, affected_data = detect_extreme_drought_years(df)
print(affected_years)
print(affected_data)

Поріг для порівняння: 5 областей.
Не знайдено років, де більше ніж 5 областей постраждали від екстремальних посух.
[]
Empty DataFrame
Columns: [Year, area, drought_weeks]
Index: []
