**Закрытый API - экономическая свобода стран**

In [29]:
!pip install -q knoema


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m25.1.1[0m[39;49m -> [0m[32;49m25.3[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip3 install --upgrade pip[0m


In [30]:
import sys, os
sys.path.append(os.path.join(os.getcwd(), "log"))

from my_logger import setup_logging, get_logger
setup_logging()
log = get_logger("knoema_data")

In [31]:
import knoema
import pandas as pd

knoema.app_id = "C2lyoUE"
knoema.app_secret = "2wLTUyzrqt26uw"

DATASET = "HFWSJIEF2016" # dataset ID - определили через внутренний код на сайте
log.info(f"Загрузка датасета {DATASET} с Knoema")

In [32]:
try:
    df = knoema.get(DATASET, Indicator="Overall Score")
    log.info(f"Данные успешно получены: {df.shape[0]} строк, {df.shape[1]} столбцов")
except Exception as e:
    log.error(f"Ошибка при получении данных из Knoema: {e}")
    df = pd.DataFrame()

if isinstance(df.columns, pd.MultiIndex):
    log.info("Найдены многоуровневые названия колонок - выполняется объединение уровней")
    df.columns = [" | ".join([str(x) for x in col if str(x) != ""]) for col in df.columns]
# проходим по каждому многоуровневому кортежа
# превращаем каждый элемент кортежа в строку и убираем пустые значения
# объединяем уровни в одну строку через разделитель

else:
    df.columns = [str(c) for c in df.columns]

value_cols = [c for c in df.columns if "Overall Score" in c]

In [33]:
idx_name = df.index.name or "Time" # преобразование значения индекса в дату, извлекаем только год
years = pd.to_datetime(df.index, errors="coerce").year
df_wide = df[value_cols].copy()
df_wide.insert(0, "heritage_year", years)

# с помощью melt() получаем страны как строки, которые раньше были столбцами
long = df_wide.melt(id_vars = "heritage_year",
                    var_name = "col",
                    value_name = "economic_freedom_score")

log.info("df_wide с добавленным столбцом heritage_year")

# "Country - Overall Score - A"
parts = long["col"].str.split(" \\| ", n=2, expand=True)
long["country"] = parts[0]
# первая часть = "Overall Score" - нужно оставить, вторую часть не учитываем и не берем
long = long.drop(columns=["col"])

In [34]:
long["heritage_year"] = pd.to_numeric(long["heritage_year"], errors="coerce")
long["economic_freedom_score"] = pd.to_numeric(long["economic_freedom_score"], errors="coerce")
long = long.dropna(subset=["economic_freedom_score", "heritage_year", "country"])

log.info(f"Осталось {len(long)} с непустыми значениями")

# берём последнее доступное значение на страну
df_latest = (long.sort_values(["country","heritage_year"])
                  .drop_duplicates("country", keep="last")
                  .sort_values("country")
                  .reset_index(drop=True)
                  [["country","heritage_year","economic_freedom_score"]])

log.info(f"df_latest создан: {df_latest.shape[0]} строк, {df_latest.shape[1]} столбцов")

In [35]:
df_latest.to_csv("heritage_index_knoema.csv", index=False)