<a href="https://colab.research.google.com/github/esb-index/Barka-AV/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# --- CPRI számítás: kétlépcsős, biztonságos feltöltés ---
import pandas as pd
import numpy as np
from google.colab import files
from sklearn.experimental import enable_iterative_imputer
from sklearn.impute import IterativeImputer
from sklearn.linear_model import BayesianRidge
import io

# Első lépés: feltöltés – vár mindkettőre
print("📂 1. lépés: töltsd fel a hazard fájlt (pl. ERA5_hazard_proxies_processed.xlsx)")
uploaded1 = files.upload()

print("\n✅ Hazard fájl megérkezett.")
hazard_filename = list(uploaded1.keys())[0]

print("\n📂 2. lépés: töltsd fel az asset fájlt (pl. Hungary_energy_assets_extended.xlsx)")
uploaded2 = files.upload()

print("\n✅ Asset fájl megérkezett.")
asset_filename = list(uploaded2.keys())[0]

# Ellenőrzés
print(f"\nMegkaptam mindkettőt:\n - Hazard: {hazard_filename}\n - Asset: {asset_filename}")

# --- Feldolgozás indítása gombnyomásra ---
input("\n🚀 Nyomj Entert, ha minden rendben és indulhat a feldolgozás...")

# --- Adatbeolvasás ---
hazard_df = pd.read_excel(io.BytesIO(uploaded1[hazard_filename]))
asset_df = pd.read_excel(io.BytesIO(uploaded2[asset_filename]))

print("✅ Fájlok beolvasva, imputáció indul...")

# --- MICE imputáció ---
imputer = IterativeImputer(estimator=BayesianRidge(), max_iter=10, random_state=0)
hazard_imputed = pd.DataFrame(imputer.fit_transform(hazard_df.select_dtypes(include=[np.number])),
                              columns=hazard_df.select_dtypes(include=[np.number]).columns)
hazard_df[hazard_imputed.columns] = hazard_imputed

# --- Normalizálás ---
hazard_norm = (hazard_df - hazard_df.min()) / (hazard_df.max() - hazard_df.min())
hazard_norm = hazard_norm.clip(0,1)

# --- Súlyozás (egyenlő súlyok most) ---
weights = np.ones(hazard_norm.shape[1]) / hazard_norm.shape[1]

# --- Aggregálás (weighted sum) ---
hazard_score = hazard_norm.dot(weights)

# --- Monte Carlo perturbáció ---
N = 10000
perturb = np.random.lognormal(mean=0, sigma=0.2, size=(N, len(weights)))
perturb = perturb / perturb.sum(axis=1, keepdims=True)
scores = hazard_norm.values.dot(perturb.T)
mean_score = np.mean(scores, axis=1)
low, high = np.percentile(scores, [5,95], axis=1)

results = pd.DataFrame({
    "Asset": asset_df.iloc[:,0],
    "Mean_Score": mean_score,
    "Low_5": low,
    "High_95": high
})

# --- Eredmény mentése ---
outname = "CPRI_Hungary_2000_2022_results.xlsx"
results.to_excel(outname, index=False)
print(f"\n✅ Számítás kész! Eredmény: {outname}")

# Letöltés
files.download(outname)


📂 1. lépés: töltsd fel a hazard fájlt (pl. ERA5_hazard_proxies_processed.xlsx)


Saving ERA5_hazard_proxies_processed.xlsx to ERA5_hazard_proxies_processed.xlsx

✅ Hazard fájl megérkezett.

📂 2. lépés: töltsd fel az asset fájlt (pl. Hungary_energy_assets_extended.xlsx)


Saving Hungary_energy_assets_extended.xlsx to Hungary_energy_assets_extended.xlsx

✅ Asset fájl megérkezett.

Megkaptam mindkettőt:
 - Hazard: ERA5_hazard_proxies_processed.xlsx
 - Asset: Hungary_energy_assets_extended.xlsx

🚀 Nyomj Entert, ha minden rendben és indulhat a feldolgozás...
✅ Fájlok beolvasva, imputáció indul...


ValueError: array length 23 does not match index length 30

In [None]:
# --- Hibajavított aggregálás és összepárosítás ---

# Minden assethez rendelünk hazard-score-t név alapján
hazard_df["Asset"] = asset_df.iloc[:len(hazard_df), 0].values  # ha van név, hozzárendeljük

# MICE imputáció után normalizálás (ismét)
hazard_num = hazard_df.select_dtypes(include=[np.number])
hazard_norm = (hazard_num - hazard_num.min()) / (hazard_num.max() - hazard_num.min())
hazard_norm = hazard_norm.clip(0, 1)

# Súlyok, aggregálás
weights = np.ones(hazard_norm.shape[1]) / hazard_norm.shape[1]
hazard_score = hazard_norm.dot(weights)

# Monte Carlo (10k)
N = 10000
perturb = np.random.lognormal(mean=0, sigma=0.2, size=(N, len(weights)))
perturb = perturb / perturb.sum(axis=1, keepdims=True)
scores = hazard_norm.values.dot(perturb.T)

mean_score = np.mean(scores, axis=1)
low, high = np.percentile(scores, [5, 95], axis=1)

# Most biztonságosan párosítjuk az asseteket
results = pd.DataFrame({
    "Asset": hazard_df["Asset"],
    "Mean_Score": mean_score,
    "Low_5": low,
    "High_95": high
})

# Ha kevesebb hazard adat van, a maradék assetet nullával feltöltjük
missing_assets = asset_df[~asset_df.iloc[:,0].isin(results["Asset"])]
if not missing_assets.empty:
    add = pd.DataFrame({
        "Asset": missing_assets.iloc[:,0],
        "Mean_Score": [np.nan]*len(missing_assets),
        "Low_5": [np.nan]*len(missing_assets),
        "High_95": [np.nan]*len(missing_assets)
    })
    results = pd.concat([results, add], ignore_index=True)

# Mentés
outname = "CPRI_Hungary_2000_2022_results_fixed.xlsx"
results.to_excel(outname, index=False)
print(f"\n✅ Kész! A fájl neve: {outname}")

from google.colab import files
files.download(outname)



✅ Kész! A fájl neve: CPRI_Hungary_2000_2022_results_fixed.xlsx


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>