In [11]:
pip install rasterio numpy pandas tqdm pvlib geopandas shapely matplotlib openpyxl

Note: you may need to restart the kernel to use updated packages.


In [12]:
import numpy as np
import rasterio
from rasterio.vrt import WarpedVRT
import os

def calculate_slope_aspect(dem, transform):
    # ... (생략: 기존 구현 그대로)
    x, y = np.gradient(dem, 30, 30)
    slope = np.pi/2 - np.arctan(np.hypot(x, y))
    aspect = np.arctan2(-x, y)
    aspect = np.where(aspect < 0, 2*np.pi + aspect, aspect)
    return slope, aspect

def generate_hillshade_tifs(input_dem, slope_tif, aspect_tif, target_crs="EPSG:32652"):
    # 1) DEM → 가상 UTM(메모리 reprojection)
    with rasterio.open(input_dem) as src:
        vrt_params = {
            "crs": target_crs,
            "resampling": rasterio.enums.Resampling.bilinear,
            "resolution": (30, 30)
        }
        with WarpedVRT(src, **vrt_params) as vrt:
            dem = vrt.read(1).astype("float64")
            transform = vrt.transform

            # 2) slope, aspect 계산
            slope_rad, aspect_rad = calculate_slope_aspect(dem, transform)

            # 라디안 → 도 단위 변환
            slope_deg  = np.degrees(slope_rad)         # 0°~90°
            aspect_deg = np.degrees(aspect_rad) % 360  # 0°~360°

            # 이제 slope_deg, aspect_deg 를 GeoTIFF 로 저장하거나
            # 힐셰이드·분석 등에 바로 활용하세요.
            # 3) 메타데이터 준비 (driver만 GTiff 로 강제)
            meta = vrt.meta.copy()
            meta.update({
                "driver": "GTiff",     # ← 이 줄이 필수
                "dtype": "float32",
                "count": 1,
                "nodata": None
            })

            # 4) slope 저장
            with rasterio.open(slope_tif, "w", **meta) as dst:
                dst.write(slope_deg.astype("float32"), 1)

            # 5) aspect 저장
            with rasterio.open(aspect_tif, "w", **meta) as dst:
                dst.write(aspect_deg.astype("float32"), 1)

    print("완료: Slope & Aspect GeoTIFF 생성")

# 사용 예시
input_dem  = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Gangneung_Clip.tif"
slope_tif  = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Gangneung_Slope.tif"
aspect_tif = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Gangneung_Aspect.tif"
generate_hillshade_tifs(input_dem, slope_tif, aspect_tif)

RasterioIOError: C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Gangneung_Clip.tif: No such file or directory

In [None]:
import os
import numpy as np
import pandas as pd
import rasterio
from rasterio.transform import xy
from tqdm import tqdm
from datetime import datetime
from pvlib import solarposition

def calculate_slope_aspect(dem, transform):
    # 경사도(slope), 방향(aspect) 계산 (단위: 라디안)
    x, y = np.gradient(dem, 30, 30)  # 30m 해상도 기준
    slope = np.pi/2 - np.arctan(np.sqrt(x*x + y*y))
    aspect = np.arctan2(-x, y)
    aspect = np.where(aspect < 0, 2 * np.pi + aspect, aspect)
    return slope, aspect

def compute_hillshade(slope, aspect, azimuth_deg, altitude_deg):
    # 태양 방위각, 고도각 → 라디안 변환
    azimuth_rad = np.radians(azimuth_deg)
    altitude_rad = np.radians(altitude_deg)
    
    shaded = (np.sin(altitude_rad) * np.sin(slope) +
              np.cos(altitude_rad) * np.cos(slope) * np.cos(azimuth_rad - aspect))
    
    shaded = np.clip(shaded, 0, 1)  # 0~1 범위로 정리
    return shaded * 255  # 🎯 0~255 범위로 변환

def generate_hourly_hillshades(dem_path, solar_csv_path, output_dir):
    os.makedirs(output_dir, exist_ok=True)

    # DEM 로드
    with rasterio.open(dem_path) as dem_src:
        dem = dem_src.read(1)
        meta = dem_src.meta.copy()
        transform = dem_src.transform
    
    # slope & aspect 계산
    slope, aspect = calculate_slope_aspect(dem, transform)

    # 태양 위치 데이터 로드
    solar_df = pd.read_csv(solar_csv_path, parse_dates=['datetime'])

    # Hillshade 계산
    for _, row in tqdm(solar_df.iterrows(), total=len(solar_df)):
        dt = row['datetime']
        elev = row['elevation']
        azim = row['azimuth']

        if elev <= 0:
            continue  # 태양이 떠 있지 않으면 저장하지 않음

        hillshade = compute_hillshade(slope, aspect, azim, elev)  # 0~255

        # 저장 경로 생성
        fname = f"hillshade_{dt.strftime('%Y-%m-%d_%H-%M')}.tif"
        out_path = os.path.join(output_dir, fname)

        # 저장 (GeoTIFF, uint8, WGS84)
        meta.update(dtype='uint8', count=1)
        with rasterio.open(out_path, 'w', **meta) as dst:
            dst.write(hillshade.astype('uint8'), 1)

    print(f"Hillshade 생성 완료 (0~255 스케일, 태양이 뜬 시간만): {output_dir}")



# ✅ 사용 예시 (경로 설정)
dem_path = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Naju_DEM_Clip.tif"
solar_csv_path = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\solar_position_naju.csv"
output_dir = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Hillshade_naju"

generate_hourly_hillshades(dem_path, solar_csv_path, output_dir)


In [None]:
#Hillshade_Band approach
import os
import numpy as np
import pandas as pd
import rasterio
from rasterio.transform import xy
from affine import Affine
from pvlib.location import Location
from datetime import datetime
from tqdm import tqdm
from pvlib.solarposition import get_solarposition


def calculate_slope_aspect(dem):
    x, y = np.gradient(dem, 90, 90)
    slope = np.pi / 2 - np.arctan(np.sqrt(x*x + y*y))
    aspect = np.arctan2(-x, y)
    aspect = np.where(aspect < 0, 2 * np.pi + aspect, aspect)
    return slope, aspect


def compute_hillshade(slope, aspect, azimuth_deg, altitude_deg):
    azimuth_rad = np.radians(azimuth_deg)
    altitude_rad = np.radians(altitude_deg)
    shaded = (np.sin(altitude_rad) * np.sin(slope) +
              np.cos(altitude_rad) * np.cos(slope) * np.cos(azimuth_rad - aspect))
    shaded = np.clip(shaded, 0, 1)
    return (shaded * 255).astype(np.uint8)


def get_lat_band_masks(dem_data, transform, bands):
    rows, cols = dem_data.shape
    lats = np.empty((rows, cols))
    for r in range(rows):
        _, lat_row = xy(transform, r, 0)
        lats[r, :] = lat_row  # 모든 열에 동일한 위도
    return {b: (lats >= b[0]) & (lats < b[1]) for b in bands}


def precompute_solar_positions(bands, lon, times):
    solar_dict = {}
    for (lat_min, lat_max) in bands:
        center_lat = (lat_min + lat_max) / 2
        key = (lat_min, lat_max)
        solar_pos = get_solarposition(times, center_lat, lon)
        solar_dict[key] = solar_pos[['apparent_elevation', 'azimuth']]
    return solar_dict


def generate_combined_hillshades(dem_path, output_dir, solar_dict, bands, times):
    os.makedirs(output_dir, exist_ok=True)

    with rasterio.open(dem_path) as src:
        dem = src.read(1)
        transform = src.transform
        meta = src.meta.copy()

    meta.update(dtype='uint8', count=1, nodata=0)

    slope, aspect = calculate_slope_aspect(dem)
    masks = get_lat_band_masks(dem, transform, bands)

    for dt in tqdm(times, desc="Generating hillshades"):
        combined = np.zeros_like(dem, dtype='uint8')
        valid_band = False

        for (lat_min, lat_max), mask in masks.items():
            if not np.any(mask):
                continue

            sol_data = solar_dict[(lat_min, lat_max)].loc[dt]
            elev, azim = sol_data['apparent_elevation'], sol_data['azimuth']

            if elev <= 0:
                continue

            hs = compute_hillshade(slope, aspect, azim, elev)
            combined = np.where(mask, hs, combined)
            valid_band = True

        if not valid_band:
            print(f"⚠️ {dt} - 모든 밴드에서 유효 고도각 없음 → 파일 저장 생략")
            continue

        fname = f"hillshade_combined_{dt.strftime('%Y-%m-%d_%H-%M')}.tif"
        out_path = os.path.join(output_dir, fname)

        with rasterio.open(out_path, 'w', **meta) as dst:
            dst.write(combined, 1)

        print(f"✅ 저장 완료: {fname}")


dem_path = r"C:\Users\user\Desktop\Junkyo\2025\WREC\Korean Peninsula\Korea90m_GRS80.img"
output_dir = r"C:\Users\user\Desktop\Junkyo\2025\WREC\Korea_hillshade"

bands = [(33, 34), (34, 35), (35, 36), (36, 37), (37, 38)]

times = pd.date_range(start='2023-01-01 00:00', end='2023-12-31 23:00', freq='1h', tz='Asia/Seoul')
solar_dict = precompute_solar_positions(bands, lon=126.5, times=times, output_dir = r"C:\Users\user\Desktop\Junkyo\2025\WREC\Korea_hillshade")



generate_combined_hillshades(dem_path, output_dir, solar_dict, bands, times)

In [3]:
# hillshade_utils.py
import numpy as np

def compute_slope_aspect(dem, transform):
    x, y = np.gradient(dem.astype('float64'))
    slope = np.arctan(np.sqrt(x**2 + y**2))
    aspect = np.arctan2(-x, y)
    aspect = np.mod(aspect, 2 * np.pi)
    return slope, aspect

def compute_hillshade(slope, aspect, azimuth_deg, altitude_deg):
    azimuth_rad = np.radians(360 - azimuth_deg + 90)
    altitude_rad = np.radians(altitude_deg)

    shaded = (np.cos(altitude_rad) * np.cos(slope) +
              np.sin(altitude_rad) * np.sin(slope) * np.cos(azimuth_rad - aspect))
    shaded = np.clip(shaded, 0, 1)
    return (shaded * 255).astype(np.uint8)

def get_lat_band_masks(dem, transform, lat_band_edges):
    masks = {}
    height, width = dem.shape
    rows, cols = np.meshgrid(np.arange(height), np.arange(width), indexing='ij')
    
    lats = transform.f + rows * transform.e  # y축 방향 변화량으로부터 위도 계산
    for i in range(len(lat_band_edges) - 1):
        lat_min, lat_max = lat_band_edges[i], lat_band_edges[i+1]
        mask = (lats >= lat_min) & (lats < lat_max)
        masks[(lat_min, lat_max)] = mask
    return masks


In [5]:
#Solar dictionary 생성
from pvlib.solarposition import get_solarposition
import pandas as pd
import pytz

# 타임존 설정
tz = 'Asia/Seoul'

# 시간 범위 생성: 2023년 1년, 1시간 간격
times = pd.date_range(start="2023-01-01 00:00", end="2023-12-31 21:00", freq="3H", tz=tz)

# 위도 밴드 정의
lat_bands = [(33, 34), (34, 35), (35, 36), (36, 37), (37, 38), (38, 39)]

# 임의의 중심 경도 설정 (예: 한국 중심)
lon = 127.5

# solar_dict 초기화
solar_dict = {}

# 위도 밴드별로 solar position 계산
for (lat_min, lat_max) in lat_bands:
    lat_center = (lat_min + lat_max) / 2  # 중심 위도
    solar_pos = get_solarposition(times, latitude=lat_center, longitude=lon)
    solar_dict[(lat_min, lat_max)] = solar_pos
    print(f"✅ 저장 완료: {(lat_min, lat_max)} → {len(solar_pos)}시간치")

print("📦 solar_dict 전체 생성 완료")


✅ 저장 완료: (33, 34) → 2920시간치
✅ 저장 완료: (34, 35) → 2920시간치
✅ 저장 완료: (35, 36) → 2920시간치
✅ 저장 완료: (36, 37) → 2920시간치
✅ 저장 완료: (37, 38) → 2920시간치
✅ 저장 완료: (38, 39) → 2920시간치
📦 solar_dict 전체 생성 완료


  times = pd.date_range(start="2023-01-01 00:00", end="2023-12-31 21:00", freq="3H", tz=tz)


In [None]:
# 예시: (33, 34) 밴드에서 2023년 6월 21일 정오 시각의 solar position 확인
check_time = pd.Timestamp("2023-06-21 12:00", tz=tz)
band = (33, 34)

if check_time in solar_dict[band].index:
    sol = solar_dict[band].loc[check_time]
    print(f"🔎 {band} @ {check_time} → Elev: {sol['apparent_elevation']:.2f}°, Azim: {sol['azimuth']:.2f}°")
else:
    print(f"⚠️ {check_time} 이 solar_dict[{band}]에 없음")


In [None]:
for band, df in solar_dict.items():
    print(f"{band} → 시작: {df.index[0]}, 끝: {df.index[-1]}, 총 {len(df)}개")


In [None]:
#dem 위경도 좌표계 변환
from rasterio.warp import calculate_default_transform, reproject, Resampling
import rasterio

src_path = r"C:\Users\user\Desktop\Junkyo\2025\WREC\Korean Peninsula\Korea90m_GRS80.img"
dst_path = r"C:\Users\user\Desktop\Junkyo\2025\WREC\Korean Peninsula\Korea90m_wgs84.tif"  # 위경도 DEM 저장 경로

with rasterio.open(src_path) as src:
    dst_crs = "EPSG:4326"  # 위경도 좌표계
    transform, width, height = calculate_default_transform(
        src.crs, dst_crs, src.width, src.height, *src.bounds
    )
    kwargs = src.meta.copy()
    kwargs.update({
        "crs": dst_crs,
        "transform": transform,
        "width": width,
        "height": height
    })

    with rasterio.open(dst_path, "w", **kwargs) as dst:
        for i in range(1, src.count + 1):  # 밴드 수만큼 반복
            reproject(
                source=rasterio.band(src, i),
                destination=rasterio.band(dst, i),
                src_transform=src.transform,
                src_crs=src.crs,
                dst_transform=transform,
                dst_crs=dst_crs,
                resampling=Resampling.bilinear
            )


In [13]:
import sys
import subprocess

def install_gdal():
    try:
        # GDAL 설치 시도
        subprocess.check_call([sys.executable, "-m", "pip", "install", "GDAL"])
        print("GDAL이 성공적으로 설치되었습니다.")
    except subprocess.CalledProcessError:
        print("GDAL 설치 실패. conda를 통한 설치를 시도합니다.")
        try:
            # conda를 통한 설치 시도
            subprocess.check_call(["conda", "install", "-c", "conda-forge", "gdal", "-y"])
            print("GDAL이 conda를 통해 성공적으로 설치되었습니다.")
        except subprocess.CalledProcessError:
            print("GDAL 설치에 실패했습니다. 시스템 관리자에게 문의하세요.")
            raise

# GDAL이 설치되어 있는지 확인
try:
    from osgeo import gdal
    print("GDAL이 이미 설치되어 있습니다.")
except ImportError:
    print("GDAL이 설치되어 있지 않습니다. 설치를 시작합니다...")
    install_gdal()

GDAL이 설치되어 있지 않습니다. 설치를 시작합니다...
GDAL 설치 실패. conda를 통한 설치를 시도합니다.
GDAL이 conda를 통해 성공적으로 설치되었습니다.


In [None]:
#Hillshade 개정판
import os
import numpy as np
import pandas as pd
from tqdm import tqdm
import rasterio
from pvlib.solarposition import get_solarposition
  # 유틸 함수 분리 필요

# ---------------------- 1. 사전 정의 ----------------------
dem_path = r"C:\Users\user\Desktop\Junkyo\2025\WREC\Korean Peninsula\Korea90m_wgs1984.tif"
output_dir = r"D:\Junkyo\2025\WREC\Korea_hillshade_3h"
os.makedirs(output_dir, exist_ok=True)

lat_band_edges = list(range(33, 39))  # (33~34), (34~35), ..., (37~38)

# 시간 범위
times = pd.date_range(start="2023-01-01 00:00", end="2023-12-31 21:00", freq="3H", tz="Asia/Seoul")

# ---------------------- 2. DEM 정보 불러오기 ----------------------
with rasterio.open(dem_path) as src:
    dem = src.read(1)
    meta = src.meta.copy()
    transform = src.transform

# ---------------------- 3. Slope / Aspect 계산 ----------------------
slope, aspect = compute_slope_aspect(dem, transform)

# ---------------------- 4. 위도 밴드별 마스크 생성 ----------------------
masks = get_lat_band_masks(dem, transform, lat_band_edges)

# ---------------------- 5. 위도 밴드별 Solar Position 사전 계산 ----------------------


# ---------------------- 6. 시간 루프: Hillshade 생성 및 저장 ----------------------
for dt in tqdm(times, desc="전체 Hillshade 생성 중"):
    combined = np.zeros_like(dem, dtype='uint8')
    valid_band = False

    for (lat_min, lat_max), mask in masks.items():
        if not np.any(mask):
            continue

        try:
            sol = solar_dict[(lat_min, lat_max)].loc[dt]
        except KeyError:
            print(f"⚠️ 시간 {dt} 에 대한 solar data 없음: {lat_min}-{lat_max}")
            continue

        elev, azim = sol['apparent_elevation'], sol['azimuth']
        if elev <= 0:
            continue

        hs = compute_hillshade(slope, aspect, azim, elev)
        combined = np.where(mask, hs, combined)
        valid_band = True

    if not valid_band:
        print(f"⚠️ {dt} - 모든 밴드에서 유효 고도각 없음 → 파일 저장 생략")
        continue

    # 저장
    fname = f"hillshade_combined_{dt.strftime('%Y-%m-%d_%H-%M')}.tif"
    out_path = os.path.join(output_dir, fname)
    with rasterio.open(out_path, 'w', **meta) as dst:
        dst.write(combined, 1)

    print(f"✅ 저장 완료: {fname}")

In [1]:
import os
import numpy as np
from osgeo import gdal
import rasterio
from rasterio.mask import mask
import concurrent.futures
from functools import partial
import multiprocessing
from tqdm import tqdm
import gc

def calculate_hillshade(raster_path, output_path, z_factor=1.0):
    """
    Calculate hillshade for a given DEM raster using parallel processing
    """
    # Open the raster file
    with rasterio.open(raster_path) as src:
        # Read the data and transform
        elevation = src.read(1)
        transform = src.transform
        
        # Calculate pixel size
        pixel_size_x = abs(transform[0])
        pixel_size_y = abs(transform[4])
        
        # Create arrays for x and y gradients using numpy operations
        x_grad = np.gradient(elevation, pixel_size_x, axis=1)
        y_grad = np.gradient(elevation, pixel_size_y, axis=0)
        
        # Calculate slope and aspect using numpy vectorized operations
        slope = np.arctan(np.sqrt(x_grad**2 + y_grad**2))
        aspect = np.arctan2(-x_grad, y_grad)
        
        # Constants for hillshade calculation
        azimuth = np.radians(315)  # Light from northwest
        altitude = np.radians(45)   # 45 degree elevation
        
        # Calculate hillshade using vectorized operations
        shaded = np.sin(altitude) * np.cos(slope) + \
                np.cos(altitude) * np.sin(slope) * \
                np.cos(azimuth - aspect)
        
        # Scale the hillshade
        hillshade = ((shaded + 1) / 2 * 255).astype(np.uint8)
        
        # Save the output using rasterio
        profile = src.profile
        profile.update(dtype=rasterio.uint8, count=1)
        
        with rasterio.open(output_path, 'w', **profile) as dst:
            dst.write(hillshade, 1)

def process_rasters(raster_files, output_folder):
    """
    Process multiple raster files in parallel
    """
    os.makedirs(output_folder, exist_ok=True)
    
    # Create a partial function with fixed output folder
    process_func = partial(process_single_raster, output_folder=output_folder)
    
    # Use ProcessPoolExecutor for parallel processing
    num_cores = multiprocessing.cpu_count()
    with concurrent.futures.ProcessPoolExecutor(max_workers=num_cores) as executor:
        # Submit all tasks and wait for completion
        futures = [executor.submit(process_func, raster_file) 
                  for raster_file in raster_files]
        concurrent.futures.wait(futures)

def process_single_raster(raster_file, output_folder):
    """
    Process a single raster file
    """
    try:
        # Create output filename
        base_name = os.path.splitext(os.path.basename(raster_file))[0]
        output_path = os.path.join(output_folder, f"{base_name}_hillshade.tif")
        
        # Skip if output already exists
        if os.path.exists(output_path):
            print(f"Skipping {base_name}: Output already exists")
            return True
        
        # Calculate hillshade
        calculate_hillshade(raster_file, output_path)
        
        return True
    except Exception as e:
        print(f"Error processing {raster_file}: {str(e)}")
        return False

# Create output directory for hillshade results
hillshade_output = os.path.join("path", "to", "hillshade_output")
os.makedirs(hillshade_output, exist_ok=True)

# Process all raster files in parallel
process_rasters(raster_files, hillshade_output)

NameError: name 'raster_files' is not defined

In [None]:
#파일 생성 검증
import os
from datetime import datetime

raster_folder = r"D:\Junkyo\2025\WREC\Korea_hillshade"

# ✅ 1) solar_dict에서 elevation > 0 인 시간 추출
valid_times = set()

for band_data in solar_dict.values():
    for timestamp, row in band_data.iterrows():
        if row['elevation'] > 0:
            valid_times.add(timestamp.to_pydatetime())

# ✅ 2) 폴더 내의 tif 파일 목록 가져오기
existing_files = [f for f in os.listdir(raster_folder) if f.endswith(".tif")]

# ✅ 3) 파일명에서 시간 추출
existing_times = set()
for filename in existing_files:
    try:
        # 파일명 예: hillshade_combined_2023-11-16_08-00.tif
        dt_str = filename.replace("hillshade_combined_", "").replace(".tif", "")
        dt = datetime.strptime(dt_str, "%Y-%m-%d_%H-%M")
        existing_times.add(dt)
    except ValueError:
        print(f"⚠️ 잘못된 파일명 형식: {filename}")

# ✅ 4) 누락 파일: 유효 시간인데 존재하지 않는 파일
missing_times = sorted(valid_times - existing_times)
missing_files = [f"hillshade_combined_{dt.strftime('%Y-%m-%d_%H-%M')}.tif" for dt in missing_times]

# ✅ 5) 불필요한 파일: 유효 시간이 아닌데 존재하는 파일
extra_times = sorted(existing_times - valid_times)
extra_files = [f"hillshade_combined_{dt.strftime('%Y-%m-%d_%H-%M')}.tif" for dt in extra_times]

# ✅ 6) 출력
if missing_files:
    print(f"❌ [총 {len(missing_files)}개] elevation > 0인데 파일 없음:")
    for f in missing_files:
        print(f)
else:
    print("✅ elevation > 0인 시간대에 대해 모든 hillshade 파일이 존재합니다.")

if extra_files:
    print(f"\n⚠️ [총 {len(extra_files)}개] elevation <= 0인데 파일이 존재함:")
    for f in extra_files:
        print(f)
else:
    print("✅ elevation <= 0인 시간대에 대해 생성된 hillshade 파일이 없습니다.")

# ✅ 7) 결과 저장
with open(os.path.join(raster_folder, "missing_files_elev_gt0.txt"), "w", encoding="utf-8") as f:
    for name in missing_files:
        f.write(name + "\n")

with open(os.path.join(raster_folder, "extra_files_elev_le0.txt"), "w", encoding="utf-8") as f:
    for name in extra_files:
        f.write(name + "\n")

print("\n📁 누락/불필요한 파일 목록 저장 완료")




In [None]:
# ✅ elevation > 0을 만족하는 시간대를 담을 set
valid_times = set()

# 전체 시간대 기준 루프
all_times = solar_dict[next(iter(solar_dict))].index  # solar_dict 중 하나에서 시간대 추출

for time in all_times:
    # 밴드 중 하나라도 elevation > 0이면 True
    for band in solar_dict:
        if solar_dict[band].loc[time, 'elevation'] > 0:
            valid_times.add(time.to_pydatetime())
            break  # 하나라도 조건 만족하면 다음 시간으로 넘어감

# ✅ 결과 출력
print(f"☀️ elevation > 0인 고유 시간대 개수: {len(valid_times)}시간")



In [None]:
import rasterio

with rasterio.open(r"C:\Users\user\Desktop\Junkyo\2025\WREC\Korean Peninsula\Korea90m_GRS80_to_wgs1984.tif") as src:
    print("CRS:", src.crs)
    print("Transform:", src.transform)
    width = src.width
    height = src.height

    lat_ul, lon_ul = src.xy(0, 0)  # upper-left
    lat_lr, lon_lr = src.xy(height - 1, width - 1)  # lower-right

    print(f"UL (row=0, col=0):    lat={lat_ul:.6f}, lon={lon_ul:.6f}")
    print(f"LR (row=H, col=W):   lat={lat_lr:.6f}, lon={lon_lr:.6f}")


In [None]:
print(f"{lat_min}-{lat_max} 밴드에서 True 셀 수: {np.sum(mask)}")


In [None]:
print(type(dt))
print(solar_dict[(lat_min, lat_max)].index[:5])  # 예시로 인덱스 타입 확인




In [None]:
#Hillshade window clipping
import os
import rasterio
from rasterio.windows import from_bounds
from rasterio.warp import transform_bounds
from tqdm import tqdm

# -------------------- 설정 --------------------
target_folder = r"D:\Junkyo\2025\WREC\Korea_hillshade"  # 기존 tif 파일이 있는 폴더 (여기에 덮어쓰기 저장됨)

# 클리핑할 위도 범위 (WGS84 기준)
target_lat_min = 33
target_lat_max = 39

# -------------------- 처리 --------------------
for fname in tqdm(os.listdir(target_folder), desc="Windowing 진행 중"):
    if not fname.endswith('.tif'):
        continue

    file_path = os.path.join(target_folder, fname)

    with rasterio.open(file_path) as src:
        bounds = src.bounds
        crs = src.crs

        # 좌표계가 EPSG:4326(WGS84)이 아닐 경우 위도 기준으로 변환
        if crs.to_epsg() != 4326:
            wgs84_bounds = transform_bounds(crs, 'EPSG:4326', *bounds)
        else:
            wgs84_bounds = bounds

        # 대상 경계와 겹치지 않으면 파일 삭제 후 skip
        if wgs84_bounds[3] < target_lat_min or wgs84_bounds[1] > target_lat_max:
            print(f"🗑️ 삭제: {fname} - 위도 {wgs84_bounds[1]:.2f}~{wgs84_bounds[3]:.2f} → 범위 밖")
            os.remove(file_path)
            continue

        # 클리핑 범위 변환 (WGS84 → 원래 좌표계)
        clip_bounds = transform_bounds('EPSG:4326', crs, bounds.left, target_lat_min, bounds.right, target_lat_max)
        window = from_bounds(*clip_bounds, transform=src.transform)
        window = window.round_offsets().round_lengths()

        # 잘라낸 데이터 읽기
        data = src.read(1, window=window)
        transform = src.window_transform(window)
        meta = src.meta.copy()
        meta.update({
            'height': data.shape[0],
            'width': data.shape[1],
            'transform': transform
        })

    # 기존 파일 삭제 후 재저장
    os.remove(file_path)
    with rasterio.open(file_path, 'w', **meta) as dst:
        dst.write(data, 1)

    print(f"✅ 덮어쓰기 저장 완료: {fname}")



In [None]:
#window skip
# Hillshade window clipping
import os
import rasterio
from rasterio.windows import from_bounds
from rasterio.warp import transform_bounds
from tqdm import tqdm

# -------------------- 설정 --------------------
target_folder = r"D:\Junkyo\2025\WREC\Korea_hillshade"  # 기존 tif 파일이 있는 폴더 (여기에 덮어쓰기 저장됨)

# 클리핑할 위도 범위 (WGS84 기준)
target_lat_min = 33
target_lat_max = 39

# -------------------- 처리 --------------------
for fname in tqdm(os.listdir(target_folder), desc="Windowing 진행 중"):
    if not fname.endswith('.tif'):
        continue

    file_path = os.path.join(target_folder, fname)

    with rasterio.open(file_path) as src:
        bounds = src.bounds
        crs = src.crs

        # 좌표계가 EPSG:4326(WGS84)이 아닐 경우 위도 기준으로 변환
        if crs.to_epsg() != 4326:
            wgs84_bounds = transform_bounds(crs, 'EPSG:4326', *bounds)
        else:
            wgs84_bounds = bounds

        lat_min, lat_max = wgs84_bounds[1], wgs84_bounds[3]

        # 대상 경계와 겹치지 않으면 파일 삭제 후 skip
        if lat_max < target_lat_min or lat_min > target_lat_max:
            print(f"🗑️ 삭제: {fname} - 위도 {lat_min:.2f}~{lat_max:.2f} → 범위 밖")
            os.remove(file_path)
            continue

        # 이미 클리핑 범위와 정확히 일치하는 경우 skip
        if abs(lat_min - target_lat_min) < 0.01 and abs(lat_max - target_lat_max) < 0.01:
           
            continue

        # 클리핑 범위 변환 (WGS84 → 원래 좌표계)
        clip_bounds = transform_bounds('EPSG:4326', crs, bounds.left, target_lat_min, bounds.right, target_lat_max)
        window = from_bounds(*clip_bounds, transform=src.transform)
        window = window.round_offsets().round_lengths()

        # 잘라낸 데이터 읽기
        data = src.read(1, window=window)
        transform = src.window_transform(window)
        meta = src.meta.copy()
        meta.update({
            'height': data.shape[0],
            'width': data.shape[1],
            'transform': transform
        })

    # 기존 파일 삭제 후 재저장
    os.remove(file_path)
    with rasterio.open(file_path, 'w', **meta) as dst:
        dst.write(data, 1)

    print(f"✅ 덮어쓰기 저장 완료: {fname}")


In [None]:
import rasterio

try:
    with rasterio.open(r"D:\Junkyo\2025\WREC\Korea_hillshade\hillshade_combined_2023-11-16_08-00.tif") as src:
        data = src.read(1)  # 읽기 시도
        print("정상적으로 읽힘")
except Exception as e:
    print("❌ 파일에 문제 있음:", e)


In [None]:
import os
import rasterio
from rasterio.mask import mask
from shapely.geometry import mapping
import geopandas as gpd

# 1) 파일 경로
shp_path      = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\naju_road_Hori.shp"
raster_folder = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Hillshade_naju"
output_folder = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\mask_naju_Hori"
os.makedirs(output_folder, exist_ok=True)

# 2) shapefile 불러오기 + CRS 지정
gdf = gpd.read_file(shp_path)

# 이미 CRS가 올바르게 기록돼 있지 않다면 강제 지정
# “Korean 1985 / Modified Central Belt” = EPSG:2097
if gdf.crs is None or gdf.crs.to_epsg() != 2097:
    gdf = gdf.set_crs(epsg=2097, allow_override=True)

for fname in os.listdir(raster_folder):
    if not fname.lower().endswith(".tif"):
        continue

    in_rast  = os.path.join(raster_folder, fname)
    out_rast = os.path.join(output_folder, f"masked_{fname}")

    with rasterio.open(in_rast) as src:
        # 3) shapefile → raster CRS 로 변환
        vect = gdf.to_crs(src.crs)

        # GeoJSON 포맷으로 변환
        geoms = [mapping(geom) for geom in vect.geometry]

        # 4) 마스킹 (픽셀의 중심이 폴리곤 내에 있어야 내부로 간주됨)
        out_img, out_trans = mask(
            src,
            geoms,
            all_touched=False,  
            crop=False,
            nodata=0,
            filled=True
        )

        # 5) 메타데이터 갱신 및 저장
        meta = src.meta.copy()
        meta.update({
            "driver":  "GTiff",
            "height":  out_img.shape[1],
            "width":   out_img.shape[2],
            "transform": out_trans,
            "nodata":  0
        })

        with rasterio.open(out_rast, "w", **meta) as dst:
            dst.write(out_img)

print("✅ 마스킹 완료!")

In [None]:
#masking valid cells csv
import os
import numpy as np
import rasterio
from rasterio.mask import mask
from shapely.geometry import mapping
import geopandas as gpd
import pandas as pd
from tqdm import tqdm

# 1) 파일 경로 설정
shp_path      = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\gangneung_road_Hori.shp"
raster_folder = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Hillshade_gangneung"
output_csv    = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\gangneung_Hori_zerocell.csv"

# 2) shapefile 불러오기 및 CRS 지정 (Korean 1985 / Modified Central Belt, EPSG:2097)
gdf = gpd.read_file(shp_path)
if gdf.crs is None or gdf.crs.to_epsg() != 2097:
    gdf = gdf.set_crs(epsg=2097, allow_override=True)

# 3) 각 래스터 파일에 대해 마스킹 처리 후 통계 계산 (폴리곤 외부는 null값(np.nan)으로 처리)
stats_list = []  # 결과 통계를 저장할 리스트
raster_files = sorted([f for f in os.listdir(raster_folder) if f.lower().endswith('.tif')])

for fname in tqdm(raster_files, desc="래스터 처리중"):
    raster_path = os.path.join(raster_folder, fname)
    
    with rasterio.open(raster_path) as src:
        # shapefile을 해당 래스터의 CRS로 재투영 후, GeoJSON 포맷으로 변환
        vect = gdf.to_crs(src.crs)
        geoms = [mapping(geom) for geom in vect.geometry]
        
        # 마스킹: 픽셀의 중심이 폴리곤 내에 있어야 내부로 간주
        # filled=False로 해서 MaskedArray 형태로 받습니다.
        out_img, out_trans = mask(
            src,
            geoms,
            all_touched=False,
            crop=False,
            filled=False
        )
        
    # out_img는 (1, rows, cols) 형태의 MaskedArray임.
    masked = out_img[0]
    
    # 먼저 float32 타입으로 변환하고, 마스크된 영역을 np.nan으로 할당
    data = masked.astype("float32")
    data[masked.mask] = np.nan
    
    # 유효한 셀(즉, np.nan이 아닌 셀) 수 계산
    valid_count = np.count_nonzero(~np.isnan(data))
    # 값이 0인 셀 수 계산 (np.nan은 비교 대상에서 제외)
    zero_count = np.count_nonzero(data == 0)
    
    stats_list.append([fname, valid_count, zero_count])

# 4) 결과 통계를 CSV 파일로 저장 (A열: 파일명, B열: 유효 셀 수, C열: 0인 셀 수)
stats_df = pd.DataFrame(stats_list, columns=['RasterFile', 'ValidCellCount', 'ZeroCellCount'])
stats_df.to_csv(output_csv, index=False, encoding='utf-8')

print("CSV 파일이 생성되었습니다:", output_csv)

In [None]:
#masking valid cells csv v2
import os
import numpy as np
import rasterio
from rasterio.mask import mask
from shapely.geometry import mapping
import geopandas as gpd
import pandas as pd
from tqdm import tqdm

# 경로 설정
shp_path      = r"C:\Users\user\Desktop\Junkyo\2025\WREC\GIS\SIGUNGU_CD.shp"
raster_folder = r"D:\Junkyo\2025\WREC\Korea_hillshade"
output_csv    = r"C:\Users\user\Desktop\Junkyo\2025\WREC\GIS\Solararea.csv"

# Shapefile 불러오기 및 CRS 확인
gdf = gpd.read_file(shp_path)
if gdf.crs is None or gdf.crs.to_epsg() != 2097:
    gdf = gdf.set_crs(epsg=2097, allow_override=True)

# SIGUNGU_CD 목록 추출
sigungu_codes = gdf["SIGUNGU_CD"].astype(str).tolist()

# 결과 저장 리스트
stats_list = []
raster_files = sorted([f for f in os.listdir(raster_folder) if f.lower().endswith('.tif')])

for fname in tqdm(raster_files, desc="래스터 처리중"):
    raster_path = os.path.join(raster_folder, fname)

    with rasterio.open(raster_path) as src:
        # 좌표계 변환
        gdf_proj = gdf.to_crs(src.crs)

        # 파일 결과 저장용 딕셔너리 (파일명 + 각 지역 유효 셀 수)
        result = {"RasterFile": fname}

        for idx, row in gdf_proj.iterrows():
            sigungu_code = str(row["SIGUNGU_CD"])
            geom = [mapping(row.geometry)]

            try:
                out_img, _ = mask(
                    src,
                    geom,
                    all_touched=False,
                    crop=False,
                    filled=False
                )
                masked = out_img[0].astype("float32")
                masked[masked.mask] = np.nan

                non_zero_count = np.count_nonzero((~np.isnan(masked)) & (masked != 0))
                result[sigungu_code] = non_zero_count

            except Exception as e:
                # 예외 발생 시 해당 구역은 0으로 간주
                result[sigungu_code] = 0
                print(f"[경고] {fname}의 {sigungu_code} 영역 처리 중 오류 발생: {e}")

        stats_list.append(result)

# 결과 DataFrame 생성 및 저장
stats_df = pd.DataFrame(stats_list)
stats_df.to_csv(output_csv, index=False, encoding="utf-8")

print("CSV 파일이 생성되었습니다:", output_csv)


In [1]:
pip install rasterstats

Collecting rasterstats
  Downloading rasterstats-0.20.0-py3-none-any.whl.metadata (4.2 kB)
Collecting fiona (from rasterstats)
  Downloading fiona-1.10.1-cp312-cp312-win_amd64.whl.metadata (58 kB)
     ---------------------------------------- 0.0/58.1 kB ? eta -:--:--
     ---------------------------------------- 58.1/58.1 kB 3.0 MB/s eta 0:00:00
Collecting simplejson (from rasterstats)
  Downloading simplejson-3.20.1-cp312-cp312-win_amd64.whl.metadata (3.4 kB)
Downloading rasterstats-0.20.0-py3-none-any.whl (17 kB)
Downloading fiona-1.10.1-cp312-cp312-win_amd64.whl (24.5 MB)
   ---------------------------------------- 0.0/24.5 MB ? eta -:--:--
    --------------------------------------- 0.3/24.5 MB 6.5 MB/s eta 0:00:04
   - -------------------------------------- 0.7/24.5 MB 7.6 MB/s eta 0:00:04
   - -------------------------------------- 1.1/24.5 MB 7.6 MB/s eta 0:00:04
   - -------------------------------------- 1.2/24.5 MB 7.3 MB/s eta 0:00:04
   -- ---------------------------------

In [4]:
#가속화 Gemini V1
# 개선된 코드 v1: rasterstats 사용
import os
import pandas as pd
import geopandas as gpd
from rasterstats import zonal_stats
from tqdm import tqdm

# --- 경로 설정 ---
shp_path = r"C:\Users\user\Desktop\Junkyo\2025\WREC\GIS\SIGUNGU_CD.shp"
raster_folder = r"D:\Junkyo\2025\WREC\Korea_hillshade_3h"
output_csv = r"C:\Users\user\Desktop\Junkyo\2025\WREC\GIS\Solararea_improved-3h.csv"

# --- Shapefile 불러오기 및 CRS 확인 ---
gdf = gpd.read_file(shp_path, encoding='cp949') # 한글 필드를 위해 인코딩 추가
# SHP 파일의 CRS를 EPSG:2097로 명시적 설정
if gdf.crs is None or gdf.crs.to_epsg() != 2097:
    gdf = gdf.set_crs(epsg=2097, allow_override=True)

# 시군구 코드 목록을 나중에 DataFrame의 컬럼명으로 사용
sigungu_codes = gdf["SIGUNGU_CD"].astype(str).tolist()

# --- 래스터 파일 목록 ---
raster_files = sorted([f for f in os.listdir(raster_folder) if f.lower().endswith('.tif')])

# --- 결과 저장을 위한 리스트 ---
all_stats = []

# --- 메인 프로세스 ---
for fname in tqdm(raster_files, desc="래스터 처리중"):
    raster_path = os.path.join(raster_folder, fname)

    try:
        # zonal_stats 함수 한 번 호출로 모든 폴리곤의 통계 계산!
        # 여기서 'count'는 0이 아닌 유효 픽셀의 개수를 의미합니다.
        stats = zonal_stats(
            gdf,
            raster_path,
            stats="count",  # 0이 아닌 셀의 개수를 계산
            geojson_out=True # 결과를 GeoJSON처럼 다루기 위함
        )

        # 결과 정리
        result = {"RasterFile": fname}
        for i, poly_stat in enumerate(stats):
            sigungu_code = str(gdf.loc[i, "SIGUNGU_CD"])
            # 'count' 값이 없을 경우(폴리곤이 래스터와 겹치지 않음 등) 0으로 처리
            count = poly_stat['properties'].get('count', 0)
            result[sigungu_code] = count
        
        all_stats.append(result)

    except Exception as e:
        print(f"[오류] {fname} 처리 중 오류 발생: {e}")
        # 오류 발생 시 해당 래스터 파일의 모든 값을 0으로 채움
        error_result = {"RasterFile": fname}
        for code in sigungu_codes:
            error_result[code] = 0
        all_stats.append(error_result)


# --- 결과 DataFrame 생성 및 저장 ---
stats_df = pd.DataFrame(all_stats)
# 컬럼 순서를 'RasterFile' 다음 sigungu_codes 순서로 정렬
stats_df = stats_df[["RasterFile"] + sigungu_codes]
stats_df.to_csv(output_csv, index=False, encoding="utf-8-sig") # Excel에서 한글이 깨지지 않도록 utf-8-sig 사용

print("CSV 파일이 성공적으로 생성되었습니다:", output_csv)

  return ogr_read(
래스터 처리중: 100%|██████████| 1486/1486 [6:20:02<00:00, 15.34s/it]  

CSV 파일이 성공적으로 생성되었습니다: C:\Users\user\Desktop\Junkyo\2025\WREC\GIS\Solararea_improved-3h.csv





In [5]:
#기상 관측 지점 피처 데이터 생성
import pandas as pd
import geopandas as gpd
from shapely.geometry import Point

# 엑셀 파일 경로
excel_path = r"C:\Users\user\Desktop\Junkyo\2025\WREC\KMA_data.xlsx"

# 엑셀 파일 읽기 (기본 첫 시트)
df = pd.read_excel(excel_path)

# 위도(F열), 경도(G열) 컬럼명 확인 후 수정 필요시 반영
lat_col = df.columns[5]  # F열
lon_col = df.columns[6]  # G열

# 점(Point) geometry 생성
geometry = [Point(xy) for xy in zip(df[lon_col], df[lat_col])]

# GeoDataFrame 생성
gdf = gpd.GeoDataFrame(df, geometry=geometry, crs="EPSG:4326")

# 저장할 shapefile 경로
output_shp = r"C:\Users\user\Desktop\Junkyo\2025\WREC\KMA_points.shp"

# Shapefile로 저장
gdf.to_file(output_shp, driver='ESRI Shapefile')

print("Shapefile 생성 완료:", output_shp)


Shapefile 생성 완료: C:\Users\user\Desktop\Junkyo\2025\WREC\KMA_points.shp


  gdf.to_file(output_shp, driver='ESRI Shapefile')
  ogr_write(
  ogr_write(
  ogr_write(
  ogr_write(
  ogr_write(
  ogr_write(
  ogr_write(
  ogr_write(


In [28]:
import os
import rasterio
from rasterio.mask import mask
import geopandas as gpd
from shapely.geometry import mapping

# 1) 입력 파일 경로
shp_path    = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\gangneung_road_Vert.shp"
raster_path = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Gangneung_Slope.tif"
output_path = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Gangneung_Slope_Vert.tif"

# 2) shapefile 불러오기 + CRS 강제 지정(EPSG:2097)
gdf = gpd.read_file(shp_path)
if gdf.crs is None or gdf.crs.to_epsg() != 2097:
    gdf = gdf.set_crs(epsg=2097, allow_override=True)

# 3) rasterio로 래스터 열기 → 벡터를 래스터 CRS에 맞춰 재투영 → GeoJSON 리스트
with rasterio.open(raster_path) as src:
    vect = gdf.to_crs(src.crs)
    geoms = [mapping(geom) for geom in vect.geometry]

    # 4) 마스킹: all_touched=True, 내부 보존·외부 0
    out_img, out_trans = mask(
        src,
        geoms,
        all_touched=True,
        crop=False,
        nodata=0,
        filled=True
    )

    # 5) 메타데이터 갱신 (driver는 GTiff로)
    meta = src.meta.copy()
    meta.update({
        "driver":   "GTiff",
        "height":   out_img.shape[1],
        "width":    out_img.shape[2],
        "transform":out_trans,
        "nodata":   0
    })

# 6) 결과 쓰기
os.makedirs(os.path.dirname(output_path), exist_ok=True)
with rasterio.open(output_path, "w", **meta) as dst:
    dst.write(out_img)

print("✅ 단일 래스터 마스킹 완료:", output_path)

✅ 단일 래스터 마스킹 완료: C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Gangneung_Slope_Vert.tif


In [13]:
import os
import numpy as np
import rasterio
import pandas as pd
from tqdm import tqdm

def process_raster_file(raster_path, SI, shading_factor, output_path):
    """
    한 개의 래스터 파일에 대해 처리:
      - 셀 값이 0이면 0, 그렇지 않으면 계산된 발전량으로 채움
      - 발전량 = 0.22 * SI * (1 - shading_factor) * 450
      - 반환값: non_zero_count, total_value
    """
    with rasterio.open(raster_path) as src:
        arr = src.read(1)  # 단일 밴드 읽기
        meta = src.meta.copy()
    
    # 계산: 모든 non-zero 셀에 대해 동일한 발전량을 계산합니다.
    gen_value = 0.22 * SI * (1 - shading_factor) * 450
    result = np.where(arr == 0, 0, gen_value)

    # 통계 값 계산: 셀이 0이 아닌 셀들의 갯수와, 전체 셀의 값 합계
    nonzero_count = np.count_nonzero(result)
    total_value = np.sum(result)

    # 메타데이터 업데이트 (GeoTIFF 쓰기용)
    meta.update({
        "dtype": "float32",
        "driver": "GTiff"
    })
    
    # 결과 저장
    with rasterio.open(output_path, "w", **meta) as dst:
        dst.write(result.astype(np.float32), 1)
    
    return nonzero_count, total_value

# ------------------------------------
# 1. 파일 경로 설정
hillshade_folder = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\mask_gangneung_Hori"
csv_path = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\tmy\Study_tmy\Gangneung_samcsv.csv" # CSV 파일 (UTF-8 인코딩)
output_folder = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Power_gangneung_Hori"
os.makedirs(output_folder, exist_ok=True)

# ------------------------------------
# 2. CSV 파일 로드 (헤더가 3번째 행에 있다고 가정)
solar_df = pd.read_csv(csv_path, encoding='utf-8', header=2)

required_columns = ['Irradiance', 'SelfShading']
for col in required_columns:
    if col not in solar_df.columns:
        raise ValueError(f"CSV 파일에 '{col}' 열이 없습니다.")

# ------------------------------------
# 3. 폴더 내의 래스터 파일들을 정렬된 순서대로 읽기
raster_files = sorted([f for f in os.listdir(hillshade_folder) if f.lower().endswith('.tif')])
if len(raster_files) != len(solar_df):
    print("경고: 래스터 파일의 갯수와 CSV 파일의 행 수가 일치하지 않습니다. 둘 중 작은 개수로 진행합니다.")

n_files = min(len(raster_files), len(solar_df))

# ------------------------------------
# 결과 통계 저장 리스트 (각 행: [래스터파일명, 0이 아닌 셀 갯수, 전체 셀값 합계])
stats_list = []

# ------------------------------------
# 4. 각 래스터 파일에 대해 처리
for i in tqdm(range(n_files), desc="래스터 처리중"):
    raster_file = raster_files[i]
    raster_path = os.path.join(hillshade_folder, raster_file)
    
    # CSV의 i번째 행값 추출
    row = solar_df.iloc[i]
    
    # Solar Irradiance (SI) 계산: GHI, DNI, DHI 합산
    SI = row['Irradiance']
    shading_factor = row['SelfShading']
    
    # 출력 파일 경로 생성 (파일명 앞에 "processed_" 접두사 추가)
    output_path = os.path.join(output_folder, f"processed_{raster_file}")
    
    # 한 래스터 파일 처리 및 통계 계산
    nonzero_count, total_value = process_raster_file(raster_path, SI, shading_factor, output_path)
    
    # 통계 정보 리스트에 추가: 파일명, 0이 아닌 셀 갯수, 전체 값의 합계
    stats_list.append([raster_file, nonzero_count, total_value])

# ------------------------------------
# 5. 통계 결과를 새로운 CSV 파일로 저장
stats_df = pd.DataFrame(stats_list, columns=['RasterFile', 'NonZeroCount', 'TotalValue'])
stats_csv_path = os.path.join(output_folder, "raster_statistics.csv")
stats_df.to_csv(stats_csv_path, index=False, encoding='utf-8')

print(f"모든 래스터 파일의 발전량 계산 및 통계 CSV 생성 및 {output_folder} 저장 완료!")

경고: 래스터 파일의 갯수와 CSV 파일의 행 수가 일치하지 않습니다. 둘 중 작은 개수로 진행합니다.


래스터 처리중: 100%|██████████| 4400/4400 [01:46<00:00, 41.13it/s]

모든 래스터 파일의 발전량 계산 및 통계 CSV 생성 및 C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Power_gangneung_Hori 저장 완료!





In [None]:
import os
import numpy as np
import rasterio
import pandas as pd
from tqdm import tqdm

def process_raster_file(raster_path, SI, shading_factor):
    """
    한 개의 래스터 파일에 대해 처리:
      - 셀 값이 0이면 0, 그렇지 않으면 계산된 발전량으로 채움
      - 발전량 = 0.22 * SI * (1 - shading_factor) * 450
      - 반환값: non_zero_count, total_value
    """
    with rasterio.open(raster_path) as src:
        arr = src.read(1)  # 단일 밴드 읽기
    
    # 발전량 계산: 모든 non-zero 셀에 대해 동일한 값
    gen_value = 0.9* 0.22 * SI * (shading_factor) * 450
    result = np.where(arr == 0, 0, gen_value)
    
    # 통계 값 계산: 셀이 0이 아닌 셀들의 갯수와, 전체 셀의 합계
    nonzero_count = np.count_nonzero(result)
    total_value = np.sum(result)
    
    return nonzero_count, total_value

# ------------------------------------
# 1. 파일 경로 설정
hillshade_folder = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\mask_naju_Hori"
csv_path = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\tmy\Study_tmy\Naju_samcsv.csv"  # CSV 파일 (UTF-8 인코딩)
output_folder = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Power_naju_Hori"
os.makedirs(output_folder, exist_ok=True)

# ------------------------------------
# 2. CSV 파일 로드 (헤더가 3번째 행에 있다고 가정)
solar_df = pd.read_csv(csv_path, encoding='utf-8', header=2)

required_columns = ['Irradiance', 'Vable']
for col in required_columns:
    if col not in solar_df.columns:
        raise ValueError(f"CSV 파일에 '{col}' 열이 없습니다.")

# ------------------------------------
# 3. 폴더 내의 래스터 파일들을 정렬된 순서대로 읽기
raster_files = sorted([f for f in os.listdir(hillshade_folder) if f.lower().endswith('.tif')])
if len(raster_files) != len(solar_df):
    print("경고: 래스터 파일의 갯수와 CSV 파일의 행 수가 일치하지 않습니다. 둘 중 작은 개수로 진행합니다.")

n_files = min(len(raster_files), len(solar_df))

# ------------------------------------
# 결과 통계 저장 리스트 (각 행: [래스터파일명, 0이 아닌 셀 갯수, 전체 셀값 합계])
stats_list = []

# ------------------------------------
# 4. 각 래스터 파일에 대해 처리 (tif 파일은 생성하지 않고 통계만 계산)
for i in tqdm(range(n_files), desc="래스터 처리중"):
    raster_file = raster_files[i]
    raster_path = os.path.join(hillshade_folder, raster_file)
    
    # CSV의 i번째 행값 추출
    row = solar_df.iloc[i]
    
    SI = row['Irradiance']
    shading_factor = row['SelfShading']
    
    # 한 래스터 파일 처리 및 통계 계산 (tif 파일은 별도 출력하지 않음)
    nonzero_count, total_value = process_raster_file(raster_path, SI, shading_factor)
    
    # 통계 정보 리스트에 추가: 파일명, 0이 아닌 셀 갯수, 전체 값 합계
    stats_list.append([raster_file, nonzero_count, total_value])

# ------------------------------------
# 5. 통계 결과를 새로운 CSV 파일로 저장
stats_df = pd.DataFrame(stats_list, columns=['RasterFile', 'NonZeroCount', 'TotalValue'])
stats_csv_path = os.path.join(output_folder, "raster_statistics.csv")
stats_df.to_csv(stats_csv_path, index=False, encoding='utf-8')

print(f"모든 래스터 파일의 발전량 통계 CSV 생성 및 {output_folder}에 저장 완료!")

래스터 처리중: 100%|██████████| 4400/4400 [01:59<00:00, 36.71it/s]


모든 래스터 파일의 발전량 통계 CSV 생성 및 C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Power_naju_Hori에 저장 완료!


In [17]:
import pandas as pd
import os


NH=4600 
NV=10490
GH=6300
GV=6700

# 1. CSV 입력 및 출력 경로 설정
csv_input = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\tmy\Study_tmy\Gangneung_samcsv.csv"
csv_output = r"C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Power_gangneung_Hori\PVgen_GHori.csv"

# 2. 헤더가 3번째 행에 있으므로 header=2로 읽기
df = pd.read_csv(csv_input, encoding='utf-8', header=2)

# 3. 필요한 열 추출: 'Irradiance', 'Hable', 'Month', 'Day', 'Hour'
required_cols = ['Irradiance', 'Hable', 'Month', 'Day', 'Hour']
if not all(col in df.columns for col in required_cols):
    raise ValueError("필요한 열이 누락되어 있습니다.")
df_filtered = df[required_cols].copy()

# 4. 발전량 계산
# PVgen = 0.22 * 0.9 * Irradiance * Hable * 4500 * 20
df_filtered['PVgen'] = 0.22 * 0.9 * df_filtered['Irradiance'] * df_filtered['Hable'] * GH * 20

# 5. Timestamp 문자열 생성 (year는 모두 2023, Month, Day, Hour는 두 자리 형식)
df_filtered['Timestamp'] = (
    '2023-' +
    df_filtered['Month'].astype(int).astype(str).str.zfill(2) + '-' +
    df_filtered['Day'].astype(int).astype(str).str.zfill(2) + '-' +
    df_filtered['Hour'].astype(int).astype(str).str.zfill(2)
)

# 6. 결과 DataFrame 구성
# A열: Time (Timestamp), B열: PVgen
result_df = df_filtered[['Timestamp', 'PVgen']].copy()
result_df.columns = ['Time', 'PVgen']

# 7. 추가 기능: 
# 7.1 C열 ("kWh"): PVgen의 0.001배 값
result_df['kWh'] = result_df['PVgen'] * 0.001

# 7.2 D열 ("kWh/m2"): kWh 값을 4500*20으로 나눈 값
result_df['kWh/m2'] = result_df['kWh'] /  (GH * 20)

# 8. CSV 파일로 출력
result_df.to_csv(csv_output, index=False, encoding='utf-8')

print(f"CSV 파일이 생성되었습니다: {csv_output}")

CSV 파일이 생성되었습니다: C:\Users\82105\Desktop\Junkyo\2025\PVSEC\GIS_preprocessing\Power_gangneung_Hori\PVgen_GHori.csv
