In [1]:
import os
import geopandas as gpd
import rasterio
from rasterio.plot import show
import pandas as pd

raster_dir = r'D:\Landslide\data\processed\gyeongnam\DEM_outputs'

print("🗺️ DEM 래스터 파일 분석")
print("="*80)

# TIF 파일 목록 수집
tif_files = [f for f in os.listdir(raster_dir) if f.endswith('.tif')]
print(f"발견된 TIF 파일: {len(tif_files)}개\n")

if not tif_files:
    print(f"❌ TIF 파일을 찾을 수 없습니다: {raster_dir}")
else:
    # 래스터 정보 수집
    raster_info = []
    
    for idx, filename in enumerate(sorted(tif_files)):
        filepath = os.path.join(raster_dir, filename)
        
        try:
            with rasterio.open(filepath) as src:
                info = {
                    '파일명': filename,
                    '크기 (행x열)': f"{src.height} x {src.width}",
                    '밴드 수': src.count,
                    '좌표계 (CRS)': str(src.crs),
                    '픽셀 크기': f"{abs(src.transform[0]):.1f}m x {abs(src.transform[4]):.1f}m",
                    '범위 (minx, miny, maxx, maxy)': f"({src.bounds.left:.0f}, {src.bounds.bottom:.0f}, {src.bounds.right:.0f}, {src.bounds.top:.0f})",
                    '데이터 타입': str(src.dtypes[0]),
                    '파일 크기': f"{os.path.getsize(filepath) / 1024**2:.1f} MB"
                }
                raster_info.append(info)
                
                print(f"📋 [{idx+1}] {filename}")
                print(f"    크기: {info['크기 (행x열)']} ({info['밴드 수']}밴드)")
                print(f"    좌표계: {info['좌표계 (CRS)']}")
                print(f"    픽셀 크기: {info['픽셀 크기']}")
                print(f"    범위: {info['범위 (minx, miny, maxx, maxy)']}")
                print(f"    데이터 타입: {info['데이터 타입']} | 파일 크기: {info['파일 크기']}")
                print()
                
        except Exception as e:
            print(f"❌ [{idx+1}] {filename} - 읽기 실패: {e}")
            print()
    
    # DataFrame으로 정리
    if raster_info:
        df = pd.DataFrame(raster_info)
        
        print("="*80)
        print("📊 요약 정보")
        print("="*80)
        
        # 좌표계 통계
        crs_counts = df['좌표계 (CRS)'].value_counts()
        print("\n🌐 좌표계 분포:")
        for crs, count in crs_counts.items():
            print(f"  - {crs}: {count}개 파일")
        
        # 크기 통계
        unique_sizes = df['크기 (행x열)'].value_counts()
        print("\n📏 래스터 크기 분포:")
        for size, count in unique_sizes.items():
            print(f"  - {size}: {count}개 파일")
        
        # 픽셀 크기 통계
        unique_pixel_sizes = df['픽셀 크기'].value_counts()
        print("\n🔍 픽셀 해상도 분포:")
        for pixel_size, count in unique_pixel_sizes.items():
            print(f"  - {pixel_size}: {count}개 파일")
        
        print(f"\n📁 총 파일 크기: {df['파일 크기'].str.replace(' MB', '').astype(float).sum():.1f} MB")
        
        # 정렬된 전체 테이블 표시
        print("\n" + "="*80)
        print("📋 전체 래스터 정보 테이블")
        print("="*80)
        
        # 더 나은 표시를 위해 열 순서 조정
        display_columns = ['파일명', '크기 (행x열)', '좌표계 (CRS)', '픽셀 크기', '데이터 타입', '파일 크기']
        display_df = df[display_columns]
        
        # pandas 표시 옵션 설정
        pd.set_option('display.max_columns', None)
        pd.set_option('display.width', None)
        pd.set_option('display.max_colwidth', 50)
        
        print(display_df.to_string(index=False))
        
        print("\n💡 주요 확인 사항:")
        print("  ✅ 모든 래스터가 동일한 좌표계를 사용하는지 확인")
        print("  ✅ 모든 래스터가 동일한 픽셀 크기를 사용하는지 확인")  
        print("  ✅ 래스터 간 공간적 범위가 일치하는지 확인")
        print("  ✅ 데이터 타입이 적절한지 확인 (보통 float32 또는 int16)")

print("\n" + "="*80)



🗺️ DEM 래스터 파일 분석
발견된 TIF 파일: 8개

📋 [1] accm.tif
    크기: 5202 x 4973 (1밴드)
    좌표계: EPSG:5179
    픽셀 크기: 30.0m x 30.0m
    범위: (1006912, 1612165, 1156102, 1768225)
    데이터 타입: float32 | 파일 크기: 55.0 MB

📋 [2] aspect_deg.tif
    크기: 5202 x 4973 (1밴드)
    좌표계: EPSG:5179
    픽셀 크기: 30.0m x 30.0m
    범위: (1006912, 1612165, 1156102, 1768225)
    데이터 타입: float32 | 파일 크기: 52.4 MB

📋 [3] curv_plan.tif
    크기: 5202 x 4973 (1밴드)
    좌표계: EPSG:5179
    픽셀 크기: 30.0m x 30.0m
    범위: (1006912, 1612165, 1156102, 1768225)
    데이터 타입: float32 | 파일 크기: 56.1 MB

📋 [4] curv_prof.tif
    크기: 5202 x 4973 (1밴드)
    좌표계: EPSG:5179
    픽셀 크기: 30.0m x 30.0m
    범위: (1006912, 1612165, 1156102, 1768225)
    데이터 타입: float32 | 파일 크기: 55.8 MB

📋 [5] lnspi_use.tif
    크기: 5202 x 4973 (1밴드)
    좌표계: EPSG:5179
    픽셀 크기: 30.0m x 30.0m
    범위: (1006912, 1612165, 1156102, 1768225)
    데이터 타입: float32 | 파일 크기: 50.6 MB

📋 [6] slope_deg.tif
    크기: 5202 x 4973 (1밴드)
    좌표계: EPSG:5179
    픽셀 크기: 30.0m x 30.0m
    범위: (1006912