In [12]:
from IPython.display import display, HTML
display(HTML("""
<style>
div.container{width:86% !important;}
div.cell.code_cell.rendered{width:100%;}
div.CodeMirror {font-family:Consolas; font-size:15pt;}
div.output {font-size:15pt; font-weight:bold;}
div.input {font-family:Consolas; font-size:15pt;}
div.prompt {min-width:70px;}
div#toc-wrapper{padding-top:120px;}
div.text_cell_render ul li{font-size:12pt;padding:5px;}
table.dataframe{font-size:15px;}
</style>
"""))

In [24]:
import pandas as pd
import os

In [23]:
# ML_COMPLETE_DATASET 데이터 로드
try:
    df = pd.read_csv('C:/Project1/crew_soom/data/raw/processed/ML_COMPLETE_DATASET.csv')
    df['obs_date'] = pd.to_datetime(df['obs_date'])
    print('데이터 로드 완료')
except :
    print('데이터 로드 실패')

데이터 로드 완료


In [7]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 933 entries, 0 to 932
Data columns (total 24 columns):
 #   Column             Non-Null Count  Dtype         
---  ------             --------------  -----         
 0   id                 933 non-null    int64         
 1   year               933 non-null    int64         
 2   month              933 non-null    int64         
 3   day                933 non-null    int64         
 4   obs_date           933 non-null    datetime64[ns]
 5   season_type        933 non-null    object        
 6   avg_temp           933 non-null    float64       
 7   min_temp           932 non-null    float64       
 8   max_temp           933 non-null    float64       
 9   humidity           933 non-null    float64       
 10  precipitation      933 non-null    float64       
 11  wind_speed         931 non-null    float64       
 12  is_flood_risk      933 non-null    int64         
 13  created_at         933 non-null    object        
 14  actual_flo

In [11]:
#실제 침수 사건 데이터 로드
try:
    df = pd.read_csv('C:/Project1/crew_soom/data/raw/flood_events/actual_flood_events_2022_2024.csv')
    df['flood_date'] = pd.to_datetime(df['flood_date'])
    print('실제 침수 사건 데이터 로드 완료')
except:
    print('데이터 로드 실패')

실제 침수 사건 데이터 로드 완료


# 데이터 로드 클래스

In [13]:
import pandas as pd
import os

class DataLoader:
    def __init__(self): #객체 생성 시 자동 실행
        self.data_path = { 
            'ml_data_load':'C:/Project1/crew_soom/data/raw/processed/ML_COMPLETE_DATASET.csv',
            'flood_date_load':'C:/Project1/crew_soom/data/raw/flood_events/actual_flood_events_2022_2024.csv',
            'daily_all_load':'C:/Project1/crew_soom/data/raw/daily/daily_all_3years.csv'
        }
    
    def load_ml_ready_data(self): # ML_COMPLETE_DATASET 데이터 로드 메서드
        try:
            df = pd.read_csv(self.data_path['ml_data_load']) #딕셔너리의 'ml_data_load'키 가져오기
            df['obs_date'] = pd.to_datetime(df['obs_date']) #'obs_date'를 datetime타입으로 변경
            print(f"✅ ML 데이터 로드: {len(df)}행")
            return df
        except FileNotFoundError: #파일을 못 찾는 에러 발생 시
            print("❌ ML_COMPLETE_DATASET.csv를 찾을 수 없습니다.")
            print("💡 STRATEGIC_FLOOD_DATA/4_ML_READY/에서 파일을 복사하세요.")
            return None
        
    def load_flood_event(self):
        try:
            df = pd.read_csv(self.data_path['flood_date_load']) #딕셔너리의 'flood_date_load'키 가져오기
            df['flood_date'] = pd.to_datetime(df['flood_date']) #'flood_date'를 datetime타입으로 변경
            print(f"✅ 침수 사건 데이터 로드: {len(df)}건")
            return df
        except FileNotFoundError: #파일을 못 찾는 에러 발생 시
            print("❌ 침수 사건 데이터를 찾을 수 없습니다.")
            return None
        
    def get_data_info(self): #데이터 정보 반환
        info = {} # 중첩 딕셔너리 구조({name:{},...})
        for name, path in self.data_path.items(): #name, path:키, 값. data_path의 요소 반복
            if os.path.exists(path):#path(파일 경로)가 존재할 때
                try: #파일이 읽어질 경우
                    df = pd.read_csv(path) #파일 읽어오기
                    info[name] = {
                        'exists': True,
                        'rows' : len(df),
                        'columns' : df.columns,
                        'size_mb' : os.path.getsize(path)/1024/1024 # 파일 크기를 메가바이트(MB) 단위로 변환
                    }
                except : #파일이 읽어지지 않을 경우(오류)
                    info[name] = {'exists':False}
            else: #path가 존재하지 않을 때
                info[name] = {'exists':False}
        return info