# 설정 로드 & 실행

In [1]:
import os

# 현재 작업디렉토리 확인
print("현재 작업 디렉토리:", os.getcwd())

# 노트북 위치에서 프로젝트 루트로 이동(필요시 경로 조정)
os.chdir("../../")

# 작업 디렉토리 변경 후 다시 확인
print("변경 후 작업 디렉토리:", os.getcwd())

현재 작업 디렉토리: /home/ieyeppo/AI_Lab/computer-vision-competition-1SEN/notebooks/team/CHH
변경 후 작업 디렉토리: /home/ieyeppo/AI_Lab/computer-vision-competition-1SEN/notebooks


In [2]:
# [추가] CHH 데이터 스키마 분석 노트북 로거 설정
# 결과 저장을 위한 로거 초기화
import sys
import os
sys.path.append('../../../')  # 프로젝트 루트로 경로 추가

from src.logging.notebook_logger import create_notebook_logger

# 프로젝트 루트 디렉토리 찾기
current_dir = os.getcwd()
if 'notebooks/team/CHH' in current_dir:
    project_root = current_dir.replace('/notebooks/team/CHH', '')
else:
    project_root = os.path.abspath('../../../')

# 절대 경로로 팀 노트북 로거 초기화
base_log_path = os.path.join(project_root, "notebooks/team")
logger = create_notebook_logger(
    base_log_dir=base_log_path,
    folder_name="CHH", 
    file_name="00_data_schema_and_integrity"
)

print("✅ CHH 데이터 스키마 & 무결성 검증 노트북 로거 설정 완료!")
print(f"📁 로그 경로: {logger.log_dir}")

📝 노트북 작업 시작: 00_data_schema_and_integrity
📝 로그 디렉토리: /home/ieyeppo/notebooks/team/CHH/00_data_schema_and_integrity/20250912_014919
✅ CHH 데이터 스키마 & 무결성 검증 노트북 로거 설정 완료!
📁 로그 경로: /home/ieyeppo/notebooks/team/CHH/00_data_schema_and_integrity/20250912_014919/logs


In [None]:
import json, os
import pandas as pd
from notebooks.team.CHH.src.data_schema_integrity_check import main as run_checks
from IPython.display import display

CFG = 'configs/data_config.json'
# 원래 셸 호출(!python -m ...) 대신 직접 함수 호출로 실행(더 안전하고 에러 핸들링 가능)
try:
    run_checks(CFG)
except Exception as e:
    print('Error running data_schema_integrity_check:', e)

# 산출물 경로
schema_path = 'data/processed/data_schema.json'
weights_path = 'data/processed/class_weights.json'

# 산출물 확인: JSON 파일이 있으면 내용 출력 또는 DataFrame으로 로드
if os.path.exists(schema_path):
    try:
        with open(schema_path, 'r', encoding='utf-8') as f:
            data = json.load(f)
        print(json.dumps(data, ensure_ascii=False, indent=2))
    except Exception as e:
        print('Failed to read schema file:', e)
else:
    print(f'Not found: {schema_path}')

if os.path.exists(weights_path):
    try:
        # class_weights.json은 JSON 포맷일 가능성이 높음. 먼저 시도해보고 DataFrame으로 변환
        weights = pd.read_json(weights_path)
        display(weights)
    except ValueError:
        # JSON이 dict 형태일 경우 그대로 프린트
        try:
            with open(weights_path, 'r', encoding='utf-8') as f:
                w = json.load(f)
            print(w)
        except Exception as e:
            print('Failed to read class_weights.json:', e)
else:
    print(f'Not found: {weights_path}')

ModuleNotFoundError: No module named 'src.data_schema_integrity_check'

In [None]:
# [추가] CHH 데이터 스키마 분석 완료 요약
print("\n" + "="*60)
print("🏁 CHH 데이터 스키마 & 무결성 검증 노트북 완료!")
print("="*60)

# 로거 정보 출력
logger.print_summary()

print("\n📄 분석 내용:")
print("   ✅ 데이터 스키마 검증")
print("   ✅ 데이터 무결성 체크")

print(f"\n💾 분석 결과는 다음 디렉토리에 저장되었습니다:")
print(f"   📁 {logger.log_dir}")

print("\n🎯 팀 노트북 통합 모듈화 프로젝트 - CHH 데이터 분석 시리즈")