In [1]:
import pandas as pd
from io import StringIO
from pathlib import Path
from datetime import datetime

# ===== 설정 =====
root_dir   = Path(".")              # 노트북을 여는 위치가 루트라고 가정
data_dir   = root_dir / "data"
result_dir = root_dir / "result"

# 타임스탬프 폴더명: yyyymmdd-hhmmssffffff (요청의 yyyymmdd-hhmmssssss 해석: 초+마이크로초 6자리)
stamp = datetime.now().strftime("%Y%m%d-%H%M%S%f")
out_dir = result_dir / stamp
out_dir.mkdir(parents=True, exist_ok=True)

# 선택할 열 (1-based)
cols_1based = [1, 2, 4, 6, 8, 11, 12, 13, 15, 16, 17, 18]
cols_0based_all = [c - 1 for c in cols_1based]

def read_and_filter_csv(file_path: Path) -> pd.DataFrame:
    """
    - 파일을 라인 단위로 읽고
    - 30번째 줄(1-based) 이후에서 짝수 줄(실데이터)만 선택
    - 그 줄들만 모아 구분자 자동 감지로 DataFrame 생성
    - 지정 열만 남겨 반환
    """
    # 인코딩 시도: utf-8-sig -> cp949
    encodings = ["utf-8-sig", "cp949"]
    last_err = None
    for enc in encodings:
        try:
            with open(file_path, "r", encoding=enc, errors="replace") as f:
                lines = f.readlines()
            break
        except Exception as e:
            last_err = e
            lines = None
    if lines is None:
        raise RuntimeError(f"파일 열기 실패: {file_path} / 마지막 에러: {last_err}")

    # 30번째 줄(1-based) → 0-based 인덱스 29 이후만 사용
    data_region = lines[29:]
    # data_region에서 0이 1번째 줄이므로, 짝수 줄(실데이터)은 i % 2 == 1
    data_only_lines = [line for i, line in enumerate(data_region) if (i % 2) == 1]
    data_only_text = "".join(data_only_lines)

    if not data_only_text.strip():
        # 실데이터가 없으면 빈 DF 반환
        return pd.DataFrame()

    # 구분자 자동 추론
    df = pd.read_csv(StringIO(data_only_text), header=None, dtype=str, sep=None, engine="python")

    # 실제 있는 열만 안전 선택
    max_col = df.shape[1]
    cols_0based = [c for c in cols_0based_all if 0 <= c < max_col]

    if not cols_0based:
        # 선택할 열이 없다면 원본 유지(혹은 빈 DF)
        return pd.DataFrame()

    return df.iloc[:, cols_0based].reset_index(drop=True)

# ===== 실행: data 폴더의 모든 CSV 처리 =====
csv_files = sorted(p for p in data_dir.glob("*.csv"))
if not csv_files:
    print(f"[경고] CSV 파일이 없습니다: {data_dir.resolve()}")

processed_dfs = []
summary = []

for csv_path in csv_files:
    try:
        df_proc = read_and_filter_csv(csv_path)
        processed_dfs.append((csv_path.name, df_proc))

        # 개별 파일 저장: 원본 파일명 + _processed.csv
        out_file = out_dir / f"{csv_path.stem}_processed.csv"
        df_proc.to_csv(out_file, index=False, header=False, encoding="utf-8-sig")

        summary.append((csv_path.name, df_proc.shape))
        print(f"[OK] {csv_path.name} -> {out_file.name} ({df_proc.shape[0]}행 x {df_proc.shape[1]}열)")
    except Exception as e:
        summary.append((csv_path.name, f"에러: {e}"))
        print(f"[에러] {csv_path.name}: {e}")

# ===== 머지 파일 생성 =====
if processed_dfs:
    merged = pd.concat([df for _, df in processed_dfs if not df.empty], ignore_index=True) if any(not df.empty for _, df in processed_dfs) else pd.DataFrame()
    merged_file = out_dir / "merged.csv"
    if not merged.empty:
        merged.to_csv(merged_file, index=False, header=False, encoding="utf-8-sig")
        print(f"[MERGED] merged.csv 생성: {merged.shape[0]}행 x {merged.shape[1]}열")
    else:
        # 빈 결과라도 파일은 만들어둘 수 있음(원치 않으면 이 블록을 제거)
        merged.to_csv(merged_file, index=False, header=False, encoding="utf-8-sig")
        print("[MERGED] 실데이터가 없어 빈 merged.csv를 생성했습니다.")
else:
    print("[종료] 처리할 파일이 없어 merged.csv를 생성하지 않았습니다.")

print(f"\n결과 폴더: {out_dir.resolve()}")
print("요약:")
for name, info in summary:
    print(f" - {name}: {info}")


[OK] 251013_345-5_TEST01.csv -> 251013_345-5_TEST01_processed.csv (210행 x 12열)
[OK] 251013_415-1_TEST01.csv -> 251013_415-1_TEST01_processed.csv (138행 x 12열)
[OK] 251013__TEST012.csv -> 251013__TEST012_processed.csv (376행 x 12열)
[OK] 251013__TEST2[0].csv -> 251013__TEST2[0]_processed.csv (113행 x 12열)
[OK] 251013__TEST2[0][0].csv -> 251013__TEST2[0][0]_processed.csv (113행 x 12열)
[OK] 251014_UHD_CAFE1.csv -> 251014_UHD_CAFE1_processed.csv (1행 x 12열)
[OK] 251014_UHD_CAFE2.csv -> 251014_UHD_CAFE2_processed.csv (1행 x 12열)
[OK] 251014_UHD_CAFE3.csv -> 251014_UHD_CAFE3_processed.csv (1행 x 12열)
[OK] 251014_UHD_DT11.csv -> 251014_UHD_DT11_processed.csv (59행 x 12열)
[OK] 251014_UHD_DT12.csv -> 251014_UHD_DT12_processed.csv (58행 x 12열)
[OK] 251014_UHD_DT21.csv -> 251014_UHD_DT21_processed.csv (59행 x 12열)
[OK] 251014_UHD_DT22.csv -> 251014_UHD_DT22_processed.csv (58행 x 12열)
[OK] 251014_UHD_DT23.csv -> 251014_UHD_DT23_processed.csv (38행 x 12열)
[OK] 251021_uhd_NAMSAN.csv -> 251021_uhd_NAMSAN_processe

In [2]:
import pandas as pd
import numpy as np
from pathlib import Path
import re
import folium
from folium import LayerControl
import matplotlib.colors as mcolors
from branca.colormap import StepColormap

def add_basestation(map_name):
    # 기지국 위치
    site_lat, site_lon = 37.5472288, 126.9815217
    folium.Marker(
        [site_lat, site_lon],
        icon=folium.Icon(color="black", icon="signal"),
        popup="n26/n28 Cell"
    ).add_to(map_name)
    
def make_step_cmap(vmin, vmax, caption):
    base_colors = [
        "#FF0000",  # 1 빨강
        # "#FF4D00",  # 2 밝은 주황
        "#FF8000",  # 3 오렌지
        "#FFB300",  # 4 연한 오렌지
        "#FFD700",  # 5 노랑
        # "#E6FF33",  # 6 연노랑-연두 사이
        "#ADFF2F",  # 7 연두
        "#008000",  # 6 진한 초록
        # "#7FFF00",  # 8 진연두
        # "#33FF99",  # 9 청록
        "#00FFFF",  # 10 하늘
        # "#33CCFF",  # 11 연하늘
        "#3399FF",  # 12 중간 파랑
        "#0066FF",  # 13 진파랑
        "#4B00FF",  # 14 보라파랑
        "#8B00FF",  # 15 보라
        "#CC66FF",  # 16 연보라
        "#FF66CC",  # 17 핑크보라 (마무리)
    ]
    base_colors.reverse()
    
    step = (vmax - vmin) / len(base_colors)
    bins = np.arange(vmin, vmax + step, step)
    return StepColormap(
        colors=base_colors,
        index=bins,
        vmin=vmin, vmax=vmax,
        caption=caption
    )

root_dir = Path(".")
result_root = root_dir / "result"

pattern = re.compile(r"^\d{8}-\d{6}\d{6}$")
candidates = [p for p in result_root.iterdir() if p.is_dir() and pattern.match(p.name)]
if not candidates:
    raise FileNotFoundError("result 폴더 안에 타임스탬프 하위 폴더가 없습니다.")
out_dir = max(candidates, key=lambda p: p.stat().st_mtime)

merged_path = out_dir / "merged.csv"
if not merged_path.exists():
    raise FileNotFoundError(f"merged.csv가 없습니다: {merged_path}")

print(f"[정보] 사용 파일: {merged_path}")

# =========================
# 데이터 로드
# =========================
df = pd.read_csv(merged_path, header=None, dtype=str)

COL_VAL = 2
LAT_D, LAT_M, LAT_S = 5, 6, 7
LON_D, LON_M, LON_S = 8, 9, 10

# 숫자 변환
for c in [COL_VAL, LAT_D, LAT_M, LAT_S, LON_D, LON_M, LON_S]:
    df[c] = pd.to_numeric(df[c], errors="coerce")

# NaN 제거
df = df.dropna(subset=[COL_VAL, LAT_D, LAT_M, LAT_S, LON_D, LON_M, LON_S]).copy()

# =========================
# DMS → Decimal Degrees
# =========================
def dms_to_dd(deg, minutes, seconds):
    sign = np.sign(deg)
    deg_abs = np.abs(deg)
    return sign * (deg_abs + (np.abs(minutes) / 60.0) + (np.abs(seconds) / 3600.0))

df["lat"] = dms_to_dd(df[LAT_D], df[LAT_M], df[LAT_S])
df["lon"] = dms_to_dd(df[LON_D], df[LON_M], df[LON_S])
df = df[(df["lat"].between(-90, 90)) & (df["lon"].between(-180, 180))].copy()

# =========================
# 값 처리 (Clipping 없음, 전체 데이터 사용)
# =========================
df["value_raw"] = pd.to_numeric(df[COL_VAL], errors="coerce")
df = df.dropna(subset=["value_raw"]).copy()
df["value"] = df["value_raw"]

print(f"[데이터] 총 {len(df)} 행 사용")

print(df.info())

df = df[['lat','lon','value']].copy()

display(df)

import os
from datetime import datetime
today = datetime.now().strftime("%Y%m%d")  # 예: 20251019
csv_path = os.path.join(root_dir, f"UHD_Power_{today}.csv")
df.to_csv(csv_path, index=True, encoding='utf-8-sig')
print(f"Saved CSV file: {csv_path}")


[정보] 사용 파일: result/20251022-214359206757/merged.csv
[데이터] 총 4384 행 사용
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4384 entries, 0 to 4383
Data columns (total 16 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   0          4384 non-null   object 
 1   1          4384 non-null   object 
 2   2          4384 non-null   float64
 3   3          4384 non-null   object 
 4   4          4384 non-null   object 
 5   5          4384 non-null   int64  
 6   6          4384 non-null   int64  
 7   7          4384 non-null   float64
 8   8          4384 non-null   int64  
 9   9          4384 non-null   int64  
 10  10         4384 non-null   float64
 11  11         4384 non-null   object 
 12  lat        4384 non-null   float64
 13  lon        4384 non-null   float64
 14  value_raw  4384 non-null   float64
 15  value      4384 non-null   float64
dtypes: float64(7), int64(4), object(5)
memory usage: 548.1+ KB
None


Unnamed: 0,lat,lon,value
0,37.547364,126.981693,-44.29
1,37.547347,126.981865,-42.05
2,37.547500,126.982015,-35.66
3,37.547619,126.982187,-37.62
4,37.547755,126.982316,-44.30
...,...,...,...
4379,37.550750,126.981372,-44.14
4380,37.550597,126.981372,-44.26
4381,37.550444,126.981415,-41.21
4382,37.550274,126.981457,-34.99


Saved CSV file: ./UHD_Power_20251022.csv
