In [3]:
import pandas as pd
import re

# CSV 파일 불러오기 (인코딩 문제 해결용 encoding='cp949' 또는 'utf-8-sig'로 조정)
df = pd.read_csv("nutri_recom.csv", encoding="cp949")

# 열 이름 단순화: 단위 제거하고 공백 제거
new_columns = []
for col in df.columns:
    # 괄호 및 그 안의 단위 제거
    new_col = re.sub(r"\(.*?\)", "", col)
    # 공백 제거
    new_col = new_col.strip().replace(" ", "")
    new_columns.append(new_col)

df.columns = new_columns  # 열 이름 업데이트

# 값 단위 변환 함수 정의
def convert_value(val, original_unit):
    try:
        val = float(val)
    except:
        return val  # 숫자로 변환 안 되면 그대로 반환

    # 단위에 따라 변환
    if original_unit == "g":
        return round(val * 1000, 3)  # g → mg
    elif original_unit == "μg":
        return round(val / 1000, 6)  # μg → mg
    elif original_unit == "mg":
        return round(val, 3)         # mg 그대로
    elif original_unit == "kcal":
        return round(val, 1)         # kcal 그대로
    else:
        return val  # 변환 안 되면 그대로

# 원래 열 이름과 단위 매핑
unit_map = {
    "에너지(kcal)": "kcal",
    "탄수화물(g)": "g",
    "식이섬유(g)": "g",
    "단백질(g)": "g",
    "리놀레산(g)": "g",
    "알파-리놀렌산(g)": "g",
    "EPA+DHA(mg)": "mg",
    "메티오닌(g)": "g",
    "류신(g)": "g",
    "이소류신(g)": "g",
    "발린(g)": "g",
    "라이신(g)": "g",
    "페닐알라닌+티로신(g)": "g",
    "트레오닌(g)": "g",
    "트립토판(g)": "g",
    "히스티딘(g)": "g",
    "비타민 A(μg RAE)": "μg",
    "비타민 D(μg)": "μg",
    "비타민 E(μg α-TE)": "μg",
    "비타민 K(μg)": "μg",
    "비타민 C(μg)": "μg",
    "비타민 B1(μg)": "μg",
    "비타민B2(μg)": "μg",
    "니아신(mg NE)": "mg",
    "비타민 B6 (μg)": "μg",
    "비타민 B12 (μg)": "μg",
    "엽산(μg DFE)": "μg",
    "판토텐산(mg)": "mg",
    "비오틴(μg)": "μg",
    "칼슘(mg)": "mg",
    "인(mg)": "mg",
    "나트륨(mg)": "mg",
    "염소(mg)": "mg",
    "칼륨(mg)": "mg",
    "마그네슘(mg)": "mg",
    "철(mg)": "mg",
    "아연(mg)": "mg",
    "구리(μg)": "μg",
    "망간(mg)": "mg",
    "요오드(μg)": "μg",
    "셀레늄(μg)": "μg",
    "몰리브덴(μg)": "μg",
    "크롬(μg)": "μg"
}

# 열 이름 정리와 값 변환 적용
for original_col, unit in unit_map.items():
    simple_col = re.sub(r"\(.*?\)", "", original_col).strip().replace(" ", "")
    if simple_col in df.columns:
        df[simple_col] = df[simple_col].apply(lambda x: convert_value(x, unit))

# 결과 저장
df.to_csv("nutri_recom_cleaned.csv", index=False, encoding="utf-8-sig")