In [1]:
import pandas as pd
import glob

# 1️⃣ 현재 폴더의 모든 'recipes_over100k_' 로 시작하는 CSV 파일 불러오기
csv_files = glob.glob("recipes_over100k_*.csv")

# 2️⃣ 파일 확인
print("📂 병합할 파일 목록:")
for f in csv_files:
    print(" -", f)

# 3️⃣ 파일 읽어서 하나의 DataFrame으로 합치기
dfs = [pd.read_csv(f) for f in csv_files]
merged_df = pd.concat(dfs, ignore_index=True)

# 4️⃣ 중복 제거 (같은 RECIPE_ID가 여러 카테고리에 있을 수 있음)
merged_df.drop_duplicates(subset=["RECIPE_ID"], inplace=True)

# 5️⃣ 최종 CSV 저장
output_name = "recipes_over100k_all.csv"
merged_df.to_csv(output_name, index=False, encoding="utf-8-sig")

print(f"\n✅ 병합 완료! 총 {len(merged_df)}개 레시피 → {output_name}")


📂 병합할 파일 목록:
 - recipes_over100k_국_탕.csv
 - recipes_over100k_기타.csv
 - recipes_over100k_메인반찬.csv
 - recipes_over100k_면_만두.csv
 - recipes_over100k_밑반찬.csv
 - recipes_over100k_밥_죽_떡.csv
 - recipes_over100k_샐러드.csv
 - recipes_over100k_스프.csv
 - recipes_over100k_양식.csv
 - recipes_over100k_찌개.csv
 - recipes_over100k_퓨전.csv

✅ 병합 완료! 총 1442개 레시피 → recipes_over100k_all.csv


In [19]:
import pandas as pd
import ast  # 문자열 딕셔너리 파싱용

# ✅ 분류 기준
INGREDIENT_KEYWORDS = {
    "소고기": "소고기류", "쇠고기": "소고기류", "양지": "소고기류",
    "돼지고기": "돼지고기류", "삼겹살": "돼지고기류", "목살": "돼지고기류",
    "닭": "닭고기류", "오리": "닭고기류",
    "새우": "해물류", "오징어": "해물류", "조개": "해물류",
    "굴": "해물류", "멸치": "해물류", "참치": "해물류",
    "채소": "채소류", "양파": "채소류", "당근": "채소류",
    "감자": "채소류", "버섯": "버섯류", "두부": "콩/견과류",
}

PRIORITY = [
    ("소고기", "소고기류"), ("쇠고기", "소고기류"), ("양지", "소고기류"),
    ("돼지고기", "돼지고기류"), ("삼겹살", "돼지고기류"),
    ("닭", "닭고기류"), ("오리", "닭고기류"),
    ("새우", "해물류"), ("오징어", "해물류"), ("조개", "해물류"),
    ("굴", "해물류"), ("멸치", "해물류"), ("참치", "해물류"),
]

# ✅ 1️⃣ CSV 불러오기 (병합된 파일 경로 입력)
df = pd.read_csv("recipes_over100k_all.csv")

# ✅ 2️⃣ IRDNT_CODE 분류 함수
def classify_ingredient(ingredient_text):
    try:
        ingredients = ast.literal_eval(ingredient_text.replace("'", '"'))  # 문자열 → dict
        names = ingredients.keys()
    except Exception:
        return "기타"

    # 1️⃣ 우선순위 그룹 먼저 확인
    for keyword, category in PRIORITY:
        if any(keyword in name for name in names):
            return category

    # 2️⃣ 일반 키워드 검색
    for name in names:
        for keyword, category in INGREDIENT_KEYWORDS.items():
            if keyword in name:
                return category

    # 3️⃣ 해당 없으면 기타
    return "기타"

# ✅ 3️⃣ IRDNT_CODE 생성
df["IRDNT_CODE"] = df["INGREDIENT_FULL"].apply(classify_ingredient)

# ✅ 4️⃣ 컬럼 순서 재정렬
cols = [
    "RECIPE_ID", "RECIPE_NM_KO", "SUMRY", "SERVINGS", "TY_NM",
    "COOKING_TIME", "LEVEL_NM", "IRDNT_CODE",
    "INGREDIENT_FULL", "STEP_TEXT", "STEP_TIP"
]
df = df[cols]

# ✅ 5️⃣ 저장
#df.to_csv("recipes_over100k_all_with_IRDNT.csv", index=False, encoding="utf-8-sig")

print(f"✅ IRDNT_CODE 추가 완료! 총 {len(df)}개 레시피 → recipes_over100k_all_with_IRDNT.csv")


✅ IRDNT_CODE 추가 완료! 총 1442개 레시피 → recipes_over100k_all_with_IRDNT.csv


In [35]:
# 파일 경로
df = pd.read_csv("recipes_over100k_all_with_IRDNT.csv", encoding='utf-8-sig')  # 한글 CSV는 utf-8

In [36]:
print(df['LEVEL_NM'].unique())      # 난이도 이름 목록
print(df['IRDNT_CODE'].unique())    # 재료 코드 목록

['아무나' '초급' '중급' '고급']
['해물류' '기타' '소고기류' '닭고기류' '채소류' '콩/견과류' '버섯류' '돼지고기류']


In [21]:
df[df['LEVEL_NM'].isna()]


Unnamed: 0,RECIPE_ID,RECIPE_NM_KO,SUMRY,SERVINGS,TY_NM,COOKING_TIME,LEVEL_NM,IRDNT_CODE,INGREDIENT_FULL,STEP_TEXT,STEP_TIP
143,6830965,<요리>등촌칼국수 같은 버섯 매운탕 소고기 샤브샤브 만들기,,,국/탕,,,버섯류,"{'느타리버섯': '3줌', '미나리': '1단', '대파': '1대', '양파':...",[],[]
470,4984086,안동찜닭으로 친구들과 맥주파티~~,,,메인반찬,,,기타,{},[],[]
895,5412563,누구나 좋아하는 감자조림♩,,,밑반찬,,,기타,{},[],[]
939,5010998,초간단 시금치나물,,,밑반찬,,,기타,{},[],[]
1203,4274565,"영양만점 쇠고기 야채 주먹밥 (어린이집 소풍도시락, 스피드한 도시락)",,,밥/죽/떡,,,기타,{},[],[]
1264,5309525,콘샐러드 :: KFC 콘샐러드 따라잡기,,,샐러드,,,기타,{},[],[]
1322,6891796,참치두부짜글이찌개 밥도둑 인정,,,찌개,,,해물류,"{'두부': '1모', '양파': '1/2개', '참치': '작은거 1캔', '대파...",[],[]
1419,5803328,보글보글 뚝배기 참치김치찌개 / 쉬운 김치찌개,,,찌개,,,기타,{},[],[]


In [22]:
df['INGREDIENT_FULL'].isna()

0       False
1       False
2       False
3       False
4       False
        ...  
1437    False
1438    False
1439    False
1440    False
1441    False
Name: INGREDIENT_FULL, Length: 1442, dtype: bool

In [23]:
df.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1442 entries, 0 to 1441
Data columns (total 11 columns):
 #   Column           Non-Null Count  Dtype  
---  ------           --------------  -----  
 0   RECIPE_ID        1442 non-null   int64  
 1   RECIPE_NM_KO     1442 non-null   object 
 2   SUMRY            1409 non-null   object 
 3   SERVINGS         1374 non-null   float64
 4   TY_NM            1442 non-null   object 
 5   COOKING_TIME     1392 non-null   float64
 6   LEVEL_NM         1434 non-null   object 
 7   IRDNT_CODE       1442 non-null   object 
 8   INGREDIENT_FULL  1442 non-null   object 
 9   STEP_TEXT        1442 non-null   object 
 10  STEP_TIP         1442 non-null   object 
dtypes: float64(2), int64(1), object(8)
memory usage: 124.0+ KB


In [24]:
df.isnull().sum()

RECIPE_ID           0
RECIPE_NM_KO        0
SUMRY              33
SERVINGS           68
TY_NM               0
COOKING_TIME       50
LEVEL_NM            8
IRDNT_CODE          0
INGREDIENT_FULL     0
STEP_TEXT           0
STEP_TIP            0
dtype: int64

In [25]:
import numpy as np

df = df.replace(['[]', '{}', ''], np.nan)

In [26]:
df = df.dropna(subset=['STEP_TEXT'])


In [37]:
df.isnull().sum()

RECIPE_ID           0
RECIPE_NM_KO        0
SUMRY               0
SERVINGS           54
TY_NM               0
COOKING_TIME       36
LEVEL_NM            0
IRDNT_CODE          0
INGREDIENT_FULL     0
STEP_TEXT           0
STEP_TIP            0
dtype: int64

In [28]:
df.head( )

Unnamed: 0,RECIPE_ID,RECIPE_NM_KO,SUMRY,SERVINGS,TY_NM,COOKING_TIME,LEVEL_NM,IRDNT_CODE,INGREDIENT_FULL,STEP_TEXT,STEP_TIP
0,6847470,담백한 새우연두부달걀탕,,2.0,국/탕,15.0,아무나,해물류,"{'연두부': '1팩', '새우': '10-12마리', '달걀': '1개', '송송...","[""1. 우선 다시마물을 만들어요. 냄비에 물 붓고 다시마를 넣어 센 불에서 끓이다...","["""", """", """", """", """", """", """"]"
1,6902441,새우살로 만드는 얼큰한 새우탕 만들기,새우탕,2.0,국/탕,60.0,아무나,해물류,"{'냉동': '새우살 200g', '양파': '1/2개', '애호박': '1/2개'...","[""1. · 멸치 다시 육수를 끓여줍니다 ( 저는 집에 다시팩이 있어서 넣어줬습니다...","[""- 다시마 3장, 멸치 7~10개, 물 1L넣고 끓이다가 물이 끓으면 다시마만 ..."
2,6915735,깔끔고소한 아침국~~들깨무국,들깨무국,2.0,국/탕,15.0,아무나,기타,"{'채썬': '무 1컵', '대파': '1줄', '물': '3컵', '들깨가루': ...","[""1. 채썬 무를 냄비에 넣고, 소금1/2큰술,참기름1큰술을 넣고 볶아요."", ""...","["""", """", """", """", """", """"]"
3,6914749,감자어묵국 보들보들하게 즐기는 간단국요리,감자어묵국,4.0,국/탕,30.0,초급,해물류,"{'감자': '1개', '양파': '1/2개', '어묵': '100g', '대파':...","[""1. 물 7컵에 다시재료를 넣어주고 중약불에서 뭉근하게 끓여 육수를 내줍니다.""...","["""", ""기호에 따라 청양고추 반개 분량을 총총 썰어 넣어주셔도 좋습니다."", ""..."
4,6880695,소고기 배춧국 만들기 든든한 한끼로 제격!,소고기배추국,3.0,국/탕,30.0,아무나,소고기류,"{'배추잎': '5~6장', '소고기국거리': '200g', '다진마늘': '1/2...","[""1. 배추 반포기를 다?! 노노~~ 배추잎 5장 정도 뜯어서 칼로 먹기 좋게 썰...","["""", """", """", """", """", """", """", """", """", """", """"]"


In [32]:
df[df['SUMRY'].isna()]


Unnamed: 0,RECIPE_ID,RECIPE_NM_KO,SUMRY,SERVINGS,TY_NM,COOKING_TIME,LEVEL_NM,IRDNT_CODE,INGREDIENT_FULL,STEP_TEXT,STEP_TIP
0,6847470,담백한 새우연두부달걀탕,,2.0,국/탕,15.0,아무나,해물류,"{'연두부': '1팩', '새우': '10-12마리', '달걀': '1개', '송송...","[""1. 우선 다시마물을 만들어요. 냄비에 물 붓고 다시마를 넣어 센 불에서 끓이다...","["""", """", """", """", """", """", """"]"
6,6889370,간단하게 속편한 국 끓이기! 새우젓 연두부달걀국,,3.0,국/탕,30.0,아무나,해물류,"{'물': '500ml', '연두부': '1팩', '달걀': '2알', '양파': ...","[""1. 분량의 재료를 준비해주세요. 연두부는 먹기 좋은 크기로 썰고 양파는 채 썰...","[""연두부 1모, 달걀 2알, 양파 1/4개"", ""달걀 2알, 소금 한꼬집"", ""새..."
30,6879920,백종원 돼지갈비볶음탕 진짜 진짜 맛있네!,,3.0,국/탕,60.0,초급,채소류,"{'돼지갈비': '1kg', '양파': '2개', '감자': '2개', '당근': ...","[""1. 감자와 당근은 큼직하게 썰어준 뒤 테두리를 둥글게 깎아줬고요. 양파와 대파...","["""", """", """", """", """", """", """", """", """", """", """", ""..."
52,6892649,간장 닭볶음탕 황금레시피 바로 이거라죠 ~,,2.0,국/탕,30.0,아무나,닭고기류,"{'닭': '1마리', '감자': '작은것 3개', '양파': '1개', '당근':...","[""1. 야채는 취향에 맞게 넣어주시면 되는데요 감자나 양파는 꼭 넣어줘야 맛있는것...","["""", """", """", """", """", """", """", """", """", """", """", ""..."
68,6832617,전라도언니루비씨의 묵은지 닭볶음탕/성공100%,,2.0,국/탕,60.0,아무나,닭고기류,"{'닭': '1마리', '감자': '큰거 1개', '고구마': '큰거 1개', '양...","[""1. 먼저 닭볶음탕용으로나온 토막난 닭한마리 준비합니다요.(토종닭 준비하시는 분...","["""", """", """", """", """", """", """", """", """", """", """", """"]"
77,5603359,매운 닭볶음탕,,3.0,국/탕,60.0,초급,닭고기류,"{'닭고기': '800g 1마리', '감자': '1개', '당근': '1/2개', ...","[""1. 닭고기는 닭볶음탕용으로 준비해 주세요."", ""2. 냄비에 닭고기와 닭고기가...","["""", """", """", """", """", """", """"]"
80,6887142,"닭볶음탕 황금레시피, 밖에서 사 먹는 닭도리탕 맛을 집에서 내봤어요 ~",,2.0,국/탕,60.0,초급,닭고기류,"{'닭볶음탕용': '닭 1마리', '감자': '2개', '양파': '1개', '당근...","[""1. 먼저 감자는 1개당 4등분으로 나누어줬고요. 테두리를 둥그렇게 깎아 준비했...","[""취향에 따라 떡국 떡이나 당면을 넣어주셔도 좋아요. (당면은 요리 30분 전 미..."
88,6834272,국물까지 싹 먹어 치우게 되는 백주부표 닭볶음탕!,,3.0,국/탕,60.0,중급,닭고기류,"{'닭볶음용': '닭 1마리', '감자': '2~3개', '양파': '1/2개', ...","[""1. 닭고기를 10분정도 물에 담가 핏물을 빼줍니다. 닭고기가 반정도 잠기게 우...","["""", """", """", """", """", """", """", """", """", """", """", ""..."
98,6897463,요리초보도 실패없는 백종원 닭볶음탕 황금 레시피,,3.0,국/탕,30.0,아무나,닭고기류,"{'닭': '1팩', '감자': '2개', '양파': '1개', '당근': '1/2...","[""1. 먼저 1차로 닭의 기름등을 깔끔하게 제거해주시고 우유에 잠시 담궈두었다 요...","["""", ""대파는 큼직하게 썰어 주셔도 되요."", ""평소 단것 싫어하심 우선 설탕 ..."
111,6831764,닭볶음탕,,4.0,국/탕,60.0,중급,닭고기류,"{'닭': '닭볶음용', '감자': '', '양파': '', '당근': '', '대...","[""1. 밥수저 기준 - 고추장 3 , 고춧가루 4, 간장 3 , 물엿 2 , 맛술...","["""", """", """", """", """", """", """", """", """", """"]"


In [31]:
df.to_csv("recipes_over100k_all_with_IRDNT.csv", index=False, encoding="utf-8-sig")

In [16]:
df=df.drop(columns=['RECIPE_NM_KO'])

In [17]:
df = df.rename(columns={'SUMRY': 'RECIPE_NM_KO'})


In [18]:
df.head()

Unnamed: 0,RECIPE_ID,RECIPE_NM_KO,SERVINGS,TY_NM,COOKING_TIME,LEVEL_NM,IRDNT_CODE,INGREDIENT_FULL,STEP_TEXT,STEP_TIP
0,6847470,,2.0,국/탕,15.0,아무나,해물류,"{'연두부': '1팩', '새우': '10-12마리', '달걀': '1개', '송송...","[""1. 우선 다시마물을 만들어요. 냄비에 물 붓고 다시마를 넣어 센 불에서 끓이다...","["""", """", """", """", """", """", """"]"
1,6902441,새우탕,2.0,국/탕,60.0,아무나,해물류,"{'냉동': '새우살 200g', '양파': '1/2개', '애호박': '1/2개'...","[""1. · 멸치 다시 육수를 끓여줍니다 ( 저는 집에 다시팩이 있어서 넣어줬습니다...","[""- 다시마 3장, 멸치 7~10개, 물 1L넣고 끓이다가 물이 끓으면 다시마만 ..."
2,6915735,들깨무국,2.0,국/탕,15.0,아무나,기타,"{'채썬': '무 1컵', '대파': '1줄', '물': '3컵', '들깨가루': ...","[""1. 채썬 무를 냄비에 넣고, 소금1/2큰술,참기름1큰술을 넣고 볶아요."", ""...","["""", """", """", """", """", """"]"
3,6914749,감자어묵국,4.0,국/탕,30.0,초급,해물류,"{'감자': '1개', '양파': '1/2개', '어묵': '100g', '대파':...","[""1. 물 7컵에 다시재료를 넣어주고 중약불에서 뭉근하게 끓여 육수를 내줍니다.""...","["""", ""기호에 따라 청양고추 반개 분량을 총총 썰어 넣어주셔도 좋습니다."", ""..."
4,6880695,소고기배추국,3.0,국/탕,30.0,아무나,소고기류,"{'배추잎': '5~6장', '소고기국거리': '200g', '다진마늘': '1/2...","[""1. 배추 반포기를 다?! 노노~~ 배추잎 5장 정도 뜯어서 칼로 먹기 좋게 썰...","["""", """", """", """", """", """", """", """", """", """", """"]"
