In [None]:
import pandas as pd
import random
import uuid
import string
from faker import Faker
from datetime import datetime

fake = Faker("ko_KR")

# 옵션 정의
goals = ["체중증량", "체중감소", "혈당관리"]
activities = ["많음", "보통", "적음"]
allergies = ["없음", "갑각류", "땅콩", "유제품", "계란", "밀"]
domains = ["gmail.com", "naver.com", "daum.net", "outlook.com"]

# 비밀번호 생성 (특수문자 제한)
def random_password(length=10):
    allowed_specials = "!@#*&"
    chars = string.ascii_letters + string.digits + allowed_specials
    return "".join(random.choice(chars) for _ in range(length))

# 생년월일 생성 (현재 연도 기준 5~90세)
def random_birthday():
    current_year = datetime.now().year
    year = random.randint(current_year - 90, current_year - 5)
    month = random.randint(1, 12)
    day = random.randint(1, 28)
    return f"{year:04d}{month:02d}{day:02d}"

# 성별에 따른 키·몸무게 범위
def random_height_weight(gender):
    if gender == "male":
        height = random.randint(140, 185)
        weight = random.randint(40, 100)
    else:
        height = random.randint(130, 175)
        weight = random.randint(35, 80)
    return height, weight

# 알레르기 랜덤
def random_allergy():
    n = random.choice([0, 1, 2])
    if n == 0:
        return "없음"
    return ", ".join(random.sample(allergies[1:], n))

# 사용자 데이터 생성
def generate_users(n=100):
    users = []
    used_nicknames = set()

    for _ in range(n):
        user_id = str(uuid.uuid4())
        gender = random.choice(["male", "female"])
        name = fake.name_male() if gender == "male" else fake.name_female()

        # 중복 없는 닉네임
        nickname = None
        while not nickname or nickname in used_nicknames:
            nickname = "".join(random.choices(string.ascii_lowercase + string.digits, k=8))
        used_nicknames.add(nickname)

        birthday = random_birthday()
        height, weight = random_height_weight(gender)
        email = f"{nickname}@{random.choice(domains)}"
        password = random_password()
        allergy = random_allergy()
        goal = random.choice(goals)
        activity = random.choice(activities)

        users.append({
            "UserID": user_id,
            "이름": name,
            "성별": gender,
            "닉네임": nickname,
            "생년월일": birthday,
            "몸무게(kg)": weight,
            "신장(cm)": height,
            "이메일": email,
            "비밀번호": password,
            "지병/알레르기": allergy,
            "목표": goal,
            "활동량": activity
        })
    return pd.DataFrame(users)

# 실행
df = generate_users(100)
df.to_csv("user_dummy_data.csv", index=False, encoding="utf-8-sig")

print("사용자 더미 데이터 생성 완료 (user_dummy_data.csv)")
print(df.head(5))


사용자 더미 데이터 생성 완료 (user_dummy_data.csv)
                                 UserID   이름      성별       닉네임      생년월일  \
0  ab4803d4-91a6-4996-b48e-61333badf166  김옥순  female  3nm25d9d  19650226   
1  b5161ee2-4c3d-469a-bb45-b2c0f62a2552  김준호    male  9zzych5n  19960414   
2  1ff7935e-5827-407a-a9c5-a417940b5352  김지훈    male  wgspb963  19841104   
3  c33fe333-9ea9-4422-94e3-ff7756aa5aed  김영수    male  day8vex2  20060508   
4  60dcd171-91dd-4055-9762-ed9a7c0718cc  이성훈    male  lpw27n0s  19471214   

   몸무게(kg)  신장(cm)                   이메일        비밀번호   지병/알레르기    목표 활동량  
0       66     175     3nm25d9d@daum.net  F#ldEDW6LA  유제품, 갑각류  혈당관리  적음  
1       87     155     9zzych5n@daum.net  FQ1Y6XNcTl        땅콩  체중증량  많음  
2       48     174  wgspb963@outlook.com  MWkIbGY9EX        없음  체중감소  보통  
3       42     168     day8vex2@daum.net  #vRwl8lwDM        없음  체중감소  적음  
4       73     155    lpw27n0s@gmail.com  Xuw*dGn&k2        없음  체중감소  적음  
