In [1]:
import pandas as pd
import random
import string
from datetime import datetime

# 랜덤한 user_id 생성 함수
def generate_user_id(length=10):
    return ''.join(random.choices(string.ascii_letters + string.digits, k=length))

# 랜덤한 password 생성 함수
def generate_password(length=12):
    return ''.join(random.choices(string.ascii_letters + string.digits + string.punctuation, k=length))

# 랜덤한 birth 날짜 생성 함수
def generate_birth(start_year=1950, end_year=2005):
    start_date = datetime(start_year, 1, 1)
    end_date = datetime(end_year, 12, 31)
    return start_date + (end_date - start_date) * random.random()

# 랜덤한 데이터를 생성하는 함수
def generate_random_user_info(num_records=100):
    data = {
        'user_id': [],
        'password': [],
        'birth': [],
        'gender': [],
        'job': [],
        'mbti': [],
        'age': []
    }
    
    for _ in range(num_records):
        data['user_id'].append(generate_user_id())
        data['password'].append(generate_password())
        data['birth'].append(generate_birth().strftime('%Y-%m-%d'))
        data['gender'].append(random.randint(0, 1))
        data['job'].append(random.randint(0, 9))
        data['mbti'].append(random.randint(0, 15))
        data['age'].append(random.randint(1, 140))
    
    return pd.DataFrame(data)

# 데이터 생성
num_records = 100  # 생성할 레코드 수
user_info_data = generate_random_user_info(num_records)

# 데이터를 CSV 파일로 저장
user_info_data.to_csv('./refer/output/random_user_info.csv', index=False)



In [2]:
import pandas as pd
import random
import string
from datetime import datetime, timedelta

# CSV 파일에서 base_weight 데이터 로드
base_weight = pd.read_csv('./refer/output/base_weight.csv')

# 랜덤한 user_goal 생성 함수
def generate_user_goal(length=10):
    return ''.join(random.choices(string.ascii_letters + string.digits, k=length))

# 랜덤한 goal_complexity 생성 함수
def generate_goal_complexity():
    return random.randint(1, 5)

# 랜덤한 goal_start_time, goal_end_time 생성 함수
def generate_goal_times():
    start_time = datetime.now() + timedelta(days=random.randint(1, 30))  # 현재로부터 1일에서 30일 이내의 미래 시간
    end_time = start_time + timedelta(days=random.randint(1, 30))  # start_time 이후 1일에서 30일 이내의 미래 시간
    return start_time.strftime('%Y-%m-%d'), end_time.strftime('%Y-%m-%d')

# 랜덤한 record_time 생성 함수
def generate_record_time():
    return (datetime.now() - timedelta(days=random.randint(0, 30))).strftime('%Y-%m-%d %H:%M:%S')  # 현재로부터 30일 이내의 과거 시간

# 랜덤한 데이터를 생성하는 함수
def generate_random_schedule_1_data(user_info, base_weight, num_records=100):
    data = {
        'user_goal': [],
        'goal_complexity': [],
        'goal_start_time': [],
        'goal_end_time': [],
        'record_time': [],
        'user_id': [],
        'base_weight_no': []
    }
    
    for _ in range(num_records):
        user = user_info.sample(1).iloc[0]
        user_id = user['user_id']
        base_weight_row = base_weight[
            (base_weight['age'] == user['age']) &
            (base_weight['gender'] == user['gender']) &
            (base_weight['job'] == user['job']) &
            (base_weight['mbti'] == user['mbti'])
        ].sample(1).iloc[0]
        
        data['user_goal'].append(generate_user_goal())
        data['goal_complexity'].append(generate_goal_complexity())
        start_time, end_time = generate_goal_times()
        data['goal_start_time'].append(start_time)
        data['goal_end_time'].append(end_time)
        data['record_time'].append(generate_record_time())
        data['user_id'].append(user_id)
        data['base_weight_no'].append(base_weight_row['no'])
    
    return pd.DataFrame(data)

# user_info 데이터 로드
user_info_data = pd.read_csv('./refer/output/random_user_info.csv')

# 데이터 생성
num_records = 100  # 생성할 레코드 수
schedule_1_data = generate_random_schedule_1_data(user_info_data, base_weight, num_records)

# 데이터를 CSV 파일로 저장
schedule_1_data.to_csv('./refer/output/random_schedule_1.csv', index=False)



In [3]:
import pandas as pd
import random

# 랜덤한 0부터 1 사이의 double 값을 생성하는 함수
def generate_random_double():
    return round(random.uniform(0, 1), 2)  # 소수점 2자리까지

# user_weight_no 생성 함수
def generate_user_weight_no(index):
    return index + 1

# 랜덤한 데이터를 생성하는 함수
def generate_random_user_weight_data(schedule_1, base_weight, num_records=100):
    data = {
        'user_weight_no': [],
        'work': [],
        'edu': [],
        'free_time': [],
        'health': [],
        'chores': [],
        'category_else': [],
        'history_no': []
    }
    
    for i in range(num_records):
        row = schedule_1.sample(1).iloc[0]
        base_weight_row = base_weight[base_weight['no'] == row['base_weight_no']].iloc[0]
        
        data['user_weight_no'].append(generate_user_weight_no(i))
        data['work'].append(generate_random_double())
        data['edu'].append(generate_random_double())
        data['free_time'].append(generate_random_double())
        data['health'].append(generate_random_double())
        data['chores'].append(generate_random_double())
        data['category_else'].append(generate_random_double())
        data['history_no'].append(row['base_weight_no'])
    
    return pd.DataFrame(data)

# schedule_1 데이터 로드
schedule_1_data = pd.read_csv('./refer/output/random_schedule_1.csv')

# 데이터 생성
num_records = 100  # 생성할 레코드 수
user_weight_data = generate_random_user_weight_data(schedule_1_data, base_weight, num_records)

# 데이터를 CSV 파일로 저장
user_weight_data.to_csv('./refer/output/random_user_weight.csv', index=False)



In [4]:
import pandas as pd
import random
from datetime import datetime, timedelta

# 랜덤한 goal_start_time, goal_end_time 생성 함수
def generate_goal_times():
    start_time = datetime.now() + timedelta(days=random.randint(1, 30))  # 현재로부터 1일에서 30일 이내의 미래 시간
    end_time = start_time + timedelta(days=random.randint(1, 30))  # start_time 이후 1일에서 30일 이내의 미래 시간
    return start_time.strftime('%Y-%m-%d'), end_time.strftime('%Y-%m-%d')

# 랜덤한 record_time 생성 함수
def generate_record_time():
    return (datetime.now() - timedelta(days=random.randint(0, 30))).strftime('%Y-%m-%d %H:%M:%S')  # 현재로부터 30일 이내의 과거 시간

# 랜덤한 데이터를 생성하는 함수
def generate_random_schedule_2_data(schedule_1, user_weight, num_records=100):
    data = {
        'user_id': [],
        'user_goal': [],
        'goal_complexity': [],
        'goal_start_date': [],
        'goal_end_date': [],
        'record_time': [],
        'user_weight_no': []
    }
    
    for _ in range(num_records):
        row = user_weight.sample(1).iloc[0]
        schedule_1_row = schedule_1[schedule_1['base_weight_no'] == row['history_no']].sample(1).iloc[0]
        
        data['user_id'].append(schedule_1_row['user_id'])
        data['user_goal'].append(schedule_1_row['user_goal'])
        data['goal_complexity'].append(schedule_1_row['goal_complexity'])
        data['goal_start_date'].append(schedule_1_row['goal_start_time'])
        data['goal_end_date'].append(schedule_1_row['goal_end_time'])
        data['record_time'].append(schedule_1_row['record_time'])
        data['user_weight_no'].append(row['user_weight_no'])
    
    return pd.DataFrame(data)

# schedule_1과 user_weight 데이터 로드
schedule_1_data = pd.read_csv('./refer/output/random_schedule_1.csv')
user_weight_data = pd.read_csv('./refer/output/random_user_weight.csv')

# 데이터 생성
num_records = 100  # 생성할 레코드 수
schedule_2_data = generate_random_schedule_2_data(schedule_1_data, user_weight_data, num_records)

# 데이터를 CSV 파일로 저장
schedule_2_data.to_csv('./refer/output/random_schedule_2.csv', index=False)

