
# <span style="color:royalblue">[생성형 AI] 챗GPT를 활용한 데이터 연결하기 </span> 

# GPT3.5 무료버전 활용 2024 데이터 생성 프롬프트와 코드

--- 

<div style="text-align: right"> Final Edition : 2024.4.20<br>
    copyrightⓒ 2024 All rights reserved by Data Lover Pablo </div>

# 1. 여러개 월별 시트로 구성된 제품 판매내역

### 프롬프트 명령어

월별 제품 판매내역 테이블 CSV 파일을 만드는 파이썬 코드 생성해줘  
2024년 1월부터  12월 까지 판매내역을 만드는데, 각월은 시트로 나눠줘  
예를 들어 1월 판매내역을 1월 시트에, 2월 판매내역은 2월 시트에...12월   

- 칼럼명 : 날짜, 제품명, 판매단가, 판매수량, 고객ID  
- 데이터 크기 : 각 월은 20개 행, 6개 열  
- 날짜 칼럼 :  YYYY-MM-DD (월별 시트 나누기)  
- 컴퓨팅 사고력 순서
1. 판매내역 데이터를 생성한다.
2. 워크시트 이름을 {month}월로 붙인다.
3. 데이터를 월별로 해당 워크시트 별로 분할하여 넣는다.

In [28]:
import pandas as pd
import random
from datetime import datetime, timedelta

# 제품 테이블 생성 함수 정의
def generate_products(num_rows):
    # 제품명과 가격 데이터
    products_data = {
        '제품명': [
            '스초생', 'TWG 1837 블랙티 무스', '투썸 해피데이 베어', '빅토리아다쿠아즈초콜릿생크림',
            '나만의 디자인케이크 DIY', '클래식가토쇼콜라', '마스카포네티라미수', '뉴욕치즈', '퀸즈캐롯',
            '파티팩 스트로베리 초콜릿 생크림', '홀리데이 위시 캔들', '스트로베리 레드 벨벳',
            '민트볼 가토 쇼콜라', '딸기생크림1호'
        ],
        '가격': [
            '37,000원', '37,000원', '37,000원', '38,000원',
            '33,000원', '36,000원', '37,000원', '37,000원', '36,000원',
            '40,200원', '37,000원', '38,000원', '37,000원', '34,000원'
        ]
    }

    # 데이터 프레임 생성
    products_df = pd.DataFrame({
        '제품명': products_data['제품명'],
        '가격': [int(price.replace(',', '').replace('원', '')) for price in products_data['가격']]
    })

    return products_df

# 고객 테이블 생성 함수 정의
def generate_customer_data(num_rows):
    # 고객정보 테이블 초기화
    customer_table = []

    # 랜덤한 고객 정보 생성
    for _ in range(num_rows):
        # 랜덤한 고객ID 생성
        customer_id = 'C' + ''.join(random.choices('0123456789', k=4))
        
        # 랜덤한 고객명 생성 (한국어 3글자 랜덤)
        first_names = ['김', '이', '박', '최', '정', '강', '조', '윤', '장', '임', '한', '오', '서', '신', '권', '황', '안', '송', '전', '홍']
        middle_names = ['민', '서', '영', '수', '진', '지', '현', '우', '재', '연', '윤', '하', '준', '호', '승', '성', '중', '용', '규', '은']
        last_names = ['윤', '문', '호', '이', '진', '용', '훈', '민', '범', '규', '하', '산']
        customer_name = random.choice(first_names) + random.choice(middle_names) + random.choice(last_names)
        
        # 고객 정보 추가
        customer_table.append([customer_id, customer_name])

    # 칼럼명 설정
    columns = ['고객ID', '고객명']

    # 데이터프레임 생성
    df = pd.DataFrame(customer_table, columns=columns)
    
    return df

# 판매 테이블 생성 함수 정의
def generate_sales_data(num_rows, products_df, customer_df):
    # 판매정보 테이블 초기화
    sales_table = []

    # 시작일과 종료일 설정
    start_date = datetime(2024, 1, 1)
    end_date = datetime(2024, 12, 31)

    # 월별로 판매 데이터 생성
    for month in range(1, 13):
        month_sales = []
        current_date = start_date.replace(month=month, day=1)
        while current_date.month == month:
            # 랜덤한 제품 선택
            product = random.choice(products_df['제품명'])
            price = products_df.loc[products_df['제품명'] == product, '가격'].iloc[0]
            # 랜덤한 고객 선택
            customer = random.choice(customer_df['고객ID'])
            # 랜덤한 판매수량 선택
            quantity = random.randint(1, 5)
            # 날짜, 제품명, 판매단가, 판매수량, 고객ID 추가
            month_sales.append([
                current_date.strftime('%Y-%m-%d'),
                product,
                price,
                quantity,
                customer
            ])
            current_date += timedelta(days=1)
        # 해당 월의 데이터를 판매 테이블에 추가
        sales_table.extend(month_sales)

    # 칼럼명 설정
    columns = ['날짜', '제품명', '판매단가', '판매수량', '고객ID']

    # 데이터프레임 생성
    df = pd.DataFrame(sales_table, columns=columns)
    
    return df

# 월별 판매 내역 CSV 파일 생성
def generate_monthly_sales_csv():
    # 데이터 생성
    num_products = 14
    num_customers = 100
    products_df = generate_products(num_products)
    customer_df = generate_customer_data(num_customers)
    sales_df = generate_sales_data(20, products_df, customer_df)
    
    # ExcelWriter 객체 생성
    with pd.ExcelWriter('월별_제품_판매내역.xlsx', engine='openpyxl') as writer:
        # 1월부터 12월까지 반복
        for month in range(1, 13):
            # 해당 월의 데이터만 추출
            month_sales = sales_df[sales_df['날짜'].str.startswith(f'2024-{month:02d}')]
            
            # 월별 시트에 저장
            month_sales.to_excel(writer, sheet_name=f'{month}월', index=False)
            
            # 시트의 모든 셀 서식 없애기
            workbook = writer.book
            worksheet = writer.sheets[f'{month}월']
            for row in worksheet.iter_rows(min_row=1, max_row=1):
                for cell in row:
                    cell.font = None
#                     cell.border = None
#                     cell.number_format = None

# 함수 호출하여 CSV 파일 생성
generate_monthly_sales_csv()


In [27]:
import pandas as pd
import random
from datetime import datetime, timedelta

# 제품 테이블 생성 함수 정의
def generate_products(num_rows):
    # 제품명과 가격 데이터
    products_data = {
        '제품명': [
            '스초생', 'TWG 1837 블랙티 무스', '투썸 해피데이 베어', '빅토리아다쿠아즈초콜릿생크림',
            '나만의 디자인케이크 DIY', '클래식가토쇼콜라', '마스카포네티라미수', '뉴욕치즈', '퀸즈캐롯',
            '파티팩 스트로베리 초콜릿 생크림', '홀리데이 위시 캔들', '스트로베리 레드 벨벳',
            '민트볼 가토 쇼콜라', '딸기생크림1호'
        ],
        '가격': [
            '37,000원', '37,000원', '37,000원', '38,000원',
            '33,000원', '36,000원', '37,000원', '37,000원', '36,000원',
            '40,200원', '37,000원', '38,000원', '37,000원', '34,000원'
        ]
    }

    # 데이터 프레임 생성
    products_df = pd.DataFrame({
        '제품명': products_data['제품명'],
        '가격': [int(price.replace(',', '').replace('원', '')) for price in products_data['가격']]
    })

    return products_df

# 고객 테이블 생성 함수 정의
def generate_customer_data(num_rows):
    # 고객정보 테이블 초기화
    customer_table = []

    # 랜덤한 고객 정보 생성
    for _ in range(num_rows):
        # 랜덤한 고객ID 생성
        customer_id = 'C' + ''.join(random.choices('0123456789', k=4))
        
        # 랜덤한 고객명 생성 (한국어 3글자 랜덤)
        first_names = ['김', '이', '박', '최', '정', '강', '조', '윤', '장', '임', '한', '오', '서', '신', '권', '황', '안', '송', '전', '홍']
        middle_names = ['민', '서', '영', '수', '진', '지', '현', '우', '재', '연', '윤', '하', '준', '호', '승', '성', '중', '용', '규', '은']
        last_names = ['윤', '문', '호', '이', '진', '용', '훈', '민', '범', '규', '하', '산']
        customer_name = random.choice(first_names) + random.choice(middle_names) + random.choice(last_names)
        
        # 고객 정보 추가
        customer_table.append([customer_id, customer_name])

    # 칼럼명 설정
    columns = ['고객ID', '고객명']

    # 데이터프레임 생성
    df = pd.DataFrame(customer_table, columns=columns)
    
    return df

# 판매 테이블 생성 함수 정의
def generate_sales_data(num_rows, products_df, customer_df):
    # 판매정보 테이블 초기화
    sales_table = []

    # 시작일과 종료일 설정
    start_date = datetime(2020, 1, 1)
    end_date = datetime(2024, 12, 31)

    # 연도별로 판매 데이터 생성
    for year in range(2020, 2025):
        year_sales = []
        current_date = start_date.replace(year=year, month=1, day=1)
        while current_date.year == year:
            # 랜덤한 제품 선택
            product = random.choice(products_df['제품명'])
            price = products_df.loc[products_df['제품명'] == product, '가격'].iloc[0]
            # 랜덤한 고객 선택
            customer = random.choice(customer_df['고객ID'])
            # 랜덤한 판매수량 선택
            quantity = random.randint(1, 5)
            # 날짜, 제품명, 판매단가, 판매수량, 고객ID 추가
            year_sales.append([
                current_date.strftime('%Y-%m-%d'),
                product,
                price,
                quantity,
                customer
            ])
            current_date += timedelta(days=1)
        # 해당 연도의 데이터를 판매 테이블에 추가
        sales_table.extend(year_sales)

    # 칼럼명 설정
    columns = ['날짜', '제품명', '판매단가', '판매수량', '고객ID']

    # 데이터프레임 생성
    df = pd.DataFrame(sales_table, columns=columns)
    
    return df

# 연도별 제품 판매 내역 CSV 파일 생성
def generate_yearly_sales_csv():
    # 데이터 생성
    num_products = 14
    num_customers = 100
    products_df = generate_products(num_products)
    customer_df = generate_customer_data(num_customers)
    sales_df = generate_sales_data(20, products_df, customer_df)
    
    # 연도별로 데이터를 나누어 엑셀 파일 생성
    for year in range(2020, 2025):
        # 해당 연도의 데이터만 추출
        yearly_sales = sales_df[sales_df['날짜'].str.startswith(str(year))]
        
        # 파일명 설정
        file_name = f'{year}년_제품판매내역.xlsx'
        
        # ExcelWriter 객체 생성
        with pd.ExcelWriter(file_name, engine='openpyxl') as writer:
            # 해당 연도의 데이터를 시트에 저장
            yearly_sales.to_excel(writer, sheet_name=f'{year}년', index=False)
            # 시트의 모든 셀 서식 없애기
            workbook = writer.book
            worksheet = writer.sheets[f'{year}년']
            for row in worksheet.iter_rows(min_row=1, max_row=1):
                for cell in row:
                    cell.font = None
                    cell.border = None
#                     cell.number_format = None

# ExcelWriter가 자동으로 close되므로 명시적으로 닫아줄 필요 없음

# ExcelWriter가 자동으로 close되므로 명시적으로 닫아줄 필요 없음
generate_yearly_sales_csv()
