# URL -> QR 코드 변환기

URL 데이터셋을 기반으로 QR 코드 이미지를 변환하는 모듈

xlsx 파일을 바탕으로 이미지 데이터셋을 생성합니다.

프로젝트 루트에 `data/` 폴더를 생성한 후, 폴더 내에 원하는 xlsx 파일을 넣어주세요.

데이터셋 필수 컬럼 : `URL (= Data)`, `Label (= Category)`

In [8]:
import os
from datetime import datetime
import pandas as pd
import qrcode

In [9]:
data_path = '../data/URL.xlsx'  # change me
save_dir_path = '../data/images'
row_name = 'Data'  # change me
label_name = 'Category'  # change me
classification_name = 'spam'  # change me
phishing_dir = os.path.join(save_dir_path, 'phishing')
benign_dir = os.path.join(save_dir_path, 'benign')

In [10]:
if not os.path.exists(save_dir_path):
    os.makedirs(save_dir_path)
if not os.path.exists(phishing_dir):
    os.makedirs(phishing_dir)
if not os.path.exists(benign_dir):
    os.makedirs(benign_dir)

In [11]:
df = pd.read_excel(data_path)

phishing_count = 0
benign_count = 0

for index, row in df.iterrows():
    url = row[row_name]
    label = row[label_name]

    qr = qrcode.QRCode(
        version=1,
        error_correction=qrcode.constants.ERROR_CORRECT_L,
        box_size=10,
        border=4,
    )
    qr.add_data(url)
    qr.make(fit=True)
    img = qr.make_image(fill_color="black", back_color="white")
    
    current_time = datetime.now().strftime('%Y%m%d%H%M%S')
    filename = f"{current_time}-{index}.png"
    
    # QR 코드 라벨링 (분류 : 폴더)
    if label == classification_name:
        save_path = os.path.join(phishing_dir, filename)
        phishing_count += 1
    else:
        save_path = os.path.join(benign_dir, filename)
        benign_count += 1
    
    img.save(save_path)

In [12]:
total_count = phishing_count + benign_count
print(f"\n=== QR 코드 생성 완료 ===")
print(f"총 생성된 QR 코드 이미지: {total_count}개")
print(f"피싱 QR 코드 이미지: {phishing_count}개")
print(f"정상 QR 코드 이미지: {benign_count}개")
print("=====================")


=== QR 코드 생성 완료 ===
총 생성된 QR 코드 이미지: 45373개
피싱 QR 코드 이미지: 22686개
정상 QR 코드 이미지: 22687개
