In [1]:
import torch
import torch.nn as nn

# [1] 모델 설계: CNN(특징 추출) + Linear(좌표 계산)
model = nn.Sequential(
    # 특징 추출 (CNN Layer)
    nn.Conv2d(3, 16, kernel_size=3, padding=1),
    nn.ReLU(),
    nn.MaxPool2d(2, 2), # 128 -> 64
    
    nn.Conv2d(16, 32, kernel_size=3, padding=1),
    nn.ReLU(),
    nn.MaxPool2d(2, 2), # 64 -> 32
    
    # 지능형 요약 (Flatten)
    nn.Flatten(), 
    
    # 좌표 추출 (Regression Head)
    # 32*32*32개의 단서를 받아서 최종 숫자 3개(x, y, r)를 뱉어라!
    nn.Linear(32 * 32 * 32, 128), # 중간 요약층 하나 추가 (지능 업그레이드)
    nn.ReLU(),
    nn.Linear(128, 3) # 최종 출력: x, y, r
)

# [2] 테스트용 가짜 입력 (실제로는 여기서 만든 원형 이미지가 들어가야 함)
test_input = torch.randn(1, 3, 128, 128)
prediction = model(test_input)

print(f"최종 예측값 (x, y, r): {prediction.detach().numpy()}")
# 결과 예시: [[0.12, -0.05, 0.23]] (아직 학습 전이라 무의미한 숫자임)

최종 예측값 (x, y, r): [[ 0.09011614  0.03660928 -0.11184014]]
