In [4]:
import torch
import torch.nn as nn
import torch.optim as optim
import random

# 生成上海房价数据
datas = [
    [1, 100, 400, 3],
    [2, 100, 300, 1],
    [1, 80, 800, 1],
    [3, 100, 300, 2],
]

# 生成额外 100 条数据
for _ in range(100):
    row = [
        random.randint(1, 3),  # 第一列：房屋类型 (类别变量)
        random.randint(80, 100),  # 第二列：面积 (数值变量)
        random.randint(300, 800),  # 第三列：价格 (目标值)
        random.randint(1, 3)  # 第四列：位置 (类别变量)
    ]
    datas.append(row)

# 转换为张量
data = torch.tensor(datas, dtype=torch.float32)

# 归一化处理（仅对数值变量进行标准化）
max_size = data[:, 1].max()
max_price = data[:, 2].max()
data[:, 1] /= max_size  # 归一化面积
data[:, 2] /= max_price  # 归一化价格（目标变量）

# One-hot 编码类别变量（房屋类型 和 位置）
house_type = torch.nn.functional.one_hot(data[:, 0].to(torch.int64) - 1, num_classes=3)
location = torch.nn.functional.one_hot(data[:, 3].to(torch.int64) - 1, num_classes=3)

# 构造最终输入特征（拼接 one-hot 编码 和 数值特征）
X = torch.cat([house_type, data[:, 1:2], location], dim=1)  # 输入特征
y = data[:, 2:3]  # 目标值（房价）

In [7]:
X.shape[1]

7