In [None]:
from torch.utils.data import Dataset # 导入PyTorch标准数据集基类
import cv2               
import torch
import os      
import matplotlib.pyplot as plt                   

class MyData(Dataset): # 自定义类MyData，继承自Dataset基类

    def __init__(self, root_dir, label_dir):
        self.root_dir = root_dir   
        self.label_dir = label_dir
        
        self.path = os.path.join(self.root_dir, self.label_dir) 
        # 列出该路径下所有的文件名，存储在 self.img_path 这个列表里
        self.img_path = os.listdir(self.path) 

    def __getitem__(self, idx):
        # 根据数字索引从文件名列表里拿到文件名
        img_name = self.img_path[idx] 
        # 拼接出该图片的完整物理存储路径
        img_item_path = os.path.join(self.path, img_name)
        # 真正从硬盘读取图片数据到内存中
        img = cv2.imread(img_item_path)
        # 【关键修正】将 BGR 转换为 RGB
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        # 获取该图片的标签（在这个例子中，文件夹名即标签名）
        label = self.label_dir
        # 返回一个元组：(图片数据, 标签数据)
        return img, label

    def __len__(self):
        # 返回数据集大小方法：告诉程序总共有多少张图
        return len(self.img_path)


root_dir = "../test_jpg"           # 设置数据集的根目录路径
robots_label_dir = "robots"
cars_label_dir = "cars"              # 设置蚂蚁分类的子文件夹名称
robots_dataset = MyData(root_dir, robots_label_dir) # 实例化 MyData 类，创建一个名为 ants_dataset 的对象
cars_dataset = MyData(root_dir, cars_label_dir)

print(len(robots_dataset))


img_car,label_car = cars_dataset[1] # 通过索引获取数据集中的第二张图片及其标签
plt.imshow(img_car)           # 使用 Matplotlib 显示图片
plt.show()

img_robot,label_robot = robots_dataset[0] # 通过索引获取数据集中的第二张图片及其标签
plt.imshow(img_robot)           # 使用 Matplotlib 显示图片
plt.show()

In [None]:
from torch.utils.data import Dataset # 导入PyTorch标准数据集基类
import cv2               
import torch
import os      
import matplotlib.pyplot as plt                   

class MyData(Dataset): 

    def __init__(self, root_dir, img_dir, label_dir):
        self.root_dir = root_dir   
        self.img_dir = img_dir
        self.label_dir = label_dir
        
        self.img_path = os.path.join(self.root_dir, self.img_dir) 
        self.label_path = os.path.join(self.root_dir, self.label_dir) 
        self.img_list = os.listdir(self.path) 

    def __getitem__(self, idx):
        
        img_name = self.img_list[idx] 
        img_item_path = os.path.join(self.img_path, img_name)
        img = cv2.imread(img_item_path)
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

        # 把后缀 .jpg 替换成 .txt
        label_name = img_name.split('.')[0] + '.txt'
        label_item_path = os.path.join(self.label_path, img_name)
        label = self.label_dir
       
        # 从 txt 文件中读取内容
        # 使用 try-except 是为了防止有些图片忘了写标签导致程序崩溃
        label_content = ""
        try:
            with open(label_item_path, 'r') as f:
                label_content = f.read() # 读取txt里的内容，比如坐标信息
        except FileNotFoundError:
            label_content = "No Label Found"
            
        return img, label_content

    def __len__(self):
        # 返回数据集大小方法：告诉程序总共有多少张图
        return len(self.img_list)


# --- 实例化测试 ---
root_dir = "../test_jpg"          
robots_img_dir = "robots"
cars_img_dir = "cars"              
robots_label_dir = "robots_label"
cars_label_dir = "cars_label"

robots_dataset = MyData(root_dir, robots_img_dir,robots_label_dir) # 实例化 MyData 类，创建一个名为 ants_dataset 的对象
cars_dataset = MyData(root_dir, robots_label_dir, cars_label_dir)

print(len(robots_dataset))

img_robot,label_robot = robots_dataset[0] 
print(f"标签内容: {txt}")
plt.imshow(img_robot)         
plt.show()

img_car,label_car = cars_dataset[1] 
plt.imshow(img_car)          
plt.show()

