In [2]:
import pandas as pd
import numpy as np
import os
from tqdm import tqdm # 用于显示进度条

# 1. 加载 test.csv 文件
csv_file_path = 'test.csv' # 请确保这是正确的路径
try:
    test_df = pd.read_csv(csv_file_path)
    print(f"'{csv_file_path}' 加载成功。共 {len(test_df)} 个样本。")
except FileNotFoundError:
    print(f"错误：未找到 '{csv_file_path}' 文件。请检查路径。")
    exit()

# 2. 定义图像文件存放的目录
image_dir = './ot/' # 这是你之前输出中显示的路径，请确保正确
if not os.path.isdir(image_dir):
    print(f"警告：图像目录 '{image_dir}' 不存在。请检查路径。")
    # 即使目录不存在，我们也会尝试继续，但加载会失败

# 3. 存储所有遇到的独特形状
unique_shapes = set()
all_shapes_info = [] # 用于存储文件名和形状，方便查看


# 遍历 DataFrame 中的每一行
for index, row in tqdm(test_df.iterrows(), total=len(test_df)):
    image_name = row['id']
    current_image_path = os.path.join(image_dir, image_name)
    
    try:
        image_data = np.load(current_image_path)
        shape = image_data.shape
        all_shapes_info.append((image_name, shape))
        unique_shapes.add(shape)
        # 为了避免打印过多内容，我们可以在这里注释掉逐个打印的行
        # print(f"{image_name}: {shape}") 
    except FileNotFoundError:
        # print(f"错误：文件未找到 - {current_image_path}")
        all_shapes_info.append((image_name, "File Not Found"))
        unique_shapes.add("File Not Found")
    except Exception as e:
        # print(f"错误：加载文件 {current_image_path} 时发生: {e}")
        all_shapes_info.append((image_name, f"Error: {e}"))
        unique_shapes.add(f"Error loading file")

print("\n--- 文件形状检查完毕 ---")

# 4. 打印找到的独特形状总结
if unique_shapes:
    print("\n发现的独特形状总结:")
    for s in unique_shapes:
        if isinstance(s, tuple): # 正常的形状元组
            count = sum(1 for _, shp in all_shapes_info if shp == s)
            print(f"- 形状: {s}, 数量: {count}")
        else: # 错误信息字符串
            count = sum(1 for _, shp in all_shapes_info if shp == s)
            print(f"- 信息: {s}, 数量: {count}")
else:
    print("没有成功加载任何文件或test_df为空。")

# (可选) 如果你想查看所有文件的形状列表，可以取消注释下面的行
# print("\n所有文件的形状详情:")
# for name, shape_info in all_shapes_info:
#     print(f"{name}: {shape_info}")

'test.csv' 加载成功。共 545 个样本。


100%|██████████| 545/545 [00:08<00:00, 65.49it/s]


--- 文件形状检查完毕 ---

发现的独特形状总结:
- 形状: (128, 57, 125), 数量: 9
- 形状: (128, 128, 125), 数量: 536



