In [None]:
import scipy.io
import numpy as np
import pandas as pd
from IPython.display import display, HTML

def preview_mat_file(file_path, num_rows=20):
    """
    读取.mat文件并在Jupyter中以表格形式预览其内容
    
    参数:
    file_path (str): .mat文件的路径
    num_rows (int): 要预览的行数，默认为20
    """
    try:
        # 读取.mat文件
        mat_contents = scipy.io.loadmat(file_path)
        
        # 遍历所有变量
        for key in mat_contents:
            # 跳过系统变量
            if key.startswith('__'):
                continue
                
            data = mat_contents[key]
            
            # 打印变量基本信息
            print(f"/n{'='*50}")
            print(f"变量名: {key}")
            print(f"形状: {data.shape}")
            print(f"数据类型: {data.dtype}")
            print(f"{'='*50}")
            
            # 如果是2D数组，转换为DataFrame并美化显示
            if len(data.shape) == 2:
                df = pd.DataFrame(data[:num_rows])
                
                # 设置列名
                df.columns = [f'列_{i}' for i in range(df.shape[1])]
                
                # 添加行索引列
                df.index.name = '行号'
                df.index = range(1, len(df) + 1)
                
                # 设置显示选项
                pd.set_option('display.max_columns', None)  # 显示所有列
                pd.set_option('display.max_rows', num_rows) # 限制显示行数
                pd.set_option('display.width', None)        # 自动调整宽度
                pd.set_option('display.float_format', lambda x: '%.3f' % x)  # 设置浮点数格式
                
                # 显示DataFrame，使用styler美化
                styled_df = df.style.set_properties(**{
                    'background-color': '#f5f5f5',
                    'border-color': 'black',
                    'border-style': 'solid',
                    'border-width': '1px',
                    'text-align': 'center'
                }).set_table_styles([
                    {'selector': 'th',
                     'props': [('background-color', '#4CAF50'),
                              ('color', 'white'),
                              ('font-weight', 'bold'),
                              ('text-align', 'center'),
                              ('border', '1px solid black')]},
                    {'selector': 'td',
                     'props': [('border', '1px solid black')]}
                ])
                
                display(styled_df)
            else:
                print(f"注意：此变量是{len(data.shape)}维数组，无法以表格形式显示。")
                
    except Exception as e:
        print(f"读取文件时发生错误: {str(e)}")

file_path = 'amigo/data_preprocessed/Data_Preprocessed_P01/Data_Preprocessed_P01.mat'
preview_mat_file(file_path)

In [3]:
import torch
from torch.utils.data import Dataset

class MyDataset(Dataset):
    def __init__(self, data, labels):
        self.data = data
        self.labels = labels

    def __len__(self):
        # 返回数据集样本数
        return len(self.data)

    def __getitem__(self, idx):
        # 根据索引返回一个样本及其标签
        return self.data[idx], self.labels[idx]

# 示例数据
data = torch.randn(100, 3)  # 100个样本，每个样本有3个特征
labels = torch.randint(0, 2, (100,))  # 100个二分类标签

# 创建数据集实例
dataset = MyDataset(data, labels)

# 获取样本
print("data shape:", data.shape)
print("labels shape:", labels.shape)
print("dataset shape:", dataset[0][0].shape)
print("样本数量:", len(dataset))
print("第一个样本:", dataset[0])


data shape: torch.Size([100, 3])
labels shape: torch.Size([100])
dataset shape: torch.Size([3])
样本数量: 100
第一个样本: (tensor([-1.4252,  1.4141, -0.9724]), tensor(1))
