In [None]:
import numpy as np
from typing import List, Union, Optional
from numpy import ndarray

def combine_datasets(Xt: ndarray, yt: ndarray, Xs: Optional[Union[ndarray, List[ndarray]]] = None, ys: 
    Optional[Union[ndarray, List[ndarray]]] = None) -> (List[ndarray], List[ndarray]): # type: ignore
    """
    结合来自不同来源的数据集。

    参数:
    Xt (ndarray): 目标域的数据集，形状为 (样本数, 通道数, 采样点数)。
    yt (ndarray): 目标域的标签向量，长度为样本数。
    Xs (Optional[Union[ndarray, List[ndarray]]], 默认为None): 源域的数据集，可以是以下之一:
        - None: 不使用源域数据。
        - 3维ndarray: 单个源域的数据集，形状为 (样本数, 通道数, 采样点数)。
        - 列表: 包含多个源域数据集的列表，每个元素都是一个3维ndarray。
        - 4维ndarray: 包含多个源域数据集的4维数组，形状为 (数据集数量, 样本数, 通道数, 采样点数)。
    ys (Optional[Union[ndarray, List[ndarray]]], 默认为None): 源域的标签集，可以是以下之一:
        - None: 不使用源域标签。
        - 1维ndarray: 单个源域的标签向量，长度为样本数。
        - 列表: 包含多个源域标签向量的列表，每个元素都是一个1维ndarray。

    返回:
    (List[ndarray], List[ndarray]): 两个列表，第一个是数据集列表，第二个是对应的标签列表。每个列表的元素数量等于“数据集来源数”。

    示例:
    >>> Xt = np.random.rand(10, 5, 100)  # 目标域数据集
    >>> yt = np.random.randint(0, 2, 10)  # 目标域标签
    >>> Xs = [np.random.rand(8, 5, 100), np.random.rand(12, 5, 100)]  # 源域数据集列表
    >>> ys = [np.random.randint(0, 2, 8), np.random.randint(0, 2, 12)]  # 源域标签列表
    >>> X_combined, Y_combined = combine_datasets(Xt, yt, Xs, ys)
    """

    X_combined = [Xt]  # 初始化数据集列表，首先添加目标域数据集
    Y_combined = [yt]  # 初始化标签列表，首先添加目标域标签

    # 检查Xs是否为None
    if Xs is None:
        return X_combined, Y_combined

    # 检查Xs是否为列表
    if isinstance(Xs, list):
        # 确保ys也是列表且长度与Xs相同
        if not isinstance(ys, list) or len(ys) != len(Xs):
            raise ValueError("ys must be a list with the same length as Xs")
        X_combined.extend(Xs)
        Y_combined.extend(ys)

    # 检查Xs是否为4维数组
    elif Xs.ndim == 4:
        # 将4维数组拆分为多个3维数组并添加到列表中
        for i in range(Xs.shape[0]):
            X_combined.append(Xs[i])
            Y_combined.append(ys[i])

    # 检查Xs是否为3维数组
    elif Xs.ndim == 3:
        X_combined.append(Xs)
        Y_combined.append(ys)

    # 其他情况，抛出异常
    else:
        raise ValueError("Xs must be either a 3D or 4D ndarray or a list of 3D ndarrays")

    return X_combined, Y_combined


In [None]:
# 示例使用
Xt = np.random.rand(10, 5, 100)  # 假设有10个样本，5个通道，每个通道100个采样点
yt = np.random.randint(0, 2, 10)  # 假设有10个样本的二分类标签

# 假设Xs是一个列表，包含来自不同源域的数据集
Xs = [np.random.rand(8, 5, 100), np.random.rand(12, 5, 100)]  # 每个源域的样本数可能不同
ys = [np.random.randint(0, 2, 8), np.random.randint(0, 2, 12)]  # 每个源域的标签

X_combined, Y_combined = combine_datasets(Xt, yt, Xs, ys)

a=0