数据以open_source_dataset为名,放在xmodaler_gcn并列的一级。 open_source_dataset,下载后,还需自行补充COCO2014_train/val/test图片和clip提取的图像视觉特征。 代码框架参考cosnet使用的xmodelar,运行入口在xmodaler_gcn/train_net.py