我是一个深度学习与计算机视觉领域的开发者,毕业于西交利物浦大学的数字媒体技术专业,专注于图像处理、目标检测和自注意力机制的应用。 本仓库汇集了我复现的多种经典深度学习模型的实现,包括传统目标检测模型、模型蒸馏、生成对抗网络(GAN)、注意力机制模型等。我专注于探索新技术,并迅速将研究成果应用于实际项目,特别是在目标检测和图像处理方面积累了丰富的经验。我具备强大的科研与创新能力,先后在 2024 年完成了两篇关于深度学习和计算机视觉的论文,展现了我的理论深度和出色的动手能力。此外,我积极参与多个深度学习项目,能够快速将想法转化为实际应用系统,体现了我在技术应用与项目开发中的实践能力。
- 基于自注意力机制的跌倒检测模型:目前正在研究基于 Vision Transformer 的跌倒检测模型,利用自注意力机制优化检测性能。项目中使用了 UR Fall Dataset 进行模型构建和初步实验,并引入新的注意力机制来提升模型的检测准确率和响应速度。
- 驾驶员注意力目标检测:基于深度学习的车外环境目标检测系统,使用 Mask-RCNN 和 Monodepth2 框架进行目标检测和三维深度估计。
- YOLO-Fall 跌倒检测模型:开发适用于开放空间和室内环境的跌倒检测系统,使用 YOLOv7 模型在不同环境下实现了准确可靠的检测。
- 单正例多标签学习(SPMLL):提出了一种基于 GCN 和对抗训练的模型,用于图像事件识别,提供了新的数据集和基准测试结果。
- 编程语言:Python, Java
- 深度学习框架:PyTorch
- 神经网络架构:
- 卷积神经网络(CNN):ResNet, DenseNet, AlexNet, VGG
- 生成对抗网络(GAN):DCGAN, CycleGAN
- 图神经网络(GNN):GCN, GAT
- 自注意力机制与Transformer模型:ViT
- 工具与平台:Git, Docker,CUDA
- YOLO-Fall 跌倒检测模型 (IEEE Access 2024)
- 单正例多标签学习在图像情境识别中的应用 (ACM WSDM 2025)