Skip to content

Rookie-AI-CV/Vision-PaperLab

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

计算机视觉经典论文收录

本仓库系统性地收录了计算机视觉领域的经典深度学习论文,涵盖图像分类、目标检测、语义分割、自监督学习等多个研究方向。每篇论文均提供原版、中文翻译版及中英对照版,并附有相应的代码实现链接,旨在为研究者和学习者提供全面的学习资源。

项目结构

Vision-PaperLab/
├── paper/                    # 论文PDF文件目录
│   ├── *.pdf                 # 原版论文
│   ├── *-mono.pdf            # 中文翻译版
│   └── *-dual.pdf            # 中英对照版
│
├── notes/                    # 阅读笔记目录(按研究方向分类)
│   ├── classification/       # 图像分类相关笔记
│   ├── detection/            # 目标检测相关笔记
│   ├── segmentation/        # 语义分割相关笔记
│   ├── transformer/          # Transformer架构相关笔记
│   ├── self-supervised/     # 自监督学习相关笔记
│   └── multimodal/          # 多模态学习相关笔记
│
├── docs/                     # 文档目录
│   └── STRUCTURE.md         # 目录结构详细说明
│
├── README.md                 # 项目主README
└── .gitignore               # Git忽略文件配置

详细的目录结构说明请参考 docs/STRUCTURE.md

📑 快速导航

📚 论文列表

图像分类

论文名称 原版论文 中文版 中英对照 Code Note
AlexNet PDF 中文版 中英对照 GitHub 笔记
VGG PDF 中文版 中英对照 GitHub 笔记
ResNet PDF 中文版 中英对照 GitHub 笔记
ResNetV2 PDF 中文版 中英对照 GitHub 笔记
GoogleNet PDF 中文版 中英对照 GitHub 笔记

目标检测

论文名称 原版论文 中文版 中英对照 Code Note
R-CNN PDF - - GitHub 笔记
Faster R-CNN PDF 中文版 中英对照 GitHub 笔记
FPN PDF 中文版 中英对照 GitHub 笔记
Mask R-CNN PDF 中文版 中英对照 GitHub 笔记
DETR PDF 中文版 中英对照 GitHub 笔记

语义分割

论文名称 原版论文 中文版 中英对照 Code Note
FCN PDF - - GitHub 笔记
U-Net PDF 中文版 中英对照 GitHub 笔记
DeepLab PDF - - GitHub 笔记
SAM PDF - - GitHub 笔记

Transformer架构

论文名称 原版论文 中文版 中英对照 Code Note
Transformer PDF 中文版 中英对照 GitHub 笔记
BERT PDF 中文版 中英对照 GitHub 笔记
ViT PDF 中文版 中英对照 GitHub 笔记
Swin Transformer PDF 中文版 中英对照 GitHub 笔记

自监督学习

论文名称 原版论文 中文版 中英对照 Code Note
MAE PDF 中文版 中英对照 GitHub 笔记
DINOv1 PDF 中文版 中英对照 GitHub 笔记

多模态学习

论文名称 原版论文 中文版 中英对照 Code Note
CLIP PDF - - GitHub 笔记

📖 资源说明

每篇论文均提供以下资源:

  • 原版论文:链接至原始英文版本PDF
  • 中文版(mono):纯中文翻译版本,便于中文读者理解
  • 中英对照版(dual):中英对照版本,适合双语学习
  • Code:对应的GitHub代码仓库链接,包含官方实现或高质量第三方实现
  • Note:个人阅读笔记目录链接,可在对应分类目录下创建笔记

💡 提示:部分论文可能暂未提供中文翻译版,我们会持续更新。

🚀 使用建议

学习路径

  1. 按时间顺序学习:从AlexNet开始,按照发表时间顺序阅读,理解深度学习在CV领域的发展脉络
  2. 按研究方向学习:选择感兴趣的研究方向(如目标检测),系统性地学习该领域的经典工作
  3. 对比学习:阅读同一研究方向的不同论文,对比方法差异和改进点

阅读建议

  • 📄 先读原版:对于重要论文,建议先阅读原版英文论文,确保准确理解
  • 📝 做笔记:在notes/目录下创建阅读笔记,记录核心思想、关键公式和实验分析
  • 💻 看代码:结合代码实现深入理解论文中的技术细节
  • 🔗 关注关联:注意论文之间的引用关系,理解技术演进过程

笔记模板

创建笔记时,建议参考各分类目录下的README模板,包含:

  • 论文基本信息(作者、会议/期刊、年份)
  • 核心贡献和创新点
  • 方法概述和关键技术
  • 实验结果分析
  • 个人思考和启发

🤝 贡献指南

本仓库持续更新中,欢迎贡献:

  • ✨ 补充新的经典论文
  • 📝 添加或完善阅读笔记
  • 🔗 更新代码仓库链接
  • 🌐 提供论文翻译版本
  • 🐛 修正错误或改进文档

📄 许可证

本仓库仅用于学术研究和学习目的。论文版权归原作者所有,代码仓库遵循各自的许可证。

📮 联系方式

如有问题或建议,欢迎通过Issue或Pull Request参与讨论。

About

CV-PaperLab is a research repository for influential computer vision papers. It provides structured explanations in Markdown or Jupyter notebooks and links to original or reproduced code via independent submodules, covering classification, detection, segmentation, generation, and vision foundation models.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages