2025W39论文推荐

LLM

简介	URL
LeCun 新作 LLM-JEPA：用 CV 的思路训练 LLM，性能鲁棒性双丰收	https://www.arxiv.org/abs/2509.14252
SFT 与 RL 的结合，vivo AI Lab 提出新的后训练方法	https://arxiv.org/abs/2509.12108
Google 提出两阶段分解方法，先总结交互再提取意图，显著提升小模型性能	https://arxiv.org/abs/2509.12423
Mini-Omni-Reasoner：实时推理，定义下一代端到端对话模型	https://arxiv.org/abs/2508.15827
`强化学习` 牛津大学、Meta 用 CaT 解决 RL 监督难题	https://arxiv.org/abs/2509.14234
浙大、南大等提出 SEER 框架，通过自增强方式压缩思维链，在保持准确性的同时减少 42.1% 的推理长度	https://arxiv.org/abs/2509.14093

简介	URL
西湖大学 WorldForge 开启空间智能新路径，让 AI 读懂 3D 世界	https://arxiv.org/abs/2509.15130
苹果提出 ATOKEN，统一处理三种模态的视觉分词器	https://arxiv.org/abs/2509.14476
北大与字节团队提出 BranchGRPO，用「树形分叉 + 剪枝」重塑扩散模型对齐	https://arxiv.org/abs/2509.06040
东北大学等提出门控残差标记化框架，结合运动补偿和语义场景合并减少高帧率视频的标记数量	https://arxiv.org/abs/2509.14199
超越免训练剪枝：LightVLA 引入可微分 token 剪枝，首次实现 VLA 模型性能和效率的双重突破	https://arxiv.org/abs/2509.12594
GUI 智能体训练迎来新范式，半在线强化学习让 7B 模型媲美 GPT-4o	https://arxiv.org/abs/2509.11543
Meta 提出 LSP：无数据也能实现能力飞升	https://arxiv.org/abs/2509.07414

简介	URL
阿里通义千问在云栖大会发布 Qwen3 系列模型 “全家桶”	https://mp.weixin.qq.com/s/LrdZM1JKIQUHfojphVtcjg
MiniCPM-V 4.5 多模态模型开源发布	https://github.com/OpenBMB/MiniCPM-o
上海 AI Lab 等发布覆盖 10 学科 1000 题的文生图模型基准 GenExam	https://arxiv.org/abs/2509.14232
百度智能云千帆开源 Qianfan-VL 视觉理解模型	https://github.com/baidubce/Qianfan-VL/blob/main/docs/qianfan_vl_report_comp.pdf
Meta LeCun 团队开源的 CWM 代码世界模型	https://huggingface.co/facebook/cwm

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
README.md		README.md