Skip to content

LessThread/weekly-paper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 

Repository files navigation

2025W39论文推荐

LLM

简介 URL
LeCun 新作 LLM-JEPA:用 CV 的思路训练 LLM,性能鲁棒性双丰收 https://www.arxiv.org/abs/2509.14252
SFT 与 RL 的结合,vivo AI Lab 提出新的后训练方法 https://arxiv.org/abs/2509.12108
Google 提出两阶段分解方法,先总结交互再提取意图,显著提升小模型性能 https://arxiv.org/abs/2509.12423
Mini-Omni-Reasoner:实时推理,定义下一代端到端对话模型 https://arxiv.org/abs/2508.15827
强化学习 牛津大学、Meta 用 CaT 解决 RL 监督难题 https://arxiv.org/abs/2509.14234
浙大、南大等提出 SEER 框架,通过自增强方式压缩思维链,在保持准确性的同时减少 42.1% 的推理长度 https://arxiv.org/abs/2509.14093

多模态和Agent

简介 URL
西湖大学 WorldForge 开启空间智能新路径,让 AI 读懂 3D 世界 https://arxiv.org/abs/2509.15130
苹果提出 ATOKEN,统一处理三种模态的视觉分词器 https://arxiv.org/abs/2509.14476
北大与字节团队提出 BranchGRPO,用「树形分叉 + 剪枝」重塑扩散模型对齐 https://arxiv.org/abs/2509.06040
东北大学等提出门控残差标记化框架,结合运动补偿和语义场景合并减少高帧率视频的标记数量 https://arxiv.org/abs/2509.14199
超越免训练剪枝:LightVLA 引入可微分 token 剪枝,首次实现 VLA 模型性能和效率的双重突破 https://arxiv.org/abs/2509.12594
GUI 智能体训练迎来新范式,半在线强化学习让 7B 模型媲美 GPT-4o https://arxiv.org/abs/2509.11543
Meta 提出 LSP:无数据也能实现能力飞升 https://arxiv.org/abs/2509.07414

其他(含CV)

简介 URL
阿里通义千问在云栖大会发布 Qwen3 系列模型 “全家桶” https://mp.weixin.qq.com/s/LrdZM1JKIQUHfojphVtcjg
MiniCPM-V 4.5 多模态模型开源发布 https://github.com/OpenBMB/MiniCPM-o
上海 AI Lab 等发布覆盖 10 学科 1000 题的文生图模型基准 GenExam https://arxiv.org/abs/2509.14232
百度智能云千帆开源 Qianfan-VL 视觉理解模型 https://github.com/baidubce/Qianfan-VL/blob/main/docs/qianfan_vl_report_comp.pdf
Meta LeCun 团队开源的 CWM 代码世界模型 https://huggingface.co/facebook/cwm

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published