简介 | URL |
---|---|
LeCun 新作 LLM-JEPA:用 CV 的思路训练 LLM,性能鲁棒性双丰收 | https://www.arxiv.org/abs/2509.14252 |
SFT 与 RL 的结合,vivo AI Lab 提出新的后训练方法 | https://arxiv.org/abs/2509.12108 |
Google 提出两阶段分解方法,先总结交互再提取意图,显著提升小模型性能 | https://arxiv.org/abs/2509.12423 |
Mini-Omni-Reasoner:实时推理,定义下一代端到端对话模型 | https://arxiv.org/abs/2508.15827 |
强化学习 牛津大学、Meta 用 CaT 解决 RL 监督难题 |
https://arxiv.org/abs/2509.14234 |
浙大、南大等提出 SEER 框架,通过自增强方式压缩思维链,在保持准确性的同时减少 42.1% 的推理长度 | https://arxiv.org/abs/2509.14093 |
简介 | URL |
---|---|
西湖大学 WorldForge 开启空间智能新路径,让 AI 读懂 3D 世界 | https://arxiv.org/abs/2509.15130 |
苹果提出 ATOKEN,统一处理三种模态的视觉分词器 | https://arxiv.org/abs/2509.14476 |
北大与字节团队提出 BranchGRPO,用「树形分叉 + 剪枝」重塑扩散模型对齐 | https://arxiv.org/abs/2509.06040 |
东北大学等提出门控残差标记化框架,结合运动补偿和语义场景合并减少高帧率视频的标记数量 | https://arxiv.org/abs/2509.14199 |
超越免训练剪枝:LightVLA 引入可微分 token 剪枝,首次实现 VLA 模型性能和效率的双重突破 | https://arxiv.org/abs/2509.12594 |
GUI 智能体训练迎来新范式,半在线强化学习让 7B 模型媲美 GPT-4o | https://arxiv.org/abs/2509.11543 |
Meta 提出 LSP:无数据也能实现能力飞升 | https://arxiv.org/abs/2509.07414 |
简介 | URL |
---|---|
阿里通义千问在云栖大会发布 Qwen3 系列模型 “全家桶” | https://mp.weixin.qq.com/s/LrdZM1JKIQUHfojphVtcjg |
MiniCPM-V 4.5 多模态模型开源发布 | https://github.com/OpenBMB/MiniCPM-o |
上海 AI Lab 等发布覆盖 10 学科 1000 题的文生图模型基准 GenExam | https://arxiv.org/abs/2509.14232 |
百度智能云千帆开源 Qianfan-VL 视觉理解模型 | https://github.com/baidubce/Qianfan-VL/blob/main/docs/qianfan_vl_report_comp.pdf |
Meta LeCun 团队开源的 CWM 代码世界模型 | https://huggingface.co/facebook/cwm |