Skip to content

Latest commit

 

History

History
37 lines (18 loc) · 1.99 KB

2024-01-10.md

File metadata and controls

37 lines (18 loc) · 1.99 KB

1.大模型和智能体整合

这篇综述探讨了代码(Code)如何赋予大型语言模型(LLMs)及其基于此的智能体(Intelligent Agents)强大的能力。

论文链接: https://arxiv.org/abs/2401.00812

2.FlightLLM让大模型推理不再为性能和成本同时发愁

近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。

第一作者为清华大学电子系博士及无问芯穹硬件负责人曾书霖,通讯作者为上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩,清华大学电子工程系教授、系主任及无问芯穹发起人汪玉。

相关工作现已被可重构计算领域顶级会议 FPGA’24 接收。

论文链接:https://arxiv.org/pdf/2401.03868.pdf

3.荣耀发布自研 70 亿参数端侧平台级 AI 大模型“魔法大模型”

4.贾扬清创业新动作:推出AIGC提示工具,几个字提示玩转SDXL,细节拉满

提示词不会写没关系,AI来帮你搞定。

贾扬清团队LeptonAI最新推出的AIGC提示工具——PromptLLM。

只需短短几个字提示,就能收获一张细节感满满的绘图。

比如鹦鹉吃胡萝卜。

https://promptcraft.lepton.run/

5.MagicVideo:多阶段高美感视频生成

随着对由文本描述生成高度逼真视频的需求不断增长,这个领域的研究得到了重要的推动。在这项工作中,我们引入了MagicVideo-V2,它将文本到图像模型、视频动作生成器、参考图像嵌入模块和帧插值模块集成到一个端到端的视频生成流水线中。受益于这些架构设计,MagicVideo-V2能够生成外观美观、高分辨率、具有显著真实感和流畅性的视频。通过大规模用户评估,它展示了优于领先的文本到视频系统,如Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion模型的性能。

https://arxiv.org/pdf/2401.04468v1.pdf