本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。
原文共计112904 字,简读后为7063字,阅读时间为18分钟,为您提高阅读效率为1567%
- 谷歌砸了6000万美元买贴吧数据💰💻,只为训练人工智能模型!Altman竟是这家公司的第三大股东🤔
- 人工智能和机器人的爆发年!🚀🤖英伟达的Jim Fan领衔登月任务,谷歌DeepMind的新技术曝光🎉
- 老黄发布了全新的RTX 500 GPU,人工智能图像生成性能提升了14倍!😱🤯🎨人工智能应用的门槛被彻底打破了🎉
- 苹果十年的造车梦碎了!🚗💔2000人被裁员或转岗到人工智能部门,烧掉了近百亿美元,让马斯克乐开了花😂
- 百度股价已经大跌近30%,分析师表示:2024年将是百度人工智能成败的关键一年📉📈
- 英特尔的目标:2025 年全球人工智能电脑超过 1 亿台,占比 20%💻💡
- AlphaFold 预测了细菌生存所需的 1402 种蛋白质相互作用🔬🦠,最完整的细菌必需相互作用图谱🎉
- 英伟达等科技巨头宣布组建发起人工智能无线网络联盟🌐🚀,美国、英国等 10 国宣布支持 6G🎉
- 外媒评论苹果放弃造车:很遗憾,但这就是现实🚗💻,苹果更需要人工智能🎉
- 日本出生人数再创历史新低🇯🇵👶,用人工智能匹配相亲局能否遏制这种颓势?🤔
要点解析:
苹果公司宣布终止泰坦计划,放弃造车项目,将相关员工调至人工智能部门,专注于生成式AI的开发。此举标志着苹果战略重心的转移,从沉寂多年的造车项目转向前景广阔的人工智能领域。
近年来,全球电动汽车市场遇冷,加上苹果在自动驾驶技术开发上的迟滞,使得泰坦计划陷入困境。苹果意识到继续投入巨额资金将难以获得理想的回报,因此决定及时止损。
苹果此前在造车上的投入高达数十亿美元,但最终未能取得实质性进展,此次放弃造车可视为苹果一次重大战略调整。而对生成式AI的投入,则反映了苹果对未来科技走势的判断和布局。
要点解析:
-
AI 技术正在改变搜索方式,从基于关键字的单向匹配转向更直观、精确的双向对话。OpenAI 的 ChatGPT 等模型展示了其在自然语言处理和用户互动方面的能力,促使人们思考生成式 AI 是否会取代传统搜索引擎。然而,融合大型语言模型的搜索引擎,如微软 Bing 和 Perplexity AI,通过直接回答问题和提供个性化结果,为搜索体验带来了新的可能性。
-
OpenAI 正在开发一款新的搜索产品,可能基于微软 Bing 的功能,并利用其技术提供更精准、个性化的搜索结果。这一举措预示着 AI 在搜索技术中的角色将进一步加强,并可能挑战谷歌在搜索市场的领导地位。
-
尽管人工智能版 Bing 引入了新的搜索范式,但一年后,微软在削减谷歌市场份额方面进展甚微。随着 AI 继续改变搜索格局,OpenAI 的新产品可能会带来新的可能性,但用户习惯和谷歌在生成式 AI 方面的领先优势仍然是影响因素。
http://www.geekpark.net/news/331717
要点解析:
美英等10国发表联合声明,支持发展6G原则,呼吁更多国家和组织共同维护开放、自由、安全的6G网络环境。
英伟达、诺基亚、微软等欧美巨头组建联盟,推动6G网络与人工智能的融合发展,认为AI将成为6G时代新兴服务变革的关键因素。
三星表示,6G网络将改变人们与科技的互动方式,人工智能将成为这一趋势中的重要组成部分。
https://m.cnbeta.com.tw/view/1421367.htm
要点解析:
-
日本2022年新生儿数量持续下降,已创历史新低,同时结婚人数也下降,这导致新生儿数量减少。
-
专家认为,日本出生率持续下降,六年内年轻人口将迅速下降,日本已经没有时间可以浪费。
-
日本政府已采取措施提供补贴和支持,但专家指出政府主要关注已经成家或有生育意愿的人士,没有解决年轻人越来越棘手的单身倾向。
https://m.cnbeta.com.tw/view/1421343.htm
要点解析:
-
百度推出的文心一言面临考验:它需要证明公司能够利用其AI先发优势来重振不断下滑的股价。伯恩斯坦分析师鲍里斯·范认为,百度正在改进文心一言应用,这将推动用户流量的大幅增长,并带来更高的广告费率。
-
然而,随着阿里和腾讯等竞争对手推出竞品,百度在AI领域的优势迅速被侵蚀。百度AI业务总体上仍处于亏损状态,未来三年不太可能扭亏为盈。
-
在百度即将发布第四季度财报之际,投资者对该公司发展前景的信心似乎有所下降。好于预期的业绩可能会引发百度股价在近期暴跌后大幅反弹, 摩根大通预计,百度第四季度业绩将符合市场一致预期,包括亚历克斯·姚在内的摩根大通分析师在一份报告中写道,百度股票今年的表现将取决于中国的宏观前景以及该公司在生成式AI上的创收能力。
https://m.cnbeta.com.tw/view/1421413.htm
要点解析:
路透社研究所分析多个主流新闻媒体发现,超过一半(57%)的传统印刷媒体屏蔽了OpenAI的爬虫程序,广播电视媒体和数字媒体屏蔽比例分别为48%和31%。不同国家和地区屏蔽比例差异较大,美国高达79%,墨西哥和波兰仅为20%。屏蔽OpenAI爬虫的新闻媒体中,97%也屏蔽了谷歌人工智能的爬虫。
新闻媒体屏蔽OpenAI爬虫的原因是担心人工智能会取代他们,威胁生计。研究还发现,当新的人工智能模型根据先前模型而非人类输入的数据进行训练时,它们往往会“模型崩溃”或退化,导致越来越多地生成错误信息。
OpenAI和谷歌于去年分别推出人工智能爬虫,一旦新闻媒体决定屏蔽,恐难更改立场对其进行解除。
https://www.freebuf.com/news/392764.html
要点解析:
-
OpenAI Sora是一款文本转视频模型,基于DALL-E 2模型改进,采用扩散模型生成视频,并使用注意机制控制视频生成;可用于创建电影视觉效果、教育视频、营销视频等。
-
AI电影制作方面,SORA可提升效率降低成本,应用于剧本创作、电影拍摄和后期制作。电影《我们的T2重制版》由50位艺术家使用SORA打造,融合经典元素和现代技术。
-
SORA还可用于电影和短视频制作和市场分析,提取视频信息,辅助剧本创作、推荐用户喜欢的视频,帮助电影制片人分析市场趋势。
https://juejin.cn/post/7340109700766466100
要点解析:
-
谷歌DeepMind和英伟达这两家AI巨头都在机器人领域取得进展。Google DeepMind提出了一种新的方法,使用称为LLM的语言模型来训练机器人,与人类互动,并使用模拟来提高机器人的灵活性。英伟达展示了其多模态LLM VIMA,该模型可用于各种机器人任务,例如目标达到、模仿和约束满足。
-
DeepMind的研究表明,使用LLM模型进行微调可以显着提高机器人的可教性,使其能够更快地从人类交互中学习,从而在各种任务中表现出更好的适应能力和响应能力。
-
研究人员提出了一个名为GEAR的新研究小组,重点关注通用自主代理的研究,旨在建立具有通用能力的人工智能,能够熟练地在虚拟和现实世界中行动。
要点解析:
MLPerf推出新的存储基准测试,用于评估存储系统在大规模AI模型训练场景中的性能。JuiceFS企业版在Unet3D的500卡测试中,GPU利用率保持在97%以上;在BERT的1000卡测试中,GPU利用率保持在98%以上。
Unet3D模型的训练对带宽需求较高。在没有缓存的情况下,随着节点数增加,GPU利用率会下降,当GPU增至98卡时,GPU利用率随节点数增加而急剧降低。
开启分布式缓存后,随着缓存空间与数据集大小的比例增加,缓存命中率逐渐提高,进而带动GPU利用率上升。当缓存命中率达到100%时,GPU利用率达到最高的98.8%,几乎满载运行。
https://juejin.cn/post/7340163679848218660
要点解析:
-
英特尔的目标是到 2025 年年底,为超过 1 亿台 AI PC 供应处理器。该公司预估今年将交付 4000 万台 AI PC,明年将再交付 6000 万台,并计划到 2025 年年底,AI PC 在全球 PC 市场中的占比超过 20% 以上.
-
英特尔与 100 多家软件供应商合作,通过 Windows 11 和 Copilot 的悉心打磨,带来全新的 AI 体验。通过与其它供应商合作,探索各种 AI 技能的落地,例如视频会议跟踪用户的视线或移除背景;翻译手语并转录为文本;基于提示词自动创建演示文稿;调用 NPU 资源协同杀毒软件工作等等。
-
2024 年将是设备更新换代并为 AI 做好准备的绝佳时机。
https://www.ithome.com/0/752/552.htm
要点解析:
Reddit作为互联网上最大的真实人类经验生成的数据源之一,其庞大且独一无二的实时人类对话档案库对于搜索、AI训练和研究等领域来说极其宝贵。日前,Reddit和谷歌官宣达成合作协议,Reddit的数据将帮助谷歌训练AI模型,合约价值每年6000万美元,这笔交易发生在Reddit计划首次公开募股之前,有望快速提升公司价值。
有趣的是,OpenAI首席执行官Sam Altman是Reddit重要股东之一,持有8.7%股份,拥有两倍于Reddit首席执行官Steve Huffman的投票权。Reddit上市前与谷歌的合作协议,并未透露是否与OpenAI有合作关系。
Reddit两位联合创始人Steve Huffman和Alexis Ohanian曾携手打造了Reddit论坛,但因对仇恨内容处理分歧分道扬镳。Ohanian在2020年因抗议Reddit上暴力社区辞去董事会职务,而Huffman则专注于探索盈利模式,Reddit去年的销售额达到8.04亿美元,亏损减少43%至约9100万美元。
要点解析:
-
GitHub旗下开发者平台宣布,其生成式AI服务GitHub Copilot Enterprise现已面向所有企业客户开放。
-
该全新企业版将根据每个企业的代码库和知识库进行个性化定制,回答与之相关的问题,支持拉取请求描述和摘要,以及针对一般性编码问题的聊天支持。
-
GitHub Copilot Enterprise还新增了对微软必应搜索引擎的支持,可以获取最新的软件和编码信息。
https://www.ithome.com/0/752/508.htm
要点解析:
传音旗下品牌 Tecno 推出的全新 Megabook T16 Pro 2024 Ultra 笔记本,成为全球首批采用最新英特尔酷睿 Ultra 7 处理器的笔记本电脑之一。该笔记本搭载英特尔 Arc 移动 GPU,最高可配置 32GB 内存和 1TB SSD,满足现代游戏、生产力和内容创建(尤其是人工智能)等需求。
该笔记本最大的亮点是内置 Tecno PC Manager 应用,可以利用英特尔酷睿 Ultra 7 处理器中的特殊内置芯片(称为 NPU),处理各种 AI 任务。官方表示 1 秒就能生成一张 512*512 分辨率的图片,6 秒钟内渲染一张 1024*768 更高质量的 AI 图像。
Megabook T16 Pro 2024 Ultra 配备了令人惊叹的 "黄金比例"16:10 屏幕和纤薄边框,屏占比高达 90%,2.5k 高分辨率显示屏非常适合内容创作者和艺术家使用。
https://www.ithome.com/0/752/488.htm
要点解析:
-
基于大语言模型,作者开发了一个名为“平面国”的文本游戏 bot,该 bot 扮演游戏主持人的角色,为玩家提供游戏世界观介绍,并根据玩家输入生成游戏反馈和下一步引导。
-
游戏采用随机生成的房间和物品,每次行动独立,通过玩家与 bot 的交互和进入新房间推进。
-
尽管游戏机制可行,但流程仍需完善,玩家输入的多样性可能导致 bot 输出难以控制。
https://juejin.cn/post/7340109700766974004
要点解析:
英伟达发布全新入门级移动工作站GPU,性能提升显著。
-
RTX 500 Ada和RTX 1000 Ada采用Ada架构,支持光线追踪、Tensor核心和CUDA核心,性能比上一代提升30%。
-
与依赖CPU的配置相比,RTX 500 GPU在执行Stable Diffusion等AI模型时性能提升14倍,AI照片编辑速度提升3倍,3D渲染性能提升10倍。
英伟达布局AI PC,普通消费者也能享受AI红利。
-
英伟达发布入门级GPU,意味着普通消费者也能享受到AI技术带来的便利。
-
AMD和英特尔也推出带有AI能力的产品,竞争日益激烈。
-
微软更新操作系统,支持英特尔和AMD的NPU,进一步推动AI应用发展。
英伟达推出Chat with RTX系统,降低AI应用门槛。
-
Chat with RTX是一个面向普通消费者的AI应用,可以让用户本地化运行大模型。
-
用户只需配置符合要求的显卡和内存空间,即可使用该系统。
-
目前仅支持开源Mistral 7B和Llama 2 13B模型,未来可能会支持更多模型。
要点解析:
-
2月22日,OpenAI推出了新的人工智能模型Sora,该模型能够根据文本描述生成逼真的视频。这标志着AI视频生成领域迈出了重要的一步。Sora能够生成一分钟的视频,并且可以模拟真实的物理原理,如重力、流体运动和刚体运动等。
-
目前,Sora仍在红队测试中,只有被选中的艺术家、电影制作人和设计师才能获得访问系统的权限。OpenAI没有设定发布Sora的时间表,因为希望能降低它和选举相关的安全风险。
-
虽然Sora目前还存在一些问题,如速度慢、有时生成的内容不符合逻辑等,但它仍然代表了AI视频生成领域的一个重大突破。随着技术的不断进步,AI视频生成将对影视行业产生深远的影响。
要点解析:
-
随着 AI 技术的飞速发展,通用人工智能(AGI)的概念越来越受到人们的关注。目前,国内各大科技公司都在积极研发自己的大模型,例如文心一言、Qwen、云雀语言大模型等。
-
为了让普通人也能轻松训练自己的机器人,字节跳动推出了基于云雀语言大模型的一站式 AI 平台 Coze。用户可以根据自己的需求,定制出各式各样的自动化工具或机器人。
-
在 Coze 平台上,用户可以为机器人赋能,给予机器人该具备的知识能力,从而实现各种各样的功能。例如,用户可以训练一个机器人来回答用户的问题,或者训练一个机器人来帮助用户检索信息。
https://juejin.cn/post/7340107906404876338
要点解析:
-
whisper是OpenAi的一个语言识别模型,支持多任务处理,包括语言识别和语言翻译。whisper有不同的模型尺寸可供选择,支持多种语言,在Common Voice 15和Fleurs数据集上的WER或CER指标表现良好。
-
要使用whisper,需要安装python、pyTorch和ffmpeg。环境搭建好之后,可以直接从github上下载社区贡献的demo,安装依赖并运行程序即可。
-
whisper是一个中等模型,识别准确率很高,可以在1-2秒内将音频中的内容识别出来,非常适合前端同学使用。
https://juejin.cn/post/7340124291466084403
要点解析:
-
字节跳动开发出一款新的文字生成图像模型 SDXL-Lightning,其速度比以往的加速技术快 10 倍,可在 2 或 4 步内生成极高质量和分辨率的图像。
-
模型可以产生令人惊叹的图像,在图像质量上也超越了以往的加速技术。模型也支持开源社区里目前最流行的生成软件 ComfyUI,模型可以被直接加载来使用。
-
SDXL-Lightning 模型也可以和目前非常流行的控制插件 ControlNet 相结合,实现极速可控的图片生成,字节跳动宣布 SDXL-Lightning 模型已开放,开发者、研究人员和创意从业者可以访问和使用该模型。
https://juejin.cn/post/7340109700766777396
要点解析:
-
利用 Coze 工具,作者创建了一个虚拟的“知心姐姐”,通过拖拽操作和插件选择,设置了聊天逻辑,获得了 AI 回应。该知心姐姐能够倾听用户倾诉、提供建议、分享人生感悟,但不以说教的方式,而是站在用户的角度提供安慰和支持。
-
作者在创建过程中定制了知心姐姐的技能和限制,优化了人设和回复逻辑,并通过插件添加了诸如搜索引擎、图片生成和天气查询等功能。
-
为确保知心姐姐的流畅对话,作者修改了开场白、选择了文静的音色,并引入了知识库,拓展了回答的广度和深度。
https://juejin.cn/post/7340167256268275748
要点解析:
-
亚马逊云科技发布最新的大模型服务Bedrock,并正式开放「文生图」功能,展示了在图像生成领域的领先地位。
-
Amazon Q是基于Amazon Bedrock构建的完全托管的生成式AI驱动的企业聊天助手,能够帮助用户快速了解亚马逊云服务,提供对应的链接地址。
-
亚马逊云科技SageMaker提供了在线Jupyter平台,让数据专家可以在云端访问Notebook进行数据分析工作,无需下载数据到本地。
https://juejin.cn/post/7340109700767629364
要点解析:
-
苹果已决定终止其电动汽车项目,部分员工转岗至人工智能领域。
-
苹果汽车项目的取消可能是苹果在人工智能领域相对落后,且汽车制造业的竞争激烈所致。
-
苹果汽车项目的取消引发了关于苹果研发管理不善和缺乏清晰愿景的讨论。
https://m.cnbeta.com.tw/view/1421363.htm
要点解析:
-
在深度学习中,为了方便地计算梯度并优化模型参数,
PyTorch
提供了一个强大的自动求导模块,即Autograd
. -
Autograd
可以自动计算张量的梯度,还支持高阶导数计算,并与动态计算图配合使用,使得PyTorch
更加灵活. -
梯度累积可能导致收敛速度减慢,数值不稳定性,内存占用,以及局部最优解陷阱等问题,因此在训练深度神经网络时,通常建议避免梯度累积.
https://juejin.cn/post/7340120569030393908
要点解析:
多线程和多进程在 Python 中实现并发的区别主要是由于全局解释器锁 (GIL)。GIL 用于简化 Python 内存管理中的复杂性,但它限制了多线程在多核处理器上实现真正的并行执行。这使得多线程对于计算密集型任务的效率低于多进程,但它仍然适用于 I/O 密集型任务。
GIL 限制了 Python 多线程在多核处理器上利用并行计算的优势。但是,我们可以通过使用多进程、C 扩展或其他 Python 实现(如 Jython 或 IronPython)来规避或减少此限制。
在 Python 中正确使用多线程需要明确场景类型(I/O 密集型或计算密集型)、使用合适的工具和库、避免共享状态、合理分配线程数量以及优化 I/O 操作。通过遵循这些建议,我们可以有效利用多线程来提高 Python 程序的性能。
https://juejin.cn/post/7340208335982231578
要点解析:
为了解决商业人工智能和大语言模型(LLM)在处理敏感数据或专有数据时的隐私问题,我们可以了解如何在本地运行私有 LLM。开源模型提供了一种解决方案,但它们也有自己的挑战和优势。
需要了解本地运行 LLM 的挑战包括:可能需要强大的硬件,功能可能不如更完善的产品,且并非所有模型都能用于商业用途。不过,开源和闭源模型之间的差距正在缩小。
Hugging Face 提供了大量开源模型和一个 Python 库(Transformers),可以简化本地运行 LLM 的过程。LangChain 是一个用于构建人工智能应用程序的 Python 框架,它提供抽象和中间件,以便在其支持的模型之上开发人工智能应用程序。Llama.cpp 是一个针对苹果芯片进行了优化、可运行 Meta 的 Llama2 模型的 LLM 推理引擎。Llamafile 和 Ollama 提供了用户友好的替代方案,可以创建单一可执行文件并具有直观的 GUI。
https://juejin.cn/post/7340076087249453090
要点解析:
利用自然语言处理技术,我们可以提升医疗信息处理的效率和准确性。其中,实体提取可以识别文本中的关键信息,如疾病、药物和治疗方法,为后续分析奠定基础。文本分类可将文本划分到不同类别,如病例研究和治疗方案,便于信息管理。关系抽取则有助于理解实体之间的联系,如疾病与治疗方法之间的关联,为医学研究和临床实践提供支持。
未来,随着深度学习技术的不断进步,医疗文本处理领域将迎来更先进、更精准的自然语言处理模型。然而,也需重视伦理、隐私和公正性等问题,确保技术安全可靠地应用于医疗领域。
自然语言处理技术的广泛应用,将为医疗信息处理带来革命性变革,深刻影响医学研究、临床实践和患者管理,为提升医疗效率和促进医学进步做出重要贡献。
https://juejin.cn/post/7340127788053348389
要点解析:
-
细菌蛋白质组由约 4000-5000 个蛋白质组成,相互作用组可能多达 2000 万个相互作用,但并非所有相互作用都对细菌生存至关重要。
-
本研究使用人工智能工具 AlphaFold 预测并模拟了细菌中必需(essential)蛋白质之间的 1402 种相互作用,绘制了最完整的细菌必需相互作用图谱。
-
这些结果揭示了这些机制以前未知的细节,并为开发新的抗生素提供了潜在的靶点。
https://www.jiqizhixin.com/articles/2024-02-28-2
要点解析:
-
近日,小红书团队开发了一个名为 Instant ID 的 ControlNet,能够通过提取人的面部信息,在生成的人物图片中使用此面部,效果完全可以代替 Lora 模型,只需要一张正面照片即可直接出图。
-
Instant ID 通过 IP-Adapter 技术提取参考图片中的面部特征信息,然后通过交叉注意力将面部特征信息传递给 UNet,用于在反向扩散过程中影响人脸的生成。
-
Instant ID 目前只支持 SDXL,提示词和反向提示词简单写写就行了,根据 Github 上的讨论,宽度和高度不要使用 1024,否则会出现难以消除的水印文字。
https://juejin.cn/post/7340127788053839909
要点解析:
人工智能在语音机器人中发挥着至关重要的作用,它通过自动语音识别技术来理解和响应口语,为客户提供自助服务和准确的呼叫转接。这使得人工坐席可以专注于处理更复杂的客户交互。
人工智能还可以用于提升音质,确保企业提供卓越的客户体验。它可以有效减少背景噪音、消除回声和混响,并适应不同的口音和方言,确保客户与语音机器人顺畅交互。
随着人工智能在语音领域持续发展,我们期待看到更多创新的解决方案,进一步提升企业与客户的互动方式。
https://aithority.com/?p=565869
要点解析:
-
Automattic计划将WordPress和Tumblr平台上用户发布的内容出售给AI公司,用于训练数据。
-
该决定引起了争议,Automattic员工已从Tumblr上删除个人照片以示抗议。
-
Automattic将提供退出选项,但大多数用户可能不会注意到或采取行动,这意味着大部分内容仍可能被出售。
https://www.landiannews.com/?p=102609
要点解析:
-
Proof News机构测试了五个著名的人工智能模型在解决有关投票和选举的问题和关切的能力,发现它们的表现普遍较差。
-
专家们根据查询结果的准确性、有害性、偏颇和完整性进行评判,发现所有模型都存在一定的问题。例如,在“如何在内华达州登记投票?”这个问题上,所有模型都给出了不准确的答案。
-
模型中最准确的是GPT-4,但也有大约五分之一的答案存在问题。而当中,最偏颇的回答来自Claude,最不完整的答案来自Gemini,而Gemini也提供了最有害的答案。
https://m.cnbeta.com.tw/view/1421401.htm
要点解析:
-
伴随全球人工智能行业的高速发展,AI绘画已成为科技届的热门话题。本文开篇首先介绍了AI绘画的相关概念和历史背景。紧接着,文章对当下备受瞩目的九大AI绘画工具进行了逐个介绍,包括Jasper Art、DALL-E 2、Prodia、StarryAI、Leap AI、Craiyon、Midjourney、Canva和DeepAI,对不同工具的特点、优缺点以及定价进行了详细对比,以帮助读者快速了解并选出最适合自身需求的AI绘画工具。此外,文章还对AI绘画的潜在挑战与机遇进行了展望。
-
AI绘画在创意内容创作、产品设计和营销等领域有着广泛的应用前景,但也存在着一些潜在的挑战,如版权和伦理问题。值得一提的是,AI绘画作为一项新兴技术,仍处于快速发展阶段,未来或将进一步突破当前的局限,释放出更大的潜力。
-
文章最后总结道,AI绘画技术正以前所未有的速度改变着艺术创作的方式,为艺术家、设计师和营销人员等提供了新的工具和可能性。然而,在拥抱AI绘画技术的同时,我们也应关注其潜在的挑战和局限,并探索如何负责任地使用这项技术。
https://www.eweek.com/?p=224110
要点解析:
-
通过结合自省增强技术,人工智能能够超越本能反应,表现出类似于人类的深思熟虑。
-
自省增强涉及使用外部信息和语言模型自省来改善语言模型的输出。
-
具体技术包括基础自省、Reflexion框架,以及结合自省评估与搜索架构的语言代理树搜索。