Loading...

热门

用世界模型增强语言模型: 用具身体验增强语言模型

大模型2年前 (2023)发布智源社区

695 0 0

Language Models Meet World Models: Embodied Experiences Enhance Language Models

Jiannan Xiang, Tianhua Tao, Yi Gu, Tianmin Shu, Zirui Wang, Zichao Yang, Zhiting Hu
[UC San Diego & UIUC & MIT & CMU]

用世界模型增强语言模型: 用具身体验增强语言模型

要点:

动机：大型语言模型在许多任务上显示出卓越的能力，但在物理环境中进行简单的推理和规划(如理解物体的持久性或规划居家活动)方面常常存在困难。这是因为语言模型仅在书面文本上进行训练，缺乏实际的体验和技能。因此，本文旨在通过世界模型的微调，增强语言模型并获得多样化的具身知识，同时保留其通用的语言能力。
方法：在世界模型中部署一个实体化智能体(VirtualHome)进行目标导向的规划和随机探索，以获取多样化的具身化经验。然后，使用这些经验对语言模型进行微调，教授其在物理世界中进行推理和行动的多种能力，如规划和完成目标、物体持久性和跟踪等。为了保留语言模型的泛化性，在微调过程中引入经典的弹性权重整合(EWC)和低秩适配器(LoRA)等技术。
优势：通过世界模型的微调，显著提升了基础语言模型在18个下游任务上的表现，平均提高了64.28%。特别是通过所提出的方法增强的小型语言模型(1.3B和6B)与更大的语言模型(如ChatGPT)相媲美甚至超过其性能。

一句话总结:
通过世界模型的微调，提升语言模型在物理环境中推理和规划任务的能力，在多个下游任务中取得显著性能提升。

https://arxiv.org/abs/2305.10626
用世界模型增强语言模型: 用具身体验增强语言模型

# 大模型 # 智源社区 # 大模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

文生图开源模型比较库

智源社区

1,116

GPT Daily 深度见解｜04.28（千模大战III）

GPTDaily

1,133

Google Research｜基于树的生成模型

智源社区

549

大语言模型综述系统性升级

智源社区

669

AI Daily 深度见解｜05.03（开源大模型）

GPTDaily

1,220

艾伦研究院｜SwiftSage：面向复杂交互式任务基于快思考和慢思考的生成式智能体

智源社区

761

暂无评论

暂无评论...

这是一个专注于人工智能产品的导航站。

关于我们友情链接

Copyright © 2025 Ai导航鄂ICP备2023001728号