标签:大模型

社区供稿 | LMDrive: 大语言模型加持的闭环端到端自动驾驶框架

摘要:LMDrive是一个接收语言指令和多模态多视角传感器数据的框架,可实时输出决策控制信号以适应各种驾驶场景。大语言模型(LLM)是2023年最重要的人工智能...

电商平台被ChatGPT椅子占领

OpenAI的ChatGPT模型出现在网购商品名称栏里的道歉体句式引起网友的注意。这种情况不是个例,许多产品的名称栏都使用了类似的句式。这种现象引发了网友的热议...

《西游记》把大模型给难倒了

ChatGPT和Claude都无法回答《西游记》中提到孙悟空这只猴的次数,因为篇幅太长,而市面上的大模型也几乎无法准确回答这个问题。

大模型结合RAG构建客服场景自动问答系统

本次演讲介绍了如何利用LLM RAG范式构建客服自动问答系统,将大模型与客服场景的私有知识和数据相结合,以更准确地回答用户的问题,降低客服系统的人工成本。...

精确指出特定事件发生时间!字节&复旦大学多模态大模型解读视频太香了

复旦大学的多模态理解大模型LEGO可以精确地定位视频中特定事件的发生时间,包括宠物狗转身看镜头、推开滑板和宝宝推起眼镜、舒展身体、翻书的时间戳。这一研...

社区发布 | 深度求索开源国内首个 MoE 大模型,技术报告、模型权重同时发布

DeepSeek团队开源了国内首个MoE大模型DeepSeekMoE,该模型采用全新的MoE架构,具有多尺度(2B->16B->145B)模型效果。DeepSeekMoE 2B的性能接近MoE模型的理论...

吞吐量提升近30倍!田渊栋团队最新论文解决大模型部署难题

田渊栋团队最近成功解决了大型语言模型在实际部署中的内存和输入长度限制问题,将推理系统的吞吐量提高了近30倍。大型语言模型在现实中部署时通常会面临昂贵...

万字Gemini技术报告来啦 | Gemini这么强,GPT-4输的有点多,多模态超过人类专家

Gemini是一种新的多模态模型家族,适用于从复杂的推理任务到设备上内存受限的使用场景。在广泛的基准测试上的评估表明,最强大的Gemini Ultra模型在30个这些...

大模型免微调解锁对话能力,RLHF没必要了!一作上交大校友:节省大量成本和时间

艾伦研究所的新研究指出,对于大模型AI助手的微调,传统的SFT+RLHF两步走并非必要。研究发现,预训练完成的基础模型已经掌握了遵循指令的能力,只需提示工程...

Google DeepMind|强化学习中的概率推断

本文提出了一种基于贝叶斯处理的强化学习方法VAPOR,通过计算状态-动作对在最优策略下的后验概率来生成有效的探索策略。VAPOR方法具有与其他算法的强连接,并...
1 2 3 21