标签:创新

面壁智能给大模型接入16000+真实API,效果直逼ChatGPT!

开源语言模型更好地使用各种工具,增强其复杂场景下推理能力,TsinghuaNLP、耶鲁、人大、腾讯、知乎的研究人员推出了ToolLLM工具学习框架,加入OpenBMB大模型...

强化学习图鉴|你与最优策略之间,可能还差一本离线强化学习秘籍

离线强化学习是利用预先收集的大规模静态数据集来训练强化学习智能体的关键,探讨了离线强化学习的训练过程以及其和类似概念的异同。同时本文也解释了经典强...