标签:资源

通过奖励建模实现可扩展的智能体对齐

将强化学习算法应用于现实场景的障碍之一是缺乏合适的奖励函数,一定程度上是因为无法明确表述用户对任务目标的理解,从而能够以符合用户意图的方式解决复杂...

8个扩展子包!RecBole推出2.0!

易用又强大的推荐算法框架伯乐(RecBole)又双叒叕发布新版本啦!覆盖从数据到模型多个推荐系统最新的主题和方向!为推荐系统多个领域的研究提供易用又强大的工...

AI TIME丨回顾与展望神经网络的后门攻击与防御

宾夕法尼亚州州立大学电子工程系博士生向臻、清华大学博士生李一鸣、弗吉尼亚理工计算机工程博士生曾祎、普渡大学计算机科学博士生沈广宇。

KnowledgeGPT:从各种信息源中提取知识并使用GPT-3生成答案

用于从各种信息源中提取知识并使用OpenAI的GPT-3模型生成答案的工具。支持从互联网、本地数据、YouTube字幕和音频等各种信息源中提取文本。OpenAI的GPT-3模型...

大模型工具学习权威综述,BMTools 背后的论文!

近期,来自清华大学、中国人民大学、北京邮电大学、UIUC、NYU、CMU等高校的研究人员联合 OpenBMB开源社区、知乎、面壁智能公司探索了基础模型调用外部工具的...

OpenAI &吴恩达|开发人员ChatGPT提示工程限时免费入门课

开发人员的ChatGPT提示工程对初学者友好。但它也适用于希望接近快速工程的前沿并使用LLM的高级机器学习工程师,旨在帮助开发人员有效利用LLM。反映了对使用最...
1 2