标签:机器学习

通过强化学习出现类似信念的表征

动物必须学会预测未来的奖励或价值。动物被认为使用强化学习来学习奖励预测,真实环境中动物还必须学会仅使用不完整的状态信息来估计价值,动物通过首先形成...

《因果科学周刊》第4期:因果赋能推荐系统

为了帮助大家更好地了解因果科学的最新科研进展和资讯,推送近期因果科学值得关注的论文和资讯信息。同时我们也将向大家介绍社区正在推进的活动——因果科学与C...

《强化学习周刊》第51期:PAC、ILQL、RRL&无模型强化学习集成于微电网络格控制:综述与启示

本期周刊整理了强化学习领域相关的最新论文推荐及研究综述,可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;

智源LIVE第40期丨ICLR 2023杰出论文奖一作张博航:从图双连通性的角度重新思考图神经网络的表达能力

他曾获得ICLR 2023的论文获得杰出论文奖 (Outstanding Paper Award),目前在北京智源人工智能研究院实习。

《强化学习周刊》第52期:Depth-CUPRL、DistSPECTRL & Double Deep Q-Network

本期周刊整理了强化学习领域相关的最新论文推荐及研究综述,可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;以后智源社区会自动...

爱可可AI前沿推介(7.5)

以前所未有的规模实现Transformer模型的高效推断、基于扩散模型的语义图像合成、面向导航的视觉预训练、Epinet对分布漂移的鲁棒性、对记忆训练样本遗忘情况的...

Meta AI 开源1750亿参数大模型- OPT,FlagAI一键调用!

OPT系列模型包括了多组不同参数规模的模型权重:FlagAI对OPT不同版本的模型进行了兼容,并给出使用FlagAI快速加载OPT模型示例代码!OPT与GPT系列模型均采用了...

爱可可AI前沿推介(7.6)

神经网络分布漂移性能预测、语言模型的理由增强集成、具有无分布可靠性保证的推荐系统、延时摄影序列随机与循环效应的解缠、基于隐式差分的迭代细化算法训练...

吴恩达:大模型的机遇与陷阱【好文译递】第 7 期

▾ 栏目简介 如果说之前推出的【论文速读】是领读严谨的大模型实证研究论文,那么【好文译递】则想传递观点性、发散性的议论文章,只是静静地完整呈现译文,...

大模型工具学习权威综述,BMTools 背后的论文!

近期,来自清华大学、中国人民大学、北京邮电大学、UIUC、NYU、CMU等高校的研究人员联合 OpenBMB开源社区、知乎、面壁智能公司探索了基础模型调用外部工具的...
1 23 24 25 26