机器学习 | 第 25 页

Yann LeCun新论文：构建自动智能体之路

Yann LeCun发布了他的最新论文：这篇论文提炼了我过去5年或10年对人工智能前景前景的大部分思考。这基本上是我计划做的事情，机器如何学会推理和计划？机器如...

强化学习

3年前 (2023)

通过强化学习出现类似信念的表征

动物必须学会预测未来的奖励或价值。动物被认为使用强化学习来学习奖励预测，真实环境中动物还必须学会仅使用不完整的状态信息来估计价值，动物通过首先形成...

强化学习

3年前 (2023)

《因果科学周刊》第4期：因果赋能推荐系统

为了帮助大家更好地了解因果科学的最新科研进展和资讯，推送近期因果科学值得关注的论文和资讯信息。同时我们也将向大家介绍社区正在推进的活动——因果科学与C...

智源社区

3年前 (2023)

《强化学习周刊》第51期：PAC、ILQL、RRL&无模型强化学习集成于微电网络格控制：综述与启示

本期周刊整理了强化学习领域相关的最新论文推荐及研究综述，可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;

图神经网络

3年前 (2023)

GNN与RL如何结合？KSU大学最新《基于图神经网络的强化学习》综述，阐述RL+GNN算法与应用

图神经网络和强化学习都是机器学习中研究的主流模型，最近来自美国堪萨斯州立大学发布了《基于图神经网络的强化学习》综述，阐述相关算法与应用。深度强化学...

图神经网络

3年前 (2023)

智源LIVE第40期丨ICLR 2023杰出论文奖一作张博航：从图双连通性的角度重新思考图神经网络的表达能力

他曾获得ICLR 2023的论文获得杰出论文奖 (Outstanding Paper Award)，目前在北京智源人工智能研究院实习。

图神经网络

3年前 (2023)

《强化学习周刊》第52期：Depth-CUPRL、DistSPECTRL & Double Deep Q-Network

本期周刊整理了强化学习领域相关的最新论文推荐及研究综述，可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;以后智源社区会自动...

智源社区

3年前 (2023)

爱可可AI前沿推介(7.5)

以前所未有的规模实现Transformer模型的高效推断、基于扩散模型的语义图像合成、面向导航的视觉预训练、Epinet对分布漂移的鲁棒性、对记忆训练样本遗忘情况的...

智源社区

3年前 (2023)

Meta AI 开源1750亿参数大模型- OPT，FlagAI一键调用！

OPT系列模型包括了多组不同参数规模的模型权重：FlagAI对OPT不同版本的模型进行了兼容，并给出使用FlagAI快速加载OPT模型示例代码！OPT与GPT系列模型均采用了...

智源社区

3年前 (2023)

爱可可AI前沿推介(7.6)

神经网络分布漂移性能预测、语言模型的理由增强集成、具有无分布可靠性保证的推荐系统、延时摄影序列随机与循环效应的解缠、基于隐式差分的迭代细化算法训练...

智源社区

3年前 (2023)

标签：机器学习

Yann LeCun新论文：构建自动智能体之路

通过强化学习出现类似信念的表征

《因果科学周刊》第4期：因果赋能推荐系统

《强化学习周刊》第51期：PAC、ILQL、RRL&无模型强化学习集成于微电网络格控制：综述与启示

GNN与RL如何结合？KSU大学最新《基于图神经网络的强化学习》综述，阐述RL+GNN算法与应用

智源LIVE第40期丨ICLR 2023杰出论文奖一作张博航：从图双连通性的角度重新思考图神经网络的表达能力

《强化学习周刊》第52期：Depth-CUPRL、DistSPECTRL & Double Deep Q-Network

爱可可AI前沿推介(7.5)

Meta AI 开源1750亿参数大模型- OPT，FlagAI一键调用！

爱可可AI前沿推介(7.6)

站点公告

最新文章

随机网址

热门标签