强化学习

是机器学习的范式和方法论之一,是智能体与环境不断交互,从而不断强化自己的决策能力的过程

大模型如何实现与人类的价值观共舞?探索MOSS-RLHF模型背后的训练逻辑|《追AI的人》第29期直播回放

本生导师分享了《大模型有何安全伦理风险问题?看MOSS-RLHF如何实现人类与AI的价值观对齐》的主题,探讨了大模型的安全伦理风险问题以及实现人类与AI的价值观...

【AIIG观察第205期】布鲁金斯学会:美国需采取一个全面、分布式的人工智能监管方法

布鲁金斯学会的研究员Alex Engler发表评论文章《全面、分布式的人工智能监管方法》,指出美国需要采取一个全面、分布式的人工智能监管方法。该方法应该包括多...

​WWW 2023 | 药物组合推荐新方法—MoleRec

机器学习的预测模型在临床决策中具有巨大潜力,能够提高决策的准确性和安全性。这类模型通过分析大量的个人医疗数据,为医疗专家提供更准确的疾病诊断和治疗...

Transformer+强化学习|谷歌DeepMind让大模型成为机器人感知世界的大脑

Google DeepMind提出了Q-Transformer,旨在将基于多样化真实世界数据集的大规模机器人学习与基于强大Transformer的现代策略架构结合起来。他们使用离线强化学...

Nat. Mach. Intell. | 自博弈的强化学习指导蛋白质工程

深圳华大智造的杨梦团队提出了一种基于AlphaZero算法的机器学习指导的蛋白质定向进化(MLDE)方法,可以高效采样蛋白质序列空间、加快优化周期、减少实验投入...

上传聊天记录「克隆」自己,这家初创公司让《黑镜》第一集走进现实

《黑镜》第一集“马上回来”中描述了一款能够通过收集一个人生前信息模拟出他的对话功能的软件,女主角通过分析已故男友的社交媒体和短信内容成功克隆了他的人...

CVPR 2023 冠军方案,零样本异常分割新突破!(附论文及源码)

本文介绍了CVPR2023冠军解决方案,在零样本异常分割领域中,通过引入多模态提示来规范化现代基础模型,实现了在零样本情况下分割任何异常的目标,并在多个基...

AIGC在游戏行业中的应用和趋势

摘要:AIGC已经开始应用在游戏领域的各个环节,包括游戏前的美术设计、内容设计和测试,及游戏中的体验优化、运营优化,还有可以应用在游戏竞技领域。AI也被...

RLHF再也不需要人类了!谷歌团队研究证明,AI标注已达人类水平

谷歌最新研究提出,AI反馈强化学习(RLAIF)可以取代人类进行偏好标注,不用人类标注,AI标注偏好后,也能取得与RLHF一样的效果。论文地址:https://arxiv.or...

「德睿智药」入选2023福布斯亚太区最值得关注企业100强

福布斯亚洲公布了2023年福布斯亚太区最值得关注企业100强名单,其中AI制药领域的MindRank成为中国大陆仅有的11家企业之一。该榜单聚焦于崛起中、未充分开发市...
1 2 3 4 5 8