Loading...

突发!奥特曼被解雇,OpenAI董事会内讧

OpenAI突发公告,宣布领导层换届。由于高层内讧,Sam Altman被董事会解雇,不再担任CEO。董事会认为他在与董事会的沟通中始终不坦诚,阻碍了董事会履行职责的...

使用 PPO 算法进行 RLHF 的 N 步实现细节

本文介绍了 RLHF/ChatGPT 的研究现状,并尝试复现了 OpenAI 在 2019 年开源的原始 RLHF 代码库。虽然该代码库具有 “tensorflow-1.x” 的特性,但它的评估和基...

一些RLHF的平替汇总

RLHF是一种玄学的学习方法,效果因系统链路太长自由度太高而难以控制,但由于自由度高、以目标为导向的学习范式和标注成本低等优点,业内认为其效果潜力大。O...

耶鲁、交大提出“专家会诊”多智能体框架, 使用ChatGPT解决临床推理问题

研究者提出了一个名为多学科协作(Multi-disciplinary Collaboration, MC)的临床领域框架,旨在揭示医学智能模型的内在临床知识并提升其推理能力。LLMs在医疗...

OpenAI神秘Q*项目解密!诞生30+年「Q学习」算法引全球网友终极猜想

OpenAI最新项目Q*(Q-Star)已经展现出人工通用智能的雏形,引起了广泛关注。许多人开始研究“Q学习”(Q-learning),这是一种来自1992年的技术,突然成为了热...

Google DeepMind|强化学习中的概率推断

本文提出了一种基于贝叶斯处理的强化学习方法VAPOR,通过计算状态-动作对在最优策略下的后验概率来生成有效的探索策略。VAPOR方法具有与其他算法的强连接,并...

重磅!Sam Altman重回OpenAI,董事会洗牌

OpenAI宣布,Sam Altman重新担任CEO,联合创始人兼总裁Greg Brockman也将回归,组建新初始董事会由Bret Taylor、Larry Summers和Adam D'Angelo组成。

OpenAI 505员工联名逼宫请奥特曼回归,Ilya痛悔赶走CEO!威胁董事会立即解散,否则集体跳槽微软

OpenAI公司的宫斗事件仍在继续,公司首席科学家兼董事会成员Ilya发文呼唤Altman回归,参与了联名信。这场事件已经持续了三天,当地时间凌晨似乎已经落幕,但...

160w+ 未标注图像、3 个维度全方位评估,周玉坤等人开发 RETFound 模型,用视网膜图像预测多种系统性疾病

为现代医疗技术的一部分,人工智能和机器人技术正在改变医疗保健的方式。医生们现在可以使用AI来帮助诊断和治疗疾病,机器人手臂可以进行微创手术,3D打印技...

人类对「AI灭绝论」的担忧,这一方法能解决吗?|深度长文

著名AI学者吴恩达表示,他最担心的是AI风险被夸大并导致开源和创新受到限制,某些人传播人工智能灭绝人类的恐惧只是为了牟利。这一争论正变得愈发激烈。
1 2 3 4 5 120