标签:机器学习
OpenAI 深夜变天,Sam Altman 被踢出局,原 CTO 暂代临时 CEO
OpenAI宣布,经过审查程序后,Sam Altman离开公司,首席技术官Mira Murati暂代CEO职位。同时,GPT-4 Turbo和GPT-3.5-Turbo-1106模型正式上线Azure OpenAI服务。
使用 PPO 算法进行 RLHF 的 N 步实现细节
本文介绍了 RLHF/ChatGPT 的研究现状,并尝试复现了 OpenAI 在 2019 年开源的原始 RLHF 代码库。虽然该代码库具有 “tensorflow-1.x” 的特性,但它的评估和基...
一些RLHF的平替汇总
RLHF是一种玄学的学习方法,效果因系统链路太长自由度太高而难以控制,但由于自由度高、以目标为导向的学习范式和标注成本低等优点,业内认为其效果潜力大。O...
OpenAI神秘Q*项目解密!诞生30+年「Q学习」算法引全球网友终极猜想
OpenAI最新项目Q*(Q-Star)已经展现出人工通用智能的雏形,引起了广泛关注。许多人开始研究“Q学习”(Q-learning),这是一种来自1992年的技术,突然成为了热...
PPT 下载更新!|现代数据栈峰会
本文介绍了一本包含了腾讯、抖音、京东、知乎等一线互联网大厂的分享经验的电子书,涵盖指标体系、数据存储与架构、自然语言处理等方面的内容。如果网盘文件...
最新Claude 200K严重「虚标」?大神壕掷1016美元实测,90K后性能急剧下降
Anthropic公司发布了一个支持200K上下文长度的语言模型Claude 2.1。一位大神Greg Kamradt测试后发现,在上下文长度达到90K后,性能会出现明显下降。这个消息...
Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享
本文介绍了由中国图象图形学学会与360人工智能研究院举办的Open Vocabulary Detection Contest - 开放世界目标检测竞赛的部分优胜团队的技术方案。目标检测是...
Nat. Mach. Intell. 速递:复杂预测的拓扑结构
该论文介绍了一种使用拓扑数据分析和图学习的方法来理解复杂预测模型的拓扑结构。作者将这种方法应用于深度神经网络和图卷积网络,并发现了这些模型中的拓扑...
2024 IEEE Fellow名单公布,上百位华人学者入选!
美国电子电气工程师学会(IEEE)公布了新一届Fellow名单,其中100多位华人学者入选。IEEE Fellow是该学会最高等级会员,表彰在电气、电子工程、计算机科学、...
MSLTNet开源 | 4K分辨率+125FPS+8K的参数量,怎养才可以拒绝这样的模型呢?
)的速度下对高分辨率照片进行校正。该网络的性能与其他更复杂的方法相媲美,同时具有更快的速度和更少的参数数量。