标签:强化学习

「德睿智药」入选2023福布斯亚太区最值得关注企业100强

福布斯亚洲公布了2023年福布斯亚太区最值得关注企业100强名单,其中AI制药领域的MindRank成为中国大陆仅有的11家企业之一。该榜单聚焦于崛起中、未充分开发市...

Coggle 9月竞赛学习:时序回归预测

本文介绍了时序预测在能源消耗预测中的应用。对于能源供应商来说,准确预测客户未来的能源需求至关重要。本文将深入探讨时序预测的基本原理、方法以及其在能...

服务运营 | MS文章精读:基于强化学习和可穿戴设备的帕金森治疗方案

本文介绍了一种基于强化学习的帕金森药物治疗方案,通过患者的可穿戴传感器收集数据,是可穿戴治疗设备在慢性疾病管理中的应用研究的第一篇文章。该研究发表...

结束与开始:为什么 NLP 中间层一定会消亡?

本文摘要:Dan Klein在Simons Institute的LLM研讨会上发表演讲,解答了“中间层消亡史”并探讨了LLMs是否是NLP的开始或终结。通过宏观角度解释,文章得出结论。

直播预告 [周日上午10点]|哥大 彭天翼:当A/B实验平台遇上强化学习 「TechTalk 41」

本次『运筹OR帷幄』TechTalk NO. 41的主题是'A/B实验平台遇上强化学习',嘉宾为哥伦比亚大学商学院的彭天翼助教教授。本次分享将重点讲解A/B测试、实验干扰、...

蒸馏Alpha:因子的可交『弈』性

量化投资与机器学习是一家主流自媒体,专注于量化投资、对冲基金、Fintech、人工智能和大数据等领域。该公众号有30万+关注者,来自公募、私募、券商、期货、...

深度强化学习讲座第8期–离线强化学习主题

清华智能产业研究院助理研究员/助理教授詹仙园将于2023年8月21日举办深度强化学习讲座,主题为“Offline RL and Beyond: Towards Generalizable Data-Driven R...

Kaggle LLM Science 赛题高分思路

Kaggle举办了一个自然语言处理和大模型竞赛,名为LLM Science Exam,参赛者需要使用LLM回答一些困难的问题。随着大型语言模型能力范围的扩大,越来越多的研究...

Google DeepMind|强化自训练(ReST)语言建模

Reinforced Self-Training (ReST)是一种新算法,用于改进大规模语言模型的输出质量,使其更符合人类偏好,从而提高翻译质量并减少潜在的不安全内容。该算法使...

优化 | 带有未知评估成本和预算约束的多步贝叶斯优化

本文介绍了一种新的基于贝叶斯优化的方法,用于处理异质评估成本和带有约束的优化问题。该方法通过引入一个新的代价模型来对异质性进行建模,并使用一种基于...
1 2 3 4 5 6 8