Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

强化学习2年前 (2023)发布智源社区

622 0 0

Hi朋友们，第3期Insight Time前沿技术交流分享会马上又要和大家见面了！

本期邀请的嘉宾是来自悉尼大学的在读博士生Yae同学，其研究方向为计算机视觉和强化学习，目前专注于离线强化学习及多智能体强化学习。

7月6日（周三）20:00-20:30记得锁定OpenDILab B站直播间哦！

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

您将获得

了解决策AI大模型训练的基本原理
掌握大模型训练的监督、自监督学习技术应用于序列决策任务的创新思路
了解大型通用模型训练的更多应用性

本期Insight Time活动议程

2022年7月6日（周三）

20:00-20:30

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

分享嘉宾

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

分享主题

近年来，自然语言和计算机视觉的工作证明了模数据集上预训练大型的通用基础模型对于下游任务的有效性。然而对于序列决策任务，由于需要交互和大量无标签数据的特点，难以利用常用于的大模型训练的监督、自监督学习技术。

我们寻求通过利用可免费获得的互联网规模未标记视频数据集和简单的半监督模仿学习方法，将训练大型通用模型的范式扩展到序列决策领域。

往期回顾

错过的朋友们可以看下方第1期Insight Time分析会文字+视频实录哦！

第1期主题：

机器人技能模仿学习：高效示教下的机器人观测模仿学习方法

One more thing

我们在直播中专门设置了问答环节，您可以添加DI小助手微信，向小助手发送您想要和嘉宾交流的问题，我们会在直播中解答您的问题哦。

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

向小助手发送信息：Insight Time

小助手可拉您进入OpenDILab交流大群哦～

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

# 强化学习 # 智源社区 # 大模型 # 强化学习 # 数据集 # 视频 # 资讯

文章版权归作者所有，未经允许请勿转载。

GPT Daily 深度见解｜04.28（千模大战III）

GPTDaily

1,132

精确指出特定事件发生时间！字节&复旦大学多模态大模型解读视频太香了

智源社区

650

6大要点看国家网络安全新动向，《网络安全事件报告管理办法（征求意见稿）》发布

智源社区

719

吴恩达：大模型的机遇与陷阱【好文译递】第 7 期

智源社区

807

GPT Daily | 04.17(失业与再武装)

GPTDaily

1,365

CPM-Bee 开源满月｜已飞入数十家企业，欢迎更多商用申请

智源社区

754

暂无评论

暂无评论...

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

您将获得

本期Insight Time活动议程

分享嘉宾

分享主题

往期回顾

One more thing

《强化学习周刊》第52期：Depth-CUPRL、DistSPECTRL & Double Deep Q-Network

在使用函数逼近的高效在线强化学习中，普适覆盖条件的可证明益处

相关文章

暂无评论

相关文章

热门标签

热门网址