标签:大模型

RLHF何以成LLM训练关键?AI大牛盘点五款平替方案,详解Llama 2反馈机制升级

AI领域对RLHF技术的使用逐渐过时,但新的技术路线尚不明朗:是采用无需人工反馈的方法,还是继续改进RLHF机制。RLHF技术提升了语言模型的性能,注入了人类社...

Transformer+强化学习|谷歌DeepMind让大模型成为机器人感知世界的大脑

Google DeepMind提出了Q-Transformer,旨在将基于多样化真实世界数据集的大规模机器人学习与基于强大Transformer的现代策略架构结合起来。他们使用离线强化学...

陶哲轩新论文秘密武器曝光:用AI写LaTeX巨丝滑

数学大神陶哲轩表示,他的写论文工具终于升级了,之前他使用的是TeXnicCenter+MiKTeX,现在根据读者建议,他使用了AI工具,这让他感到自己几十年工作流被颠覆...

WOA-HKELM分类预测 | Matlab 鲸鱼算法(WOA)优化混合核极限学习机(HKELM)分类预测

该文章是一位热爱科研的Matlab仿真开发者的个人介绍,他的个人主页是Matlab科研工作室,信条是格物致知。他的专业领域包括智能优化算法、神经网络预测、雷达...

时间序列预测 | Matlab 哈里斯鹰优化双向长短期记忆网络(HHO-BILSTM)的时间序列预测(时序)

该文章介绍了作者热爱科研的背景,并提供了个人主页以及Matlab项目合作方式。文章总结了作者的技术领域,包括智能优化算法、神经网络预测、雷达通信、无线传...

「新智元大模型」上岗!0代码搞定,只需四步精调,写文超6

腾讯云的大模型平台让编辑部拥有了一位非常高效的新员工,能够快速完成文章和标题的写作。这位新同事的背后是大模型平台的精细调整,使得使用门槛降低。大模...

朴素贝叶斯算法多元分类预测 | Matlab 基于朴素贝叶斯算法(bayesian)的数据分类预测

该文章介绍了作者的个人主页“Matlab科研工作室”,作者是一名热爱科研的Matlab仿真开发者,擅长智能优化算法、神经网络预测、雷达通信、无线传感器、电力系统...

英伟达DLSS 3.5发布|全新AI「光线重建」实现超逼真光影,新老显卡都支持

英伟达将在今年秋季推出DLSS 3.5,采用光线重建技术,可为密集型光追游戏和应用程序创建更高质量的光追图像。DLSS 3.5的光线重建技术不依赖硬件,老的RTX系列...

3000多条数据里选出200条效果反而更好,MiniGPT-4被配置相同的模型超越

上海交通大学和里海大学的联合研究团队使用了一个数据选择器,从原本的3000多个数据中选出了200个高质量的数据,训练得到了InstructionGPT-4模型。该模型表现...

【GRU回归预测】基于门控循环单元GRU实现数据多维输入单输出预测附matlab代码

该文章介绍了作者的个人主页和信条,以及他的Matlab仿真开发领域,包括智能优化算法、神经网络预测、雷达通信、无线传感器、电力系统信号处理、图像处理、路...
1 2 3 4 5 6 21