标签:大模型
NetGPT:用于网络流量的生成预训练Transformer模型
本文旨在解决网络流量预训练模型的问题。以提高下游任务(如流量分类、攻击检测、资源调度、协议分析和流量生成)的训练效率和有效性,进一步优化了预训练模...
吴恩达:大模型的机遇与陷阱【好文译递】第 7 期
▾ 栏目简介 如果说之前推出的【论文速读】是领读严谨的大模型实证研究论文,那么【好文译递】则想传递观点性、发散性的议论文章,只是静静地完整呈现译文,...
大模型工具学习权威综述,BMTools 背后的论文!
近期,来自清华大学、中国人民大学、北京邮电大学、UIUC、NYU、CMU等高校的研究人员联合 OpenBMB开源社区、知乎、面壁智能公司探索了基础模型调用外部工具的...
FlagAI飞智:AI基础模型开源项目,支持一键调用OPT等模型
GPT-3、OPT系列、悟道等预训练模型在NLP领域取得了非常瞩目的效果,为了快速加载、训练、推理不同大模型,使用最新最快的模型并行技术以及提高用户训练和使用...
OpenAI &吴恩达|开发人员ChatGPT提示工程限时免费入门课
开发人员的ChatGPT提示工程对初学者友好。但它也适用于希望接近快速工程的前沿并使用LLM的高级机器学习工程师,旨在帮助开发人员有效利用LLM。反映了对使用最...
AudioGPT:理解和生成语音、音乐、声音和说话人头像
以处理复杂的音频信息和支持口头对话:在多轮对话中展现出强大的音频理解和生成能力。这篇论文的目标是解决当前大型语言模型(LLMs)无法处理复杂音频信息或...
复旦大学 MOSS 大模型今日开源:超 100 万条对话训练数据
成为国内首个插件增强的开源对话语言模型。打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径,基座模型在约110万多轮对话数据上微调得到:基...
CMU & Meta|逼真生成式3D人脸模型研究
提出一种3D可控生成人脸模型的方法。结合了2D人脸生成模型和语义人脸处理,能编辑具有细节的3D渲染人脸,Meta],2D人脸模型难以准确分离面部属性:限制了其编辑...
实用指南|ChatGPT及其他大语言模型实用综述,Yann LeCun转发
旨在帮助他们在下游自然语言处理(NLP)任务中使用大语言模型(LLM),本文从模型、数据和下游任务的角度提供了关于LLM使用的讨论和见解,从而使这些模型在各种NL...
Stability AI发布Vicuna,第一个开源RLHF聊天机器人
为聊天调整语言模型所创造的用户体验一直是一个热门话题:这些聊天模型的成功得益于两种训练范式,虽然在建立帮助训练这类模型的开源框架方面做出了巨大的努...