标签:大模型
符尧:我想为 MOSS 正名
是先前《拆解追溯 GPT-3.5 各项能力的起源》这篇文章的作者,是把模型训练得符合人类的期望:大部分已有的英文社区的开源模型并没有做中文 continue training...
华盛顿大学&谷歌|用更少数据和更小模型超越更大的语言模型
这篇论文旨在解决使用大型语言模型(LLMs)进行实际应用所面临的内存效率和计算效率问题,旨在通过利用更少的训练数据来训练比LLMs更小的模型。它在多任务训...
最新文章
Copyright © 2024 Ai导航 鄂ICP备2023001728号