大模型自学使用工具（Toolformer）｜OpenBMB论文速读第 7 期

智源社区3年前 (2023)发布智源社区

1,018 0 0

【论文速读】是OpenBMB发起的大模型论文学习栏目，用 高效的思维导图 形式，带领大家在 10min 内快速掌握一篇 前沿经典 论文。我们邀请来自清华大学自然语言处理实验室以及各大高校、科研机构的 学术达人 作为主讲人分享 大模型领域 的论文。

本期论文速读带大家了解如何驱动语言模型去使用简单的模型来调用外部的工具——Toolformer: Language Models Can Teach Themselves to Use Tools，由清华大学计算机系博士研究生丁宁进行领读。

B站视频地址：

https://www.bilibili.com/video/BV18s4y1u7nJ/?spm_id_from=333.999.0.0&vd_source=cd29f4e20ef69babd26f4f34cc7c8b3f

01 作者信息

Timo Schick (Meta)

其他代表工作（Prompt-learning的先驱性工作）

It’s Not Just Size That Matters: Small Language Models Are Also Few-Shot Learners.
Exploiting Cloze Questions for Few-Shot Text Classification and Natural Language Inference.

Jane Dwivedi-Yu (Meta)

02 论文简介

关键词 KeyWords

Large-scale PLMs

Tool Learning

摘要概览 Abstract

驱动语言模型去使用简单的模型来调用外部的工具
Toolformer 通过语言模型的方法去决定去调用哪些 API，传入哪些参数
Tooformer 是在自监督层面执行的，只需要对每个 API 的语言描述

03 研究设计

Toolformer调用示例：

关键要素

模型应该自行地去决定在何时间，用何方法来调用工具
模型对工具的使用应该是自监督的，这样可以省去很大的标注开销

‍

‍

研究方法

方法概要‍

受到in-context learning的启发，给定少量的人写的关于API的描述，让模型去自行生成潜在API调用的语言建模数据
构建一个自监督的Loss函数，让模型来决定哪些API的调用有助于它的语言建模的预测

‍

大模型自学使用工具（Toolformer）｜OpenBMB论文速读第 7 期

具体步骤

给定一个纯文本数据集，构建出一个带有API调用的数据集，然后在此数据集上做微调
第一步：使用in-context learning来生成大量的潜在可能的API调用
第二步：执行这些API，返回得到结果
第三步：检查返回的结果是否有助于语言模型的预测，过滤掉其他的API

04 实验结果

模型：GPT-J （67亿参数）

原始数据：CCNet

结果：Toolformer 在知识探测任务 LAMA 中可以大幅超过之前的方法，甚至是 GPT-3 等大模型，但对于问答任务则无法超越 GPT-3。模型的参数量到一定规模后才拥有使用工具的能力。

模型规模的影响

05 论文贡献

优点

将语言模型使用外部工具的进行很自然的结合
不需要标注大量数据，使用自监督的方法进行学习

缺点

工具无法交互，也无法链式使用（每个API调用都是独立的）
定义的工具尚且有限，扩展工具则需要用模型标注新的数据
随着基础模型zero-shot能力的增强，这种需要构建数据并且fine-tune的做法可能会比较麻烦

▾ 传送门论文链接

? https://arxiv.org/abs/2302.04761

▾ 公众号回复「论文速读」

即可获得高清完整版思维导图

我们为读者准备了一份高清思维导图，包括了论文中的重点亮点以及直观的示意图。点击下方名片 关注 OpenBMB ，后台发送“论文速读” ，即可领取论文学习高清思维导图和 FreeMind ！

本期论文速读视频版已发布于 OpenBMB 视频号 和 B站（视频讲解比文字阅读更加详细易懂），欢迎大家评论和分享~

以上是本期论文速读的全部内容，后续 OpenBMB 会围绕大模型介绍更多前沿论文，欢迎大家持续关注！?

➤ 加社群/ 提建议/ 有疑问

请找 OpenBMB 万能小助手：

大模型自学使用工具（Toolformer）｜OpenBMB论文速读第 7 期

官方网站

https://www.openbmb.org

GitHub

https://github.com/OpenBMB

https://github.com/thunlp

技术文章

多智能体开源平台 AgentVerse | Tool learning 权威综述

Delta Tuning 登陆 Nature子刊 | 大模型工具学习引擎 BMTools

CPM-Ant 训练完成 | BMInf 适配GLM-130B

高效训练工具 BMTrain | BMTrain 技术原理

CPM-Live 邀请函 | CPM-Live 训练启动

OpenBMB 社区介绍 | 大模型课程

大模型榜单 BMList

长期开放招聘｜含实习

开发岗 | 算法岗 | 产品岗

交流QQ群

735930538

欢迎转载

商务合作请联系

openbmb@gmail.com

?期待您的关注与加入?

# 智源社区 # 自然语言处理 # 大模型 # 机器学习 # 自然语言处理 # 论文 # 资讯

文章版权归作者所有，未经允许请勿转载。

代码大模型综述：中科院和MSRA调研27个LLMs，并给出5个有趣挑战

智源社区

2,539

马里兰大学等｜指令微调的可利用性研究

智源社区

908

Sam Altman预言2030年前出现AGI，GPT-10智慧将超越全人类总和！

智源社区

811

斯坦福??????-?-??????，迭代生成草图

智源社区

874

Nat. Mach. Intel. | 一种用于分子相互作用和分子性质预测自动图学习方法

智源社区

1,020

GPT Daily | 04.16

GPTDaily

1,330

暂无评论

暂无评论...

大模型自学使用工具（Toolformer）｜OpenBMB论文速读第 7 期

评估大型视觉语言模型中的物体幻觉

悟透Transformer--AI是如何学习扑克牌排序的（一）

相关文章

暂无评论

相关文章

热门标签

热门网址