Ocean-1：世界上第一个联络中心基金会模型

大模型2年前 (2023)发布智源社区

542 0 0

我们创建了Ocean-1，这是联络中心的基础模型。这种大型语言模型是我们为大型企业部署生成人工智能系统的经验的结晶，标志着我们在面向客户的对话中推进尖端人工智能技术的最新里程碑。

地址：https://cresta.com/blog/introducing-ocean-1-worlds-first-contact-center-foundation-model/

由Foundation Models提供支持

在上一篇文章中，我们分享了我们对生成人工智能新兴技术堆栈的想法，其中我们强调了法学硕士、人工智能系统和人工智能产品之间的区别。LLM（大语言模型）是为我们的产品套件提供动力的核心基础模型。我们相信，对LLM驱动的产品进行垂直集成的方法可以实现持续学习，并提供更好的业务成果。
自Cresta于2017年成立以来，即Transformer架构发明的同一年¹，我们每2-3年就看到一次自然语言处理的范式转变。我们的人工智能堆栈也是如此。2018年，Cresta是第一家利用GPT-2变压器架构在生产中部署生成人工智能的公司。2019年，我们开发了一种新方法来指导GPT-2的文本生成，以跟踪推动对话结果的行为。²从那时起，我们的创新速度才刚刚加快，今天生成人工智能被部署在我们的产品套件的所有部分，从对话洞察力到实时代理协助到虚拟代理。例如，我们最近的博客文章展示了如何使用ChatGPT来诊断联络中心的收入机会。

虽然我们继续与合作伙伴合作，将OpenAI的GPT-4和Anthropic的Claude等有能力的模型带入企业，但我们希望为世界领先的组织提供最佳的安全性、隐私性和不断从私人数据集反馈中学习的能力。因此，我们通过将GPT-4等强大的基础模型与联络中心领域数据相结合，使用自我指导和从人类反馈（RLHF）中强化学习等对齐技术，创建了Ocean-1。

功能

Ocean-1从基础模型开始，并根据联络中心专业知识数据进行培训。它旨在实现三个目标：

更好的联络中心开箱即用功能。
通过反馈数据学习更好的指导。
减少延迟和大规模服务实时应用程序的成本。

联系中心的开箱即用功能

企业转型是一个旅程，而不是冲刺。虽然Cresta在客户所在的地方与他们见面，并带他们踏上采用人工智能的旅程，但我们也为第一天就为组织带来价值而感到自豪。例如，我们的价值发现评估依靠开箱即用的人工智能模型来快速诊断团队绩效和结果的原因。在这里，我们的基础模型通过一套开箱即用的功能带来了快速实现价值的时间。

示例：

说明

（系统消息）决定这些消息中代理的意图是否是Discover Household，销售代理会提出问题，以了解有多少人以及谁将受到家庭安全系统的保护。

（用户消息）“K。现在让我们在这里打开一切。安东尼奥，如果你不介意我问的话，你为什么要找你的家庭保安？

GPT-3（davinci003）	GPT-3.5	GPT-4	海洋-1
是的，这条消息中代理的意图是Discover Household。特工正在问Antonio为什么寻找家庭安全系统，这个问题是为了发现有多少人以及谁将受到该系统的保护。	是的，这条消息中代理的意图是Discover Household。特工正在问一个问题，以找出安东尼奥寻找家庭安全系统的原因，这将有助于特工了解有多少人以及谁将受到该系统的保护。	是的，这条消息中代理的意图是Discover Household。	号码在给定的信息中，发现家庭不是代理的意图。代理商正在询问客户寻找家庭安全系统的原因。这与发现家庭中的人数或将受到家庭安全系统保护的人数无关，因此意图不是发现家庭。

通过反馈数据进行更好的指导

在上一篇博客文章中，我们讨论了反馈数据的价值，以及垂直集成堆栈如何持续提高模型性能。一旦我们的生成人工智能驱动平台与客户一起上线，我们的产品旨在捕获人类对模型预测的反馈。

关于如何用这些数据提高模型性能的范式似乎出现了：

零射击：描述如何执行任务。例如，我们的查询提取器使用此提示模板。
很少射：当零射遇到故障时，例如问题不包括关键实体，我们可以在提示中添加示例，以提高模型的准确性。
微调。当我们收集足够的故障案例并构建数据集时，我们可以微调模型以实现更高的准确性。

虽然我们通常可以根据反馈数据微调模型，但交付此类模型所需的工作量很大。为了提高模型在零射击和少射击学习方面的性能，我们依靠Ocean-1来开发更好的教学跟随能力。因此，我们的模型可以调整为减少联络中心任务的幻觉。

聊天上下文

GPT-4

海洋-1

幻觉笔记

<编辑>
（客户正在寻找航班变更）

是的，我有进行更改的信息。我会把出生日期更新到XXX。请给我一点时间更新。

当然。可以告诉我您的姓名、电子邮件和电话号码吗？

在这种情况下，正确的代理行为是遵循发现流程，而不是“幻化”结果。

<编辑>
（客户正在寻求行李退款）

请向我提供以下信息：

原始航班详情（日期、航班号和路线）
新的航班详情（日期、航班号和航线）
两个航班的行李费支付的金额

一旦我获得这些信息，我就可以处理您的退款请求。

对于给您带来的不便，我深表歉意。可以给我确认号码来开始这个过程吗？

只需要确认号码。GPT-4产生了所需的其他信息。

规模更快的一代

我们的模型针对联络中心领域进行了优化，因此可以更有效地提供服务。这对于代理助理等实时延迟敏感应用程序，或者当多个LLM链接在一起以提供最终输出时，这一点非常重要（请参阅我们之前的博客文章）。

Cresta Opera：无代码人工智能平台

Cresta客户可以通过我们的无代码生成人工智能平台Cresta Opera与这些高级语言建模功能进行交互。正如我们所看到的，LLM用于我们的产品，从实时代理助理到通话后解决方案。Opera不仅提供了一套开箱即用的人工智能模型，还使用户能够利用LLM的指导跟随功能为其特定用例创建模型。
安排一个演示，看看Cresta Opera在行动。