NetGPT：用于网络流量的生成预训练Transformer模型

智源社区3年前 (2023)发布智源社区

2,256 0 0

NetGPT： Generative Pretrained Transformer for Network Traffic

解决问题：本文旨在解决网络流量预训练模型的问题，以提高下游任务（如流量分类、攻击检测、资源调度、协议分析和流量生成）的训练效率和有效性。此外，本文还尝试解决网络流量的异构性和多样性问题，以及下游网络任务的不同依赖关系问题。

关键思路：本文提出了一种多模式网络流量建模方法，以构建统一的文本输入，支持流量理解和生成任务。通过打乱报头字段、分段流中的数据包和引入各种任务标签，进一步优化了预训练模型对多样化任务的适应效果。相比于当前领域的研究，本文的关键思路在于提出了网络流量预训练模型的概念，并且针对网络流量的多样性和下游任务的不同依赖关系提出了相应的解决方法。

其他亮点：本文的实验结果表明，NetGPT在多种流量理解和生成任务中都具有很高的效果，并且比当前最先进的基准模型表现更好。此外，本文还提供了数据集和代码，方便其他研究者进行复现和进一步研究。值得深入研究的工作包括如何进一步优化预训练模型的适应能力和泛化能力，以及如何将预训练模型与具体的下游任务结合起来，实现更好的性能。

关于作者：

Xuying Meng, Chungang Lin, Yequan Wang, Yujun Zhang

中国科学院计算技术研究所、北京智源人工智能研究院

论文摘要：本文介绍了一种用于网络流量的预训练模型NetGPT，该模型可以利用大规模原始数据学习网络流量的基本特征，生成可区分的结果，而不考虑特定的下游任务。有效的预训练模型可以显著优化下游任务的训练效率和效果，例如流量分类、攻击检测、资源调度、协议分析和流量生成。尽管预训练在自然语言处理中取得了巨大成功，但在网络领域中没有相关研究。考虑到网络流量和网络任务的多样化需求和特征，构建网络流量的预训练模型并面临各种挑战，尤其是多模式网络流量中的异构标题和有效载荷以及不同下游网络任务的不同依赖关系。

NetGPT：用于网络流量的生成预训练Transformer模型

为了解决这些挑战，本文首次尝试提供一种用于流量理解和生成任务的生成式预训练模型。我们提出了多模式网络流量建模，构建统一的文本输入，支持流量理解和生成任务。我们进一步通过混洗标题字段、分段流中的数据包以及将各种任务标签与提示结合起来，优化预训练模型对多样化任务的适应效果。昂贵的实验表明了我们的NetGPT在各种流量理解和生成任务中的有效性，并且大幅优于现有的基线模型。

NetGPT：用于网络流量的生成预训练Transformer模型