Loading...

图神经网络也能用作CV骨干模型,华为诺亚ViG架构媲美CNN、Transformer

华为诺亚实验室的研究员发现图神经网络(GNN)也能做视觉骨干网络。将图像表示为图结构,通过简洁高效的适配,提出一种新型视觉网络架构 ViG,表现优于传统的卷积网络和 Transformer。在 ImageNet 图像识别任务,ViG 在相似计算量情况下 Top-1 正确率达 82.1%,高于 ResNet 和 Swin Transformer。

图神经网络也能用作CV骨干模型,华为诺亚ViG架构媲美CNN、Transformer

论文链接:

https://arxiv.org/abs/2206.00272

PyTorch 代码:

https://github.com/huawei-noah/CV-Backbones

MindSpore 代码:

https://gitee.com/mindspore/models/tree/master/research/cv/ViG

图神经网络也能用作CV骨干模型,华为诺亚ViG架构媲美CNN、Transformer

视觉图神经网络 ViG 架构

© 版权声明

相关文章

暂无评论

暂无评论...