基于十字形窗口的生成对抗网络模型
摘 要:由于传统的生成对抗网络(generative adversarial network,GAN)都是以卷积神经网络(convolutional neural networks,CNN)作为基本框架,CNN 无法处理远程依赖关系,因此会导致图片特征分辨率低和精细细节损失的问题。 CSWin Transformer 中的十字形窗口自注意力机制可以有效捕获图像组件之间的远程依赖关系,本文提出一种基于CSWin Transformer 的生成对抗网络模型 CTGAN(CSWin Transformer GAN),模型在 CIFAR-10 数据集和更高分辨率的 CelebA 数据集上进行测试,模型表现出了较好的生成效果,可以生成保真度高且细节丰富的图片。
论文下载: