一种基于注意力导向CNN 的晶粒缺陷检测方法
摘 要:针对半导体生产过程中的晶粒缺陷检测任务,提出了一种融入多头注意力机制的新型CNN 模型(Attn-Net).该模型使用深度可分离卷积和标准卷积累加的卷积结构提取输入图像特征,借助多头注意力机制更新特征权重,输出注意力机制筛选的图像分类结果.在13 513 张晶粒图像构成的数据集上训练、验证及测试,并与VGG-16、ResNet-50 和MobileNet-v2 进行对比.相较于现有经典CNN 网络模型,Attn-Net 检测用时更短(1.26 s),模型尺寸更小(25 MB),在测试集上的分类准确率超过99%,是一种高效且轻量化的晶粒缺陷检测和分类模型.
论文下载: