基于改进的YOLOv3 实现手势识别的人机交互方法
摘 要:随着人工智能技术的飞速发展,人机交互方法也发生了巨大的变化.鉴于目前主要的人机交互方式仍是使用键盘、鼠标和触控板组合的传统交互方式,本文提出一种基于改进的YOLOv3 实现手势识别的人机交互方法,通过Kmeans对标签的边界框进行聚类,然后运用Mosaic 数据增强丰富小目标,最后采用自定义最小化边界框中心点距离的GCDIoU 损失函数优化模型参数.在自建数据集上进行实验验证,该模型针对手势小目标的检测准确率达到98.87%,召回率达到99.98%.结果表明,Mosaic 数据增强应用于小目标检测具有很好的效果,而GCDIoU 损失函数则加快了模型的收敛.
论文下载: