首页    |     本刊简介    |     征稿简则    |     征订启事    |     联系我们    |
天津科技大学学报欢迎您投稿!
 
   采编平台 /// 
 
    • 作者投稿  
    • 专家审稿  
    • 编辑办公  
 
   
 
   期刊论文 /// 
 
    • 全文浏览  
    • 论文检索  
    • 浏览排行  
 
   
 
   下载中心 /// 
 
    • 论文模板
    • 在研证明模板
    • 平台使用说明
 
   
 
 您现在的位置: 首页» 学报论文» 2020-6»  

基于ResNet-LSTM 的具有注意力机制的办公人员行为视频识别

张传雷,武大硕,向启怀,陈 佳,刘丽欣

摘 要:针对人体行为视频分析中时间域和空间域上特征提取存在的易混乱以及运算成本高的问题,提出了ResNet-LSTM-Attention 网络模型结构.该网络结构将空间域和时间域的特征分开提取,对于空间维度,将单帧图像输入残差网络(ResNet)模型,提取空间维度特征;对于时间维度,将多帧叠加后的空间维度特征作为输入,输入循环神经网络(LSTM)和注意力(Attention)机制的融合模型;最后将融合模型的输出经过softmax 作为识别结果.将本网络模型应用到实验室采集的办公人员行为数据集上进行人体行为识别实验,并与视频分析中常用的C3D 网络模型和无注意力机制的ResNet-LSTM 模型进行了对比.实验结果表明,本文模型不仅有较高的识别准确率,而且训练用时和运算成本也大大降低.




论文下载:
  • 13.pdf
  •   浏览次数:
     
     

    版权所有:《天津科技大学学报》编辑部

    网站设计与维护:天津科技大学信息化建设与管理办公室

    津科备27-1号