引导式的卷积神经网络视频行人动作分类改进方法

毛琳, 陈思宇, 杨大伟

毛琳, 陈思宇, 杨大伟. 引导式的卷积神经网络视频行人动作分类改进方法[J]. 武汉大学学报 ( 信息科学版), 2021, 46(8): 1241-1246. DOI: 10.13203/j.whugis20190101
引用本文: 毛琳, 陈思宇, 杨大伟. 引导式的卷积神经网络视频行人动作分类改进方法[J]. 武汉大学学报 ( 信息科学版), 2021, 46(8): 1241-1246. DOI: 10.13203/j.whugis20190101
MAO Lin, CHEN Siyu, YANG Dawei. A Guided Method for Improving the Video Human Action Classification in Convolutional Neural Networks[J]. Geomatics and Information Science of Wuhan University, 2021, 46(8): 1241-1246. DOI: 10.13203/j.whugis20190101
Citation: MAO Lin, CHEN Siyu, YANG Dawei. A Guided Method for Improving the Video Human Action Classification in Convolutional Neural Networks[J]. Geomatics and Information Science of Wuhan University, 2021, 46(8): 1241-1246. DOI: 10.13203/j.whugis20190101

引导式的卷积神经网络视频行人动作分类改进方法

基金项目: 

辽宁省自然科学基金 20170540192

辽宁省自然科学基金 20180550866

详细信息
    作者简介:

    毛琳,博士,副教授,主要从事多传感器信息融合、目标跟踪研究。maolin@dlnu.edu.cn

  • 中图分类号: P237

A Guided Method for Improving the Video Human Action Classification in Convolutional Neural Networks

Funds: 

The Natural Science Foundation of Liaoning Province 20170540192

The Natural Science Foundation of Liaoning Province 20180550866

More Information
    Author Bio:

    MAO Lin, PhD, associate professor, specializes in the multi-sensor information fusion and target tracking.maolin@dlnu.edu.cn

  • 摘要: 如何提升网络模型对时域信息的理解能力,是基于3D卷积神经网络视频行人动作分类方法需要解决的问题之一。提出一种主导层优化模块,在网络训练过程中,利用当前时域动态信息学习能力最强的卷积层作为主导层来引导网络权重参数的更新,使各卷积层对动态信息的学习能力逐渐增强,从而改进卷积神经网络模型对时域动态信息的理解能力。仿真结果显示,添加主导层优化模块后的ResNeXt-50网络与ResNeXt-101网络在UCF-101和HMDB-51数据库上的训练收敛速度都有所增加,测试结果的准确率均有不同程度提升。
    Abstract:
      Objectives  In order to improve the ability of convolutional neural networks (CNNs) of understanding temporal dynamic information, this paper proposes a dominant layer optimization module.
      Methods  The new module uses the dominant layer to guide and optimize the update gradient of convolutional layer weights, and assist the difference estimation with the maximum mean difference algorithm of a reproducing Hilbert space.
      Results  In continuous training, the network can improve the learning ability of temporal dynamic information, and the dynamic information similarity between the features learned by convolutional layer and the input data is also increased.
      Conclusions  This module enhances the performance of the CNNs model on video human action classification and achieves improvements to the network.
  • 中国现有各型水库9.8万余座(不含港、澳、台地区),总库容超过9 300亿m3[1]。大多数水库兴建于20世纪50~70年代,受限于当时的经济、技术条件以及数十年间工程老化等问题的影响,水库病险情况曾普遍存在,最多时有3万余座水库处于病险状态。病险水库除险加固任务具有艰巨性、复杂性和长期性的特点,根据专项规划和治理,全国范围内将逐步消除病险水库。

    形变监测是水库大坝安全评价的基础和重要组成。现阶段水库形变监测多是在重点部位布设分散、不连续的单个监测点,利用全站仪、全球导航卫星系统等测量手段按以点代面、以局部代替整体的方法采集离散点形变信息进行数据处理,这种方式难免会遗漏一些重大的安全隐患。遥感技术的飞速发展为水利工作者提供了新型工具和技术手段。星载合成孔径雷达干涉测量(interferometric synthetic aperture radar, InSAR)作为近年来迅速发展的空间大地测量新技术,能够全天时、全天候、大面积同步获取地形信息及地表形变信息,与传统测量手段相比,有效缩短了观测周期,扩大了空间范围,提高了监测精度[2-4]

    国内外已有学者利用InSAR技术进行水利工程形变监测的探索。廖明生等[5]基于永久散射体(persistent scatterer, PS)干涉测量的时序InSAR技术对三峡大坝和三峡库区滑坡体进行了稳定性监测,详尽分析了三峡大坝坝体在建设过程中及工程完工后蓄水期的变形,其监测结果与实际情况相吻合。Voege等[6]利用升降轨数据对挪威斯瓦特湖坝开展了基于小基线集技术的形变监测,结果显示,时序InSAR可以探测到坝体的局部变形情况。裴媛媛等[7]利用时序合成孔径雷达(synthetic aperture radar, SAR)影像提取了上海长江口南岸和杭州湾北侧堤坝的沉降速率。Milillo等[8]利用多时相InSAR技术对伊拉克摩苏尔大坝的持续失稳情况进行了调查,指出2004—2010年间大坝变形速率较大,2012—2014年间失稳情况得到控制,但自2014年8月大坝停止注浆作业后,形变再次加速。现有研究多集中于对超大型水利设施、枢纽工程的监测,将星载时序InSAR作为地面常规监测手段的补充,而对其他大中型水库大坝缺乏关注。从方法上而言,大多数研究是将时序InSAR方法直接应用于水库库区形变监测,并未考虑环境的复杂性和独特性,一定程度上限制了其发展和应用。本文综合考虑水库大坝特殊的环境特征和自身特点,研究适合实际需求的时序InSAR分析方法,并以山东省广南水库为研究区开展实验研究,证实了方法的有效性。

    相比于城市地面沉降监测等应用领域,水库特殊的环境特征给时序InSAR数据处理造成了一定困难,主要表现在:(1)水利工程施工、运营周期长,且库区地表多生长茂密植被,面临因时空失相干严重而导致SAR影像无法精确配准的问题;(2)水库研究区常伴随大面积水体覆盖,SAR系统侧视成像水域范围内后向散射强度低,经典PS选取方法得到的空间分布较为稀疏,而简单放宽选取条件可能引起大量误报;(3)经典PS算法中非缠绕相位的恢复本质上是基于先验形变模型的时间维一维解缠方法,由于库区地质条件复杂,难以预先建立形变模型,形变参数解算存在困难。

    针对上述现实问题,本文对常规时序InSAR数据处理流程进行改进,通过应用适当的策略,包括SAR影像传递配准方法、基于自适应阈值分割的PS选取方法以及时空维相位解缠策略等,满足水库复杂环境下时空连续、高精度形变监测要求。改进后的数据处理流程如图 1所示。

    图  1  面向水库研究区的时序InSAR数据处理流程
    Figure  1.  Flowchart of Time Series InSAR Data Processing Used for Reservoirs Study Area

    SAR影像精配准依赖于影像间的相干关系[9],若需要配准的两景影像因时间间隔长、基线条件不良等因素导致失相干严重,则常规配准方法可能导致配准失败。相对于常规配准方法,选取1景或多景与两幅待配准影像都具有较好相干性的辅助影像(集),通过几何关系和数学模型进行传递配准,可以从一定程度上解决这类问题。选择高质量的辅助影像成为传递配准法的关键。

    以距离向为例,传递配准法所涉及的主影像、副影像p及辅助影像q之间的空间关系为:

    $$ \Delta R_p^q = \mathop {\mathop \sum \limits_{i = 0} }\limits^d \mathop {\mathop \sum \limits_{j = 0} }\limits^i {\alpha _{i - j,j}}R_p^{i - j}A_p^j - \mathop {\mathop \sum \limits_{i = 0} }\limits^d \mathop {\mathop \sum \limits_{j = 0} }\limits^i {\beta _{i - j,j}}R_q^{i - j}A_q^j $$ (1)

    式中,αβ为多项式系数;(RA)为配准联系点在影像距离向和方位向的坐标;对于配准多项式阶次d,所需求解的未知数有(d + 1)(d + 2)个。当d = 2时,式(1)展开为:

    $$ \begin{align} & \Delta \hat{R}_{p}^{q}{{|}_{d=2}}={{\alpha }_{0,0}}+{{\alpha }_{1,0}}{{R}_{p}}+{{\alpha }_{0,1}}{{A}_{p}}+{{\alpha }_{1,1}}{{R}_{p}}{{A}_{p}}+ \\ & \ \ \ \ \ \ {{\alpha }_{2,0}}R_{p}^{2}+{{\alpha }_{0,2}}A_{p}^{2}-\left( {{\beta }_{0,0}}+{{\beta }_{1,0}}{{R}_{p}}+{{\beta }_{0,1}}{{A}_{p}}+ \right. \\ & \left. \ \ \ \ \ \ {{\beta }_{1,1}}{{R}_{p}}{{A}_{p}}+{{\beta }_{2,0}}R_{p}^{2}+{{\beta }_{0,2}}A_{p}^{2} \right) \\ \end{align} $$ (2)

    引入辅助影像的传递配准方法在配准点及联系点选取、互相关系数计算、偏移量平差及影像重采样等方面均与常规配准方法相同[10]。由于加入了辅助影像,需要确定的未知参数个数增加,但相比于精配准过程中数百个配准窗口上的亚像素级偏移量,仍有大量多余观测可供平差和多项式拟合。传递配准方法相对于常规配准法有更好的适用性,尤其适合低相干SAR影像对的配准。

    基于PS的时序InSAR方法首先从SAR影像中提取具有稳定反射特性的高质量散射体,然后仅对具有高相干特性的像元进行差分干涉、相位建模和形变参数解算,最终获得高可靠性的地表微小形变信息[11]。如何在影像上识别稳健的PS目标是时序InSAR技术的基础和关键。水库库区地物类型复杂,常伴随大面积水体覆盖,既要顾及PS的探测概率,即让尽量多的真实PS被成功选取;又要保障PS探测结果的可靠性,即选取结果中只能包含少量失相干目标。针对这一实际问题,基于SAR振幅图像统计特征,提出利用自适应阈值分割结果进行约束,综合分析振幅及干涉相位信息,以得到足够密度的高质量PS目标。

    二值分割将图像分割为背景和目标两类,此时图像灰度直方图可视为组合背景和目标像素的混合分布。由SAR影像的成像特征[12]及中心极限定律可知,该混合分布的两个分量均服从高斯分布。给定判断标准:

    $$ {{\mu }_{1}}-{{\mu }_{0}}>f\left( {{\sigma }_{0}}+{{\sigma }_{1}} \right) $$ (3)

    式中,μσ分别为均值与方差,下标0和1分别代表目标和背景;参数f需根据灰度分布特征确定。

    对于输入的时域平均SAR振幅图像,首先根据其灰度直方图概率密度分布确定初始阈值,随后按照一定的规则对图像分块,计算块内灰度值的方差,并将其与方差阈值进行比较。若块内像素灰度值方差较小,可认为该子块内所有像素为同一地物类型,对比块内灰度均值与图像总体灰度均值,以判定该子块为陆地或水体;对于非同类子块,利用Otsu方法[13]选取局部图像分割阈值,迭代处理直至满足式(3)的条件。通过上述自适应阈值分割,可得到水体、陆地两类分割结果。

    基于自适应阈值分割的水陆分离结果,仅对SAR图像上被分类为陆地的部分利用经典振幅离差指数阈值法[11]和时域相干性测度法[14]进行稳定性分析,可有效避免水域区域PS的误判。

    经典PS算法是利用干涉图时间序列上两点间的缠绕相位差估计形变参数[15],这种相位恢复的思路是一种基于模型的时间维一维解缠策略。水库库区涉及范围广,形变情况复杂,难以预先建立形变模型。对干涉对进行逐一解缠,再将结果统一归算到时间维上的方法是一种简化处理,但时序InSAR相位是时域上一维、空间域上二维的三维数据,充分利用其三维特性进行相位解缠将取得更高精度的参数估计结果。Hooper等[16]提出了三维解缠理论框架,给出了无多环路相位中断平面的理想情况下似L范数解。

    现有的解缠算法均基于如下假设,即邻近像元的相位差绝对值小于π。干涉相位组成部分中,地形相位、形变相位及大气相位在空间上具有相似性,对于这部分空间相关的信号而言,当空间采样率足够高时,上述假设前提是成立的;但信号中存在的空间不相关的部分,即使空间采样间隔足够小,仍有可能存在邻近像元绝对相位差大于π的情况。空间不相关的信号中,影响最大的成分是视角误差,主影像中空间非相关的误差部分也将被估计。从缠绕的干涉相位φint中去除空间不相关的部分,仅对剩余部分进行解缠,即:

    $$ W\left\{ {{\varphi }_{\text{int}}}-\text{ }\!\!\Delta\!\!\text{ }\hat{\phi }_{\theta }^{\text{nc}}-\phi _{m}^{\text{nc}} \right\}=W\left\{ {{\phi }_{\text{def}}}+{{\phi }_{\text{atm}}}+\text{ }\!\!\Delta\!\!\text{ }{{\phi }_{\text{orb}}}+\text{ }\!\!\Delta\!\!\text{ }\phi _{\theta }^{\text{corr}}+\text{ }\!\!\Delta\!\!\text{ }{{\phi }_{\text{noise}}} \right\} $$ (4)

    式中,W {∙}为缠绕算子;$\text{ }\!\!\Delta\!\!\text{ }\hat{\phi }_{\theta }^{\text{nc}}$和$\phi _{m}^{\text{nc}}$分别表示空间不相关的视角误差和主影像误差;;ϕdef为卫星视线方向上的形变;ϕatm表示两次SAR成像时刻的大气相位差异;Δϕorb是由轨道不确定性造成的相位差;$\text{ }\!\!\Delta\!\!\text{ }\phi _{\theta }^{\text{corr}}$为视角误差中空间相关部分造成的地形相位残余;;Δϕnoise为对应的噪声项。

    通过二维空间滤波从干涉相位中去除视角误差和主影像误差中空间不相关的部分后,在InSAR时间序列的时间维上进行相位恢复,随后利用该结果作为空间上二维解缠的优化初值。这不是严格意义上的三维解缠,但相比于三维解缠理论框架中的似L范数解,该方法更具有普适性,尤其是数据中存在多环路相位中断平面的情况。二维相位解缠有最小费用流、最小统计费用流[17]等诸多方法。

    山东省东营市地处黄河最下游,境内客水资源较丰沛,但黄河来水在年际、年内分配不均,无法满足生产生活对水资源的需求。修建平原水库,利用黄河水调剂当地水资源,做到“丰蓄枯用”、“冬蓄春用”。广南水库位于东营市东南,濒临渤海,在支脉沟以北、广利河以南、防潮大堤以西退海滩涂的开阔地带。为优化胶东半岛水资源配置,缓解潍坊、青岛地区的水资源供需矛盾,于2017年开工的黄水东调应急工程将从广南水库向潍坊北部地区调水。

    广南水库围坝为碾压式均质土坝,坝顶高程7.0 m,平均库底高程2.0 m,设计水位5.0 m,占地39 km2,库容1.14亿m3,属大(2)型水库。本研究选取30景ENVISAT ASAR影像为数据源,时空基线详细信息见表 1图 2显示研究区地理位置,其中黑色矩形框是该组影像整景覆盖范围,蓝色矩形对应广南水库研究区,截取的区域在影像坐标系下为1 000×1 000像素,底图显示1″空间分辨率的SRTM(shuttle radar topography mission)高程信息,该区域平均高程不超过5 m。

    表  1  用于时序InSAR分析的ENVISAT ASAR影像时空基线表
    Table  1.  Detailed Information of Temporal and Spatial Baselines of ENVISAT ASAR Images Used for Time Series InSAR Analysis
    影像获取时间 时间基线/d 垂直基线/m
    2007-02-01 -805 -161
    2007-03-08 -770 687
    2007-04-12 -735 36
    2007-05-17 -700 73
    2007-06-21 -665 276
    2007-07-26 -630 207
    2007-10-04 -560 115
    2007-11-08 -525 408
    2008-01-17 -455 166
    2008-02-21 -420 -114
    2008-03-27 -385 551
    2008-10-23 -175 451
    2008-11-27 -140 -48
    2009-02-05 -70 -81
    2009-03-12 -35 725
    2009-04-16 0 0
    2009-05-21 35 186
    2009-06-25 70 549
    2009-07-30 105 201
    2009-09-03 140 517
    2009-10-08 175 111
    2009-11-12 210 496
    2009-12-17 245 -97
    2010-01-21 280 474
    2010-02-25 315 -97
    2010-04-01 350 638
    2010-05-06 385 453
    2010-06-10 420 458
    2010-07-15 455 143
    2010-09-23 525 457
    下载: 导出CSV 
    | 显示表格
    图  2  研究区地理位置示意图
    Figure  2.  Sketch Map of Geographical Location of the Study Area

    广南水库围坝内坡为现浇混凝土板护坡,外坡大部分为草皮护坡。由于东坝外坡是临海面,为防止外坡受潮汐的冲击侵蚀,在外坡坡脚以上至4.0 m高程范围内采用浆砌石护坡和混凝土护坡。坝体大部分为混凝土浇筑,具有较好的电磁波反射特性。莱州湾是风暴潮频发区,为防止潮浪侵袭,莱州湾南岸粉砂淤泥质海岸筑有人工土石海堤。防潮堤、广南水库库岸护坡及湖心岛等人工地物上均提取到较多高质量的PS目标,居民区和企业分布的地区也探测到一定数目的稳定点,水产养殖池堤等位置由于变化较大,仅在部分区域获取到零星点。广南水库西侧为内陆侧背海面,护坡为混凝土浇筑,受潮汐影响较小,选取分布于该护坡上77个PS的平均相位作为基准,时间维以第1景影像的获取时间(2007-02-01)为计算基准,经时空维相位解缠、数字高程模型(digital elevation model,DEM)及其他相关误差项的估计,得到各PS上对应的相对变化情况,卫星视线方向形变时间序列如图 3所示。

    图  3  广南水库库区卫星视线方向形变时间序列
    Figure  3.  Time Series of Deformation of Guangnan Reservoir Area in Line of Sight Direction

    图 3可见,广南水库西岸和湖心长廊较为稳定,无显著变形现象;莱州湾防潮堤受潮汐冲击侵蚀,水库东岸受海水内侵影响,在研究期内有形变发生,但总体情况可控;其余地区如水产养殖场和盐池等局部区域,由于受工农业生产活动影响,其变化较大。假设研究期间为均匀线性形变,各PS平均形变速率如图 4(a)所示,各点位线性形变速率标准差如图 4(b)所示,其中底图为SAR平均强度。将PS点及其平均形变速率信息叠加到GoogleEarthTM上,以识别所对应的地物类型,如图 5所示。

    图  4  广南水库库区平均形变速率与标准差分布图
    Figure  4.  Distribution Maps of Averaged Deformation Rates and Standard Deviations of the Guangnan Reservoir Area
    图  5  广南水库库区卫星视线方向平均形变速率图
    Figure  5.  Averaged Deformation Rates of the Guangnan Reservoir Area in Line of Sight Direction with Optical Image Background

    在探测到的所有PS点中,线性形变速率拟合标准差最大为3.7 mm/a,最小为0.3 mm/a,其中有超过91%的点位标准差小于2 mm/a。堤坝、库岸等混凝土浇筑的人工地物由于相干条件较好,反映在图 4(b)中表现为标准差较小,优于1 mm/a。由低洼闲置田改建的淡水养殖池塘等地物本身相干条件较差,且受工农业生产活动影响,形变情况并不规律,因此线性形变速率拟合的标准差较大。选取4类典型地物,即莱州湾防潮堤D、广南水库湖心人工长廊L、迎海面受潮汐影响的东侧库岸E和内陆侧不受潮汐影响的西侧库岸W(标识于图 4(a)中),分析其形变时间序列,如图 6所示。图 6中直线是利用线性函数拟合得到的形变趋势,形变参考时间为第1景影像的获取时间(2007-02-01)。

    图  6  典型特征区域PS目标点形变时间序列
    Figure  6.  Time Series of Deformation of PS Target Points in Typical Feature Areas

    图 6显示,莱州湾防潮堤上典型点位D的形变速率约为5 mm/a,形变发生的主要原因是受海潮冲刷、侵蚀等外界作用影响。同样,受到潮汐影响的还有广南水库的东侧迎海面库岸,典型点位E上的平均形变速率约为3 mm/a,相比于防潮堤,东侧库岸受潮汐侵蚀作用稍小,因此形变速率也较之有所下降。广南水库内陆侧西侧库岸和湖心人工长廊由于不受海潮的影响,在研究期间均保持稳定,考虑到干涉测量误差影响,可认为西侧库岸和湖心人工建筑物无显著形变发生。

    综上所述,莱州湾防潮堤、广南水库库岸及景区湖心人工建筑物由混凝土浇筑,研究期间干涉条件较好,可以从相关人工地物上提取到足量的高质量PS进行时间序列分析,获得有效的形变信息。

    表面形变监测结果是水库大坝风险分析与预警的基础,能够为防灾减灾提供决策支持。星载时序InSAR提供了一种遥感新方法,可以较低的成本进行大面积同步观测,获取高空间分辨率、高精度的形变信息。结合大坝、堤坝及库区实际应用环境的复杂性和特殊性,本文对时序InSAR方法的数据处理流程进行了相应改进,使其更加适应水电工程形变监测实际需求。广南水库应用实践表明,由混凝土浇筑的大坝、防潮堤等水工建筑物干涉条件较好,时序InSAR方法可探测到高质量的散射体目标,并提取形变时间序列,验证了时序InSAR分析方法对水库库区、大坝、防潮堤等水工建筑物进行形变监测的有效性。时序InSAR形变监测方法在水库安全状况普查及形变历史回溯等工作中具有巨大的应用潜力。

  • 图  1   主导层优化模块逻辑框图

    Figure  1.   Dominant Layer Optimization Module Logic Block Diagram

    图  2   模块对卷积层时域动态信息的影响及选择主导层的概念图

    Figure  2.   Conceptual Diagram About the Influence of the Module on Temporal Information of Convolutional Layer and the Selection of Dominant Layer

    图  3   不同数据集训练过程中的训练错误率曲线图

    Figure  3.   Training Error Rate Graphs During Different Database Training

    表  1   在不同数据集测试集上的正确率/%

    Table  1   Accuracies on Different Data Sets/%

    模型 UCF-101 HMDB-51
    Top-1 Top-5 Top-1 Top-5
    ResNeXt-50 47.0 69.2 18.5 43.2
    ResNeXt-50(+) 47.9 70.7 20.0 43.6
    ResNeXt-101 45.8 68.6 18.6 43.3
    ResNeXt-101(+) 46.6 69.8 19.9 43.5
    下载: 导出CSV
  • [1]

    Tran D, Bourdev L, Fergus R, et al. Learning Spatiotemporal Features with 3D Convolutional Networks[C]// 2015 IEEE International Conference on Computer Vision, Santiago, Chile, 2015

    [2]

    Tran D, Wang H, Torresani L, et al. A Closer Look at Spatiotemporal Convolutions for Action Recognition[C]// IEEE Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA, 2018

    [3] 裴颂文, 杨保国, 顾春华. 融合的三维卷积神经网络的视频流分类研究[J]. 小型微型计算机系统, 2018, 39(10): 2 266-2 270 https://www.cnki.com.cn/Article/CJFDTOTAL-XXWX201810027.htm

    Pei Songwen, Yang Baoguo, Gu Chunhua. Research on Video Stream Classification Using 3D ConvNet Ensemble Fusion Model[J]. Journal of Chinese Computer Systems, 2018, 39(10): 2 266-2 270 https://www.cnki.com.cn/Article/CJFDTOTAL-XXWX201810027.htm

    [4] 吴培良, 杨霄, 毛秉毅, 等. 一种视角无关的时空关联深度视频行为识别方法[J]. 电子与信息学报, 2019, 41(4): 904-910 https://www.cnki.com.cn/Article/CJFDTOTAL-DZYX201904020.htm

    Wu Peiliang, Yang Xiao, Mao Bingyi, et al. A Perspective-Independent Method for Behavior Recognition in Depth Video via Temporal-Spatial Correlating[J]. Journal of Electronics and Information Technology, 2019, 41(4): 904-910 https://www.cnki.com.cn/Article/CJFDTOTAL-DZYX201904020.htm

    [5]

    Simonyan K, Zisserman A. Two-Stream Convolutional Networks for Action Recognition in Videos[C]// Advances in Neural Information Processing Systems, Montreal, Canada, 2014

    [6]

    Sevilla-Lara L, Liao Y, Güney F, et al. On the Integration of Optical Flow and Action Recognition[C]// German Conference on Pattern Recognition, Springer, Cham, 2018

    [7]

    Huang D A, Ramanathan V, Mahajan D, et al. What Makes a Video a Video: Analyzing Temporal Information in Video Understanding Models and Datasets[C]// IEEE Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA, 2018

    [8] 熊汉江, 郑先伟, 丁友丽, 等. 基于2D-3D语义传递的室内三维点云模型语义分割[J]. 武汉大学学报·信息科学版, 2018, 43(12): 2 303-2 309 doi: 10.13203/j.whugis20180190

    Xiong Hanjiang, Zheng Xianwei, Ding Youli, et al. Semantic Segmentation of Indoor 3D Point Cloud Model Based on 2D-3D Semantic Transfer[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2 303-2 309 doi: 10.13203/j.whugis20180190

    [9]

    Luo Z, Hsieh J T, Jiang L, et al. Graph Distillation for Action Detection with Privileged Modalities[C]// European Conference on Computer Vision, Munich, Germany, 2018

    [10]

    Wang X, Girshick R, Gupta A, et al. Non-local Neural Networks[C]// IEEE Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA, 2018

    [11]

    Diba A, Sharma V, Van Gool L. Deep Temporal Linear Encoding Networks[C]// IEEE Conference on Computer Vision and Pattern Recognition, Honolulu, HI, USA, 2017

    [12]

    He K, Zhang X, Ren S, et al. Identity Mappings in Deep Residual Networks[C]//European Conference on Computer Vision, Amsterdam, Netherlands, 2016

    [13]

    Hara K, Kataoka H, Satoh Y. Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and Imagenet?[C]// IEEE Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA, 2018

    [14]

    Khurram S, Amir Z, Mubarak S. UCF-101: A Dataset of 101 Human Action Classes from Videos in the Wild[EB/OL]. (2012-12-01)[2019-05‍-13]. https://www.crcv.ucf.edu/papers/UCF101_CRCV-TR-12-01.pdf

    [15]

    Kuehne H, Jhuang H, Garrote E, et al. HMDB: A Large Video Database for Human Motion Recognition[C]// International Conference on Computer Vision, Barcelona, Spain, 2011

    [16] 李锐, 沈雨奇, 蒋捷, 等. 公共地图服务中访问热点区域的时空规律挖掘[J]. 武汉大学学报·信息科学版, 2018, 43(9): 1 408-1 415 doi: 10.13203/j.whugis20160424

    Li Rui, Shen Yuqi, Jiang Jie, et al. Temporal and Spatial Characteristics of Hotspots in Public Map Service[J]. Geomatics and Information Science of Wuhan University, 2018, 43(9): 1 408-1 415 doi: 10.13203/j.whugis20160424

    [17] 胡涛, 朱欣焰, 呙维, 等. 融合颜色和深度信息的运动目标提取方法[J]. 武汉大学学报·信息科学版, 2019, 44(2): 276-282 doi: 10.13203/j.whugis20160535

    Hu Tao, Zhu Xinyan, Guo Wei, et al. A Moving Object Detection Method Combining Color and Depth Data[J]. Geomatics and Information Science of Wuhan University, 2019, 44(2): 276-282 doi: 10.13203/j.whugis20160535

    [18]

    Borgwardt K M, Gretton A, Rasch M J, et al. Integrating Structured Biological Data by Kernel Maximum Mean Discrepancy[J]. Bioinformatics, 2006, 22(14): e49-e57 doi: 10.1093/bioinformatics/btl242

    [19]

    Long M, Cao Y, Wang J, et al. Learning Transferable Features with Deep Adaptation Networks[C]// The 32nd International Conference on Machine Learning, Lille, France, 2015

    [20]

    Long M, Zhu H, Wang J, et al. Deep Transfer Learning with Joint Adaptation Networks[C]// The 34th International Conference on Machine Learning, Sydney, Australia, 2017

    [21]

    Xie S, Girshick R, Dollár P, et al. Aggregated Residual Transformations for Deep Neural Networks[C]// IEEE Conference on Computer Vision and Pattern Recognition, Honolulu, HI, USA, 2017

  • 期刊类型引用(8)

    1. 齐志军,朱东辉,罗涛,苗学策,何晓业. 无需公共点的高精度激光跟踪仪自标定方法. 红外与激光工程. 2024(02): 25-32 . 百度学术
    2. 李之奇,纪英俊,张连浩,王赛男. 面向超宽带的巷道内掘进机定位算法研究. 自动化与仪表. 2024(05): 147-151 . 百度学术
    3. 穆星,张宁. 基于激光跟踪仪的三维坐标转换方法. 北京测绘. 2024(02): 264-269 . 百度学术
    4. 刘忠贺,李宗春,何华. 基于部分参数约束的粒子加速器隧道控制网平差. 山东科技大学学报(自然科学版). 2024(03): 51-63 . 百度学术
    5. 刘志伟,马力,康心怡. 激光跟踪仪在大型钢结构安装测量中的应用. 地矿测绘. 2024(02): 38-41 . 百度学术
    6. 丁婷,王巍,李笑,徐蒋林,张思成,程竹兵,吴恩辰,张秋雨,何晓业. 四路激光在合肥先进光源预准直及其布局优化. 中国激光. 2024(14): 161-169 . 百度学术
    7. 梁楚彦,缪东晶,李建双,孔明,李连福,王德利,刘洋. 多边法坐标测量系统关键布局参数对测量精度影响的研究. 计量学报. 2023(07): 1009-1018 . 百度学术
    8. 黄鑫,张继文,于永堂,徐传召,张率,曾涛,王竞革. 基于北斗卫星导航系统的地下车库深基坑沉降监测与分析. 测绘通报. 2023(09): 18-24 . 百度学术

    其他类型引用(0)

图(3)  /  表(1)
计量
  • 文章访问数:  968
  • HTML全文浏览量:  297
  • PDF下载量:  64
  • 被引次数: 8
出版历程
  • 收稿日期:  2019-05-12
  • 发布日期:  2021-08-04

目录

/

返回文章
返回