留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

适用于训练样本选择的斜交因子模型研究

虞欣 郑肇葆 李林宜

虞欣, 郑肇葆, 李林宜. 适用于训练样本选择的斜交因子模型研究[J]. 武汉大学学报 ● 信息科学版. doi: 10.13203/j.whugis20200631
引用本文: 虞欣, 郑肇葆, 李林宜. 适用于训练样本选择的斜交因子模型研究[J]. 武汉大学学报 ● 信息科学版. doi: 10.13203/j.whugis20200631
YU Xin, ZHENG Zhaobao, LI Linyi. Research on Oblique Factor Model for Selecting Training Samples[J]. Geomatics and Information Science of Wuhan University. doi: 10.13203/j.whugis20200631
Citation: YU Xin, ZHENG Zhaobao, LI Linyi. Research on Oblique Factor Model for Selecting Training Samples[J]. Geomatics and Information Science of Wuhan University. doi: 10.13203/j.whugis20200631

适用于训练样本选择的斜交因子模型研究

doi: 10.13203/j.whugis20200631
基金项目: 

国家重点研发计划课题(编号:2018YFC0407804)

详细信息
    作者简介:

    虞欣,博士,教授,主要从事影像解译、人工智能和贝叶斯统计等研究工作。china_yuxin@163.com

  • 中图分类号: P237

Research on Oblique Factor Model for Selecting Training Samples

Funds: 

the National Key Research and Development Program of China (No. 2018YFC0407804).

  • 摘要: 训练样本的质量直接影响到训练阶段的训练质量(或效果),进而在一定程度上影响到测试阶段的分类精度。训练样本的代表性和典型性则反映出训练样本质量的一个重要方面。对于当前非常流行的深度学习模型研究,如何尽可能地减少训练样本的数量,一方面成为一个非常“棘手”的问题,另一方面从实际应用的角度来看,这也上升为一个经济或成本方面的问题。文章提出一种适用于训练样本选择的斜交因子模型方法,该方法松弛了Q型因子分析和对应分析对于公因子之间独立的假设条件,并在斜交参考解的基础上提出一种适合训练样本选择的近似求解斜交旋转的方法。实验与分析表明:提出的方法是可行、有效的。与基于正交因子模型的方法相比,它可以更好地描述或逼近现实的真实情况,可以选择出更合理、更具有代表性的典型训练样本,并且还可以取得满意的分类精度。适用于训练样本选择的斜交因子模型方法优于基于正交因子模型的训练样本的选择方法,被选择的训练样本,其分布相对更分散、更合理,而且总的分类精度平均提高3%左右。提出的方法,在理论方面可以为优化样本的采集提供一种理论支持,在实际应用方面对样本的采集具有指导或参考意义。
  • [1] Adeli Ehsan, Li Xiaorui, Kwon Dongjin, Zhang Yong, Pohl Kilian M. Logistic Regression Confined by Cardinality-Constrained Sample and Feature Selection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 42(7):1713-1728.
    [2] Arnold Roger B., Wang Luke, Lopez Talle, James Sophie, Blute Nicole. Updating Lead and Copper Rule SampleSite Selection:Best Practices From an Innovative Pilot Program[J]. Journal of American Water Works Association, 2020, 112(4):22-31.
    [3] Au Jessie, Youngentob Kara N, Foley William J, Moore Ben D, Fearn Tom. Sample selection, calibration and validation of models developed from a large dataset of near infrared spectra of tree leaves[J]. Journal of Near Infrared Spectroscopy, 2020. (Article in Press).
    [4] Bellver Miriam, Salvador Amaia, Torres Jordi, Giro-i-Nieto Xavier. Mask-guided sample selection for semi-supervised instance segmentation[J]. Multimedia Tools and Applications, 2020. (Article in Press).
    [5] da Silva, Marcus Vinicius Brito, de Carvalho, André Augusto Pacheco, Jacobs Arthur Selle, Pfitscher Ricardo José, Granville Lisandro Zambenedetti. Sample Selection Search to Predict Elephant Flows in IXP Programmable Networks[J]. Advances in Intelligent Systems and Computing, 2020, 1151:357-368.
    [6] Fernández Mariela, García Jesús E., Gholizadeh Ramin, González-López Verónica A. Sample selection procedure in daily trading volume processes[J]. Mathematical Methods in the Applied Sciences, 2020, 43(13):7537-7549.
    [7] He Kaixun, Wang Kai, Yan Yayun. Active training sample selection and updating strategy for near-infrared model with an industrial application[J]. Chinese Journal of Chemical Engineering, 2019, 27(11):2749-2758.
    [8] Kral, Jan, Gotthans Tomas, Marsalek Roman, Harvanek Michal, Rupp Markus. On feedback sample selection methods allowing lightweight digital predistorter adaptation[J]. IEEE Transactions on Circuits and Systems I:Regular Papers, 2020, 67(6):1976-1988.
    [9] Li Huiyong, Bao Weiwei, Hu Jinfeng, Xie Julan, Liu Ruixin. A training samples selection method based on system identification for STAP[J]. Signal Processing, 2018, 142:119-124.
    [10] Liu Jing, Zhu A-Xing, Rossiter David, Du Fei, Burt James. A trustworthiness indicator to select sample points for the individual predictive soil mapping method (iPSM)[J]. Geoderma, 2020, 373.
    [11] Liu Xueqi, Zhu A-Xing, Yang Lin, Pei Tao, Liu Junzhi, Zeng Canying, Wang Desheng. A graded proportion method of training sample selection for updating conventional soil maps[J]. Geoderma, 2020, 357. (Open Access)
    [12] Lu Qikai, Ma Yong, Xia Gui-Song. Active learning for training sample selection in remote sensing image classification using spatial information[J]. Remote Sensing Letters, 2017, 8(12):1210-1219.
    [13] Lu Wenbo, Ma Chaoqun, Li Peikun. Research on Sample Selection of Urban Rail Transit Passenger Flow Forecasting Based on SCBP Algorithm[J]. IEEE Access, 2020, 8:89425-89438.
    [14] Lu Yang, Ma Xiaolei, Lu Yinan. A cluster-based sample selection strategy for biological event extraction[C].//Proceedings of 2019 the 9th International Workshop on Computer Science and Engineering, 2019, p 72-77.
    [15] Ma Jing, Hong Dezhi, Wang Hongning. Selective sampling for sensor type classification in buildings[C].//Proceedings-2020 19th ACM/IEEE International Conference on Information Processing in Sensor Networks, IPSN 2020, p.241-252.
    [16] Ng Wing W. Y., Jiang Xiaoxia, Tian Xing, Pelillo Marcello, Wang Hui, Kwong Sam Incremental hashing with sample selection using dominant sets. International Journal of Machine Learning and Cybernetics, 2020.(Article in Press)
    [17] Rahimi Hamid. Considering factors affecting the prediction of time series by improving sine-cosine algorithm for selecting the best samples in neural network multiple training model[J]. Lecture Notes in Electrical Engineering, 2019, 480:307-320.
    [18] Tang Pengfei, Du Peijun, Lin Cong, Guo Shanchuan, Qie Lu. A Novel Sample Selection Method for Impervious Surface Area Mapping Using JL1-3B Nighttime Light and Sentinel-2 Imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2020, 13:3931-3941.
    [19] Tran Nguyen, Abramenko Oleksii, Jung Alexander. On the sample complexity of graphical model selection from non-stationary samples[J]. IEEE Transactions on Signal Processing, 2020, 68:17-32.
    [20] Varshavskiy Ilyas E., Dmitriev, Ivan A., Krasnova, Anastasiia I., Polivanov Vladimir V. Selection of Sampling Rate for Digital Noise Filtering Algorithms[C].//Proceedings of the 2020 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering, 2020, p 932-935.
    [21] Xu Xinzheng, Li Shan, Liang Tianming, Sun Tongfeng. Sample selection-based hierarchical extreme learning machine[J]. Neurocomputing, 2020, 377:95-102.
    [22] Zhang Chenxiao, Wu Yifeng, Guo Mingming, Deng Xiaobo. Training sample selection for space-time adaptive processing based on multi-frames. Journal of Engineering[J], 2019, 20:6369-6372.
    [23] Zhang Xiwen, Seyfi Tolunay, Ju Shengtai, Ramjee Sharan, Gamal Aly El, Eldar Yonina C. Deep Learning for Interference Identification:Band, Training SNR, and Sample Selection[C]//IEEE Workshop on Signal Processing Advances in Wireless Communications, SPAWC, July 2019.
  • [1] 高云龙, 张帆, 屈孝志, 黄先锋, 崔婷婷.  结合样本自动选择与规则性约束的窗户提取方法 . 武汉大学学报 ● 信息科学版, doi: 10.13203/j.whugis20150225
    [2] 王春艳, 刘佳新, 徐爱功, 王玉, 隋心.  一种新的高分辨率遥感影像模糊监督分类方法 . 武汉大学学报 ● 信息科学版, doi: 10.13203/j.whugis20150726
    [3] 赵波, 苏红军, 蔡悦.  一种切空间协同表示的高光谱遥感影像分类方法 . 武汉大学学报 ● 信息科学版, doi: 10.13203/j.whugis20150579
    [4] 贾永红, 谢志伟, 吕臻, 祝梦花, 刘美娟.  一种新的遥感影像变化检测方法 . 武汉大学学报 ● 信息科学版, doi: 10.13203/j.whugis20150025
    [5] 程诗尧, 梅天灿, 刘国英.  顾及结构特征的多层次马尔科夫随机场模型在影像分类中的应用 . 武汉大学学报 ● 信息科学版, doi: 10.13203/j .whu g is20130692
    [6] 牛超, 李夕海, 易世华, 卢世坤, 刘代志.  地磁变化场的MEEMD-样本熵-LSSVM预测模型 . 武汉大学学报 ● 信息科学版, doi: 10.13203/j.whugis20130261
    [7] 唐韵玮, 张景雄.  遥感影像土地覆盖分类的多点地统计学方法 . 武汉大学学报 ● 信息科学版, doi: 10.13203/j.whugis20130023
    [8] 温奇, 夏列钢, 李苓苓, 吴玮.  面向灾害应急土地覆被分类的样本自动选择方法研究 . 武汉大学学报 ● 信息科学版,
    [9] 袁理, 陈庆虎, 鄢煜尘, 段柳云.  两因子模型在多姿态人脸识别中的应用 . 武汉大学学报 ● 信息科学版,
    [10] 熊彪, 江万寿, 李乐林.  基于高斯混合模型的遥感影像半监督分类 . 武汉大学学报 ● 信息科学版,
    [11] 陈楠, 王钦敏.  基于地形因子信息量的数字高程模型分辨率的选择——以黄土高原的研究为例 . 武汉大学学报 ● 信息科学版,
    [12] 张永红, 张继贤, 郭健, 曹银璇.  全球地图第一版中国土地覆盖产品的生成 . 武汉大学学报 ● 信息科学版,
    [13] 黄微, 张良培, 李平湘.  基于地形区域分割的复杂地区遥感影像分类 . 武汉大学学报 ● 信息科学版,
    [14] 吴柯, 李平湘, 张良培, 沈焕锋.  基于正则MAP模型的遥感影像亚像元定位 . 武汉大学学报 ● 信息科学版,
    [15] 王毅, 张良培, 李平湘.  基于自动搜索和光谱匹配技术的训练样本纯化算法 . 武汉大学学报 ● 信息科学版,
    [16] 钟燕飞1 张良培1 龚健雅1 李平湘1.  基于资源限制性人工免疫系统的多光谱遥感影像分类方法 . 武汉大学学报 ● 信息科学版,
    [17] 万幼川, 宋杨.  基于高分辨率遥感影像分类的地图更新方法 . 武汉大学学报 ● 信息科学版,
    [18] 刘楠, 舒宁.  基于光谱空间密度分析的边缘提取 . 武汉大学学报 ● 信息科学版,
    [19] 黄桂兰, 郑肇葆.  纹理模型法用于影像纹理分类 . 武汉大学学报 ● 信息科学版,
    [20] 刘少创.  草场资源分类专家系统的研究 . 武汉大学学报 ● 信息科学版,
  • 加载中
计量
  • 文章访问数:  35
  • HTML全文浏览量:  3
  • PDF下载量:  2
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-12-10

适用于训练样本选择的斜交因子模型研究

doi: 10.13203/j.whugis20200631
    基金项目:

    国家重点研发计划课题(编号:2018YFC0407804)

    作者简介:

    虞欣,博士,教授,主要从事影像解译、人工智能和贝叶斯统计等研究工作。china_yuxin@163.com

  • 中图分类号: P237

摘要: 训练样本的质量直接影响到训练阶段的训练质量(或效果),进而在一定程度上影响到测试阶段的分类精度。训练样本的代表性和典型性则反映出训练样本质量的一个重要方面。对于当前非常流行的深度学习模型研究,如何尽可能地减少训练样本的数量,一方面成为一个非常“棘手”的问题,另一方面从实际应用的角度来看,这也上升为一个经济或成本方面的问题。文章提出一种适用于训练样本选择的斜交因子模型方法,该方法松弛了Q型因子分析和对应分析对于公因子之间独立的假设条件,并在斜交参考解的基础上提出一种适合训练样本选择的近似求解斜交旋转的方法。实验与分析表明:提出的方法是可行、有效的。与基于正交因子模型的方法相比,它可以更好地描述或逼近现实的真实情况,可以选择出更合理、更具有代表性的典型训练样本,并且还可以取得满意的分类精度。适用于训练样本选择的斜交因子模型方法优于基于正交因子模型的训练样本的选择方法,被选择的训练样本,其分布相对更分散、更合理,而且总的分类精度平均提高3%左右。提出的方法,在理论方面可以为优化样本的采集提供一种理论支持,在实际应用方面对样本的采集具有指导或参考意义。

English Abstract

虞欣, 郑肇葆, 李林宜. 适用于训练样本选择的斜交因子模型研究[J]. 武汉大学学报 ● 信息科学版. doi: 10.13203/j.whugis20200631
引用本文: 虞欣, 郑肇葆, 李林宜. 适用于训练样本选择的斜交因子模型研究[J]. 武汉大学学报 ● 信息科学版. doi: 10.13203/j.whugis20200631
YU Xin, ZHENG Zhaobao, LI Linyi. Research on Oblique Factor Model for Selecting Training Samples[J]. Geomatics and Information Science of Wuhan University. doi: 10.13203/j.whugis20200631
Citation: YU Xin, ZHENG Zhaobao, LI Linyi. Research on Oblique Factor Model for Selecting Training Samples[J]. Geomatics and Information Science of Wuhan University. doi: 10.13203/j.whugis20200631
参考文献 (23)

目录

    /

    返回文章
    返回