留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

多源空间大数据场景下的家装品牌线下广告选址

张嘉琪 杜开虎 任书良 王瑞凡 关庆锋 陈文辉 姚尧

张嘉琪, 杜开虎, 任书良, 王瑞凡, 关庆锋, 陈文辉, 姚尧. 多源空间大数据场景下的家装品牌线下广告选址[J]. 武汉大学学报 ● 信息科学版, 2022, 47(9): 1406-1415. doi: 10.13203/j.whugis20190468
引用本文: 张嘉琪, 杜开虎, 任书良, 王瑞凡, 关庆锋, 陈文辉, 姚尧. 多源空间大数据场景下的家装品牌线下广告选址[J]. 武汉大学学报 ● 信息科学版, 2022, 47(9): 1406-1415. doi: 10.13203/j.whugis20190468
ZHANG Jiaqi, DU Kaihu, REN Shuliang, WANG Ruifan, GUAN Qingfeng, CHEN Wenhui, YAO Yao. Site Selection of Outdoor Advertisement for Home Decoration Brands Based on Multi-source Spatial Big Data[J]. Geomatics and Information Science of Wuhan University, 2022, 47(9): 1406-1415. doi: 10.13203/j.whugis20190468
Citation: ZHANG Jiaqi, DU Kaihu, REN Shuliang, WANG Ruifan, GUAN Qingfeng, CHEN Wenhui, YAO Yao. Site Selection of Outdoor Advertisement for Home Decoration Brands Based on Multi-source Spatial Big Data[J]. Geomatics and Information Science of Wuhan University, 2022, 47(9): 1406-1415. doi: 10.13203/j.whugis20190468

多源空间大数据场景下的家装品牌线下广告选址

doi: 10.13203/j.whugis20190468
基金项目: 

国家重点研发计划 2019YFB2102903

国家自然科学基金 41801306

国家自然科学基金 41671408

国家自然科学基金 41901332

武汉大学测绘遥感信息工程国家重点实验室开放基金 18S01

湖北省自然科学基金 2017CFA041

浙江省自然科学基金 LY18D010001

详细信息

Site Selection of Outdoor Advertisement for Home Decoration Brands Based on Multi-source Spatial Big Data

Funds: 

The National Key Research and Development Program of China 2019YFB2102903

the National Natural Science Foundation of China 41801306

the National Natural Science Foundation of China 41671408

the National Natural Science Foundation of China 41901332

the Open Fund of State Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing, Wuhan University 18S01

the Natural Science Fundation of Hubei Province 2017CFA041

the Natural Science Fundation of Zhejiang Province LY18D010001

More Information
  • 摘要: 合理进行线下广告牌投放位置的选择对商家宣传品牌以及扩大营销市场具有十分积极的作用。由于商业数据较难获取,以往研究多停留在宏观理论层面,未能对线下广告选址的实际布局进行细尺度分析。以北京为研究区,通过耦合某大型家装品牌线下广告到店转化率和路网、感兴趣点数据等表征地理特征和商业经济特征的多源空间数据,构建了基于随机森林的广告到店转化率预测模型(R2=0.758),得到该品牌连锁家装商店在北京市广告选址适宜性空间分布结果,并对各影响特征进行分析。研究结果表明:该家装品牌线下广告到店转化率在北京整体呈现“中心高、外围低”的格局,且存在较强的空间自相关和高值聚集现象;同时,线下广告到店转化率与社会经济、商业政治和人群活动等具有较强相关性,且对同一群体持续进行广告曝光的位置对到店转化率的影响较大。该结果可为线下广告牌布局和商业选址等相关研究提供参考依据和理论基础。
  • 图  1  北京市遥感影像

    Figure  1.  Remote Sensing Image of Beijing

    图  2  北京市某家装品牌到店转化率分布

    Figure  2.  Distribution of the In‐Store Conversion Rate of a Home Decoration Brand in Beijing

    图  3  北京市OSM路网

    Figure  3.  OSM Road Network Distribution in Beijing

    图  4  北京市各类POI核密度分布

    Figure  4.  Kernel Density Distribution of All Kinds of POIs in Beijing

    图  5  北京市平均房价分布

    Figure  5.  Average Housing Price Distribution in Beijing

    图  6  本文技术路线

    Figure  6.  Technology Frame of This Study

    图  7  随机森林模型构建流程

    Figure  7.  Construction Process of Random Forest Model

    图  8  北京市某家装品牌线下广告选址适宜性制图结果

    Figure  8.  Site Suitability Results of Outdoor Advertising in Beijing

    图  9  北京市典型区域的线下广告选址适宜性

    Figure  9.  Site Suitability Results of Outdoor Advertising in Typical Areas in Beijing

    表  1  特征重要性排序

    Table  1.   Ranking of Feature Importance

    特征因子 特征来源 影响因子值
    公司企业 POI 0.424
    交通设施 POI 0.104
    购物服务 POI 0.089
    人口流动 社会经济数据 0.052
    停车场 POI 0.051
    政府机构 POI 0.029
    房价 社会经济数据 0.027
    商务住宅 POI 0.025
    路网 基础地理数据 0.023
    汽车维修 POI 0.022
    汽车销售 POI 0.022
    道路距离 基础设施数据 0.021
    金融服务 POI 0.019
    科教文化 POI 0.019
    汽车服务 POI 0.016
    商场专卖店 POI 0.016
    餐饮服务 POI 0.016
    生活服务 POI 0.014
    体育体闲 POI 0.011
    下载: 导出CSV
  • [1] Lichtenthal J D, Yadav V, Donthu N. Outdoor Advertising for Business Markets[J]. Industrial Marketing Management, 2006, 35(2): 236-247 doi:  10.1016/j.indmarman.2005.02.006
    [2] Akören A N. Interaction of Outdoor Advertising Im proved by Innovative Methods with Digital Art[J]. Procedia-Social and Behavioral Sciences, 2015, 195: 799-805 doi:  10.1016/j.sbspro.2015.06.178
    [3] 朱军, 陈敬良, 宗利永. 线下广告信息属性对消费者购买意愿的影响研究[J]. 预测, 2019, 38(4): 32-38 https://www.cnki.com.cn/Article/CJFDTOTAL-YUCE201904005.htm

    Zhu Jun, Chen Jingliang, Zong Liyong. The Impact of Outdoor Advertising Information Attributes on Consumers'Purchase Intention[J]. Forecasting, 2019, 38(4): 32-38 https://www.cnki.com.cn/Article/CJFDTOTAL-YUCE201904005.htm
    [4] Tam H. Understanding the Impact of Web Personalization on User Information Processing and Decision Outcomes[J]. MIS Quarterly, 2006, 30(4): 865-890 doi:  10.2307/25148757
    [5] Liu D Y, Weng D, Li Y H, et al. SmartAdP: Visual Analytics of Large-scale Taxi Trajectories for Selecting Billboard Locations[J]. IEEE Transactions on Visualization and Computer Graphics, 2017, 23 (1): 1-10
    [6] Wilson R T, Till B D. Effects of Outdoor Advertising: Does Location Matter?[J]. Psychology & Marketing, 2011, 28(9): 909-933
    [7] Patel M R, Bhatt M K. A Study to Know Impact of Outdoor Advertising on Customer Purchase Decision [J]. SEMCOM Management & Technology Review, 2018, 6(1): 113-117
    [8] Cantrell J, Kreslake J M, Ganz O, et al. Marketing Little Cigars and Cigarillos: Advertising, Price, and Associations with Neighborhood Demographics[J]. American Journal of Public Health, 2013, 103 (10): 1902-1909 doi:  10.2105/AJPH.2013.301362
    [9] Rosewarne L. The Men 's Gallery: Outdoor Advertising and Public Space: Gender, Fear, and Feminism[J]. Women's Studies International Forum, 2005, 28(1): 67-78 doi:  10.1016/j.wsif.2005.02.005
    [10] Huang M, Fang Z X, Xiong S L, et al. Interest Driven Outdoor Advertising Display Location Selection Using Mobile Phone Data[J]. IEEE Access, 2019, 7: 30878-30889 doi:  10.1109/ACCESS.2019.2903277
    [11] Dilchert S, Ones D, Viswesvaran C, et al. Response Distortion in Personality Measurement: Born to Deceive, Yet Capable of Providing Valid Self-Assessments?[J]. Psychology Science, 2006, 48(3): 209-225
    [12] Anagnostopoulos A, Petroni F, Sorella M. Targeted Interest-Driven Advertising in Cities Using Twitter [J]. Data Mining and Knowledge Discovery, 2018, 32(3): 737-763 doi:  10.1007/s10618-017-0529-7
    [13] 北京市统计局, 国家统计局北京调查总队. 北京统计年鉴: 2018[M]. 北京: 中国统计出版社, 2018

    Beijing Municipal Bureau Statistics, Survey Office of the National Bureau of Statistics in Beijing. Beijing Statistical Yearbook: 2018[M]. Beijing: China Statistics Press, 2018
    [14] 北京市统计局, 国家统计局北京调查总队. 北京区域统计年鉴: 2018[M]. 北京: 中国统计出版社, 2018

    Beijing Municipal Bureau Statistics, Survey Office of the National Bureau of Statistics in Beijing. Beijing Regional Statistical Yearbook: 2018[M]. Beijing: China Statistics Press, 2018
    [15] Chen Y M, Liu X P, Li X, et al. Delineating Urban Functional Areas with Building-Level Social Media Data: A Dynamic Time Warping(DTW)Distance Based K-Medoids Method[J]. Landscape and Urban Planning, 2017, 160: 48-60 doi:  10.1016/j.landurbplan.2016.12.001
    [16] Jean N, Burke M, Xie M, et al. Combining Satellite Imagery and Machine Learning to Predict Poverty[J]. Science, 2016, 353(6301): 790-794 doi:  10.1126/science.aaf7894
    [17] Yao Y, Zhang J B, Hong Y, et al. Mapping FineScale Urban Housing Prices by Fusing Remotely Sensed Imagery and Social Media Data[J]. Transactions in GIS, 2018, 22(2): 561-581 doi:  10.1111/tgis.12330
    [18] Wang Z Y, Niu L. A Data Model for Using OpenStreetMap to Integrate Indoor and Outdoor Route Planning[J]. Sensors, 2018, 18(7), DOI: org/ 10.3390/s18072100
    [19] 许泽宁, 高晓路. 基于电子地图兴趣点的城市建成区边界识别方法[J]. 地理学报, 2016, 71(6): 928-939

    Xu Zening, Gao Xiaolu. A Novel Method for Identifying the Boundary of Urban Built-Up Areas with POI Data[J]. Acta Geographica Sinica, 2016, 71 (6): 928-939
    [20] 张珣, 钟耳顺, 张小虎, 等. 2004—2008年北京城区商业网点空间分布与集聚特征[J]. 地理科学进展, 2013, 32(8): 1207-1215 https://www.cnki.com.cn/Article/CJFDTOTAL-DLKJ201308005.htm

    Zhang Xun, Zhong Ershun, Zhang Xiaohu, et al. Spatial Distribution and Clustering of Commercial Network in Beijing During 2004—2008[J]. Progress in Geography, 2013, 32(8): 1207-1215 https://www.cnki.com.cn/Article/CJFDTOTAL-DLKJ201308005.htm
    [21] 韩会然, 杨成凤, 宋金平. 北京批发企业空间格局演化与区位选择因素[J]. 地理学报, 2018, 73(2): 219-231 https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201802003.htm

    Han Huiran, Yang Chengfeng, Song Jinping. Impact Factors of Location Choice and Spatial Pattern Evolution of Wholesale Enterprises in Beijing[J]. Acta Geographica Sinica, 2018, 73(2): 219 - 231 https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201802003.htm
    [22] 谷岩岩, 焦利民, 董婷, 等. 基于多源数据的城市功能区识别及相互作用分析[J]. 武汉大学学报·信息科学版, 2018, 43 (7): 1113-1121 doi:  10.13203/j.whugis20160192

    Gu Yanyan, Jiao Limin, Dong Ting, et al. Spatial Distribution and Interaction Analysis of Urban Functional Areas Based on Multi-source Data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(7): 1113-1121 doi:  10.13203/j.whugis20160192
    [23] 姚尧, 任书良, 王君毅, 等. 卷积神经网络和随机森林的城市房价微观尺度制图方法[J]. 地球信息科学学报, 2019, 21(2): 168-177

    Yao Yao, Ren Shuliang, Wang Junyi, et al. Mapping the Fine-Scale Housing Price Distribution by Integrating a Convolutional Neural Network and Random Forest[J]. Journal of Geo-Information Science, 2019, 21(2): 168-177
    [24] Gallin J. The Long-Run Relationship Between House Prices and Income: Evidence from Local Housing Markets[J]. Real Estate Economics, 2006, 34(3): 417-438 doi:  10.1111/j.1540-6229.2006.00172.x
    [25] 于瀚祥, 王利, 裴倩. 大连市商品住宅价格空间分异及其影响因素分析[J]. 国土与自然资源研究, 2018(6): 17-22 doi:  10.3969/j.issn.1003-7853.2018.06.004

    Yu Hanxiang, Wang Li, Pei Qian. A Study on Spatial Differentiation of Commercial Housing Price and Its Influencing Factors in Dalian[J]. Territory & Natural Resources Study, 2018(6): 17-22 doi:  10.3969/j.issn.1003-7853.2018.06.004
    [26] Yao Y, Liu P H, Hong Y, et al. Fine-Scale Intraand Inter-City Commercial Store Site Recommendations Using Knowledge Transfer[J]. Transactions in GIS, 2019, 23(5): 1029-1047 doi:  10.1111/tgis.12553
    [27] Guo B, Li J, Zheng V W, et al. CityTransfer: Transferring Inter-and Intra-City Knowledge for Chain Store Site Recommendation Based on Multi Source Urban Data[J]. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 2017, 1(4), DOI: org/ 10.1145/3161411
    [28] Gong Z Y, Ma Q W, Kan C C, et al. Classifying Street Spaces with Street View Images for a Spatial Indicator of Urban Functions[J]. Sustainability, 2019, 11(22), DOI: org/ 10.3390/su11226424
    [29] Guan C H, Rowe P G. The Concept of Urban Intensity and China's Townization Policy: Cases from Zhejiang Province[J]. Cities, 2016, 55: 22-41 doi:  10.1016/j.cities.2016.03.012
    [30] Zhou X G, Chen Z F, Yeh A G, et al. Workplace Segregation of Rural Migrants in Urban China: A Case Study of Shenzhen Using Cellphone Big Data [J]. Environment and Planning B: Urban Analytics and City Science, 2021, 48(1): 25-42 doi:  10.1177/2399808319846903
    [31] Zheng Y, Liu F R, Hsieh H P. U-Air: When Urban Air Quality Inference Meets Big Data[C]//The 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Chicago, USA, 2013
    [32] Ließ M, Glaser B, Huwe B. Uncertainty in the Spatial Prediction of Soil Texture: Comparison of Regression Tree and Random Forest Models[J]. Geoderma, 2012, 170: 70-79 doi:  10.1016/j.geoderma.2011.10.010
    [33] Carranza E J M, Laborte A G. Data -Driven Predictive Mapping of Gold Prospectivity, Baguio District, Philippines: Application of Random Forests Algorithm[J]. Ore Geology Reviews, 2015, 71: 777-787 doi:  10.1016/j.oregeorev.2014.08.010
    [34] Chen W, Xie X S, Wang J L, et al. A Comparative Study of Logistic Model Tree, Random Forest, and Classification and Regression Tree Models for Spatial Prediction of Landslide Susceptibility[J]. Catena, 2017, 151: 147-160 doi:  10.1016/j.catena.2016.11.032
    [35] Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1): 5-32 doi:  10.1023/A:1010933404324
    [36] 吴辰文, 梁靖涵, 王伟, 等. 基于递归特征消除方法的随机森林算法[J]. 统计与决策, 2017(21): 60-63 https://www.cnki.com.cn/Article/CJFDTOTAL-DDKX202003009.htm

    Wu Chenwen, Liang Jinghan, Wang Wei, et al. Random Forest Algorithm Based on Recursive Feature Elimination[J]. Statistics & Decision, 2017(21): 60-63 https://www.cnki.com.cn/Article/CJFDTOTAL-DDKX202003009.htm
    [37] Mao Y, Xia Z, Yin Z, et al. Fault Diagnosis Based on Fuzzy Support Vector Machine with Parameter Tuning and Feature Selection[J]. Chinese Journal of Chemical Engineering, 2007, 15(2): 233-239 doi:  10.1016/S1004-9541(07)60064-0
    [38] Grömping U. Variable Importance Assessment in Regression: Linear Regression Versus Random Forest[J]. The American Statistician, 2009, 63(4): 308-319 doi:  10.1198/tast.2009.08199
    [39] 李秋萍, 刘逸诗, 巩诗瑶, 等. 基于居民出行活动特征的个体经济水平推断方法[J]. 武汉大学学报·信息科学版, 2019, 44(10): 1575-1580 doi:  10.13203/j.whugis20170426

    Li Qiuping, Liu Yishi, Gong Shiyao, et al. Individual Income Level Inference Method Based on Travel Behavior of Urban Residents[J]. Geomatics and Information Science of Wuhan University, 2019, 44 (10): 1575-1580 doi:  10.13203/j.whugis20170426
    [40] Tobler W R. A Computer Movie Simulating Urban Growth in the Detroit Region[J]. Economic Geography, 1970, 46(sup1): 234-240
    [41] Friedmann J. Regional Development Policy: A Case Study of Venezuela[J]. Urban Studies, 1966, 4(3): 309-311
    [42] 胡望舒, 孙威. 基于泰尔指数的北京市区域经济差异[J]. 中国科学院研究生院学报, 2013, 30(3): 353-360 https://www.cnki.com.cn/Article/CJFDTOTAL-ZKYB201303013.htm

    Hu Wangshu, Sun Wei. Regional Economic Disparity in Beijing Based on Theil Index[J]. Journal of Graduate University of Chinese Academy of Sciences, 2013, 30(3): 353-360 https://www.cnki.com.cn/Article/CJFDTOTAL-ZKYB201303013.htm
  • [1] 龚健雅, 张展, 贾浩巍, 周桓, 赵元昕, 熊汉江.  面向多源数据地物提取的遥感知识感知与多尺度特征融合网络 . 武汉大学学报 ● 信息科学版, 2022, 47(10): 1546-1554. doi: 10.13203/j.whugis20220580
    [2] 吴京航, 桂志鹏, 申力, 吴华意, 刘洪波, 李锐, 梅宇翱, 彭德华.  顾及格网属性分级与空间关联的人口空间化方法 . 武汉大学学报 ● 信息科学版, 2022, 47(9): 1364-1375. doi: 10.13203/j.whugis20200379
    [3] 程朋根, 岳琛.  多源数据支持下的城市生态环境评价及其与人类活动的关系 . 武汉大学学报 ● 信息科学版, 2022, 47(11): 1927-1937. doi: 10.13203/j.whugis20200382
    [4] 余婷婷, 董有福.  利用随机森林回归算法校正ASTER GDEM高程误差 . 武汉大学学报 ● 信息科学版, 2021, 46(7): 1098-1105. doi: 10.13203/j.whugis20190245
    [5] 杨腊梅, 贾永红.  利用多源数据确定季节性咸水湖湿地自然边界的方法 . 武汉大学学报 ● 信息科学版, 2020, 45(3): 419-425. doi: 10.13203/j.whugis20180207
    [6] 方志祥, 黄守倩, 苏荣祥, 肖和平.  高速公路多源数据融合下的层次拥堵区间探测方法 . 武汉大学学报 ● 信息科学版, 2020, 45(5): 682-690. doi: 10.13203/j.whugis20190117
    [7] 李秋萍, 刘逸诗, 巩诗瑶, 周素红, 卓莉, 陶海燕, 栾学晨.  基于居民出行活动特征的个体经济水平推断方法 . 武汉大学学报 ● 信息科学版, 2019, 44(10): 1575-1580. doi: 10.13203/j.whugis20170426
    [8] 魏雪梅.  多源数据支持下的森林地上生物量估算方法 . 武汉大学学报 ● 信息科学版, 2019, 44(9): 1385-1390. doi: 10.13203/j.whugis20190149
    [9] 胡凯龙, 刘清旺, 崔希民, 庞勇, 穆喜云.  多源遥感数据支持下的区域性森林冠层高度估测 . 武汉大学学报 ● 信息科学版, 2018, 43(2): 289-296, 303. doi: 10.13203/j.whugis20160066
    [10] 谷岩岩, 焦利民, 董婷, 王艳东, 许刚.  基于多源数据的城市功能区识别及相互作用分析 . 武汉大学学报 ● 信息科学版, 2018, 43(7): 1113-1121. doi: 10.13203/j.whugis20160192
    [11] 刘坚, 李树林, 陈涛.  基于优化随机森林模型的滑坡易发性评价 . 武汉大学学报 ● 信息科学版, 2018, 43(7): 1085-1091. doi: 10.13203/j.whugis20160515
    [12] 顾海燕, 闫利, 李海涛, 贾莹.  基于随机森林的地理要素面向对象自动解译方法 . 武汉大学学报 ● 信息科学版, 2016, 41(2): 228-234. doi: 10.13203/j.whugis20140102
    [13] 李宁, 张立华, 田震, 彭认灿.  一种基于多源数据的沿岸低潮面模型构建方法 . 武汉大学学报 ● 信息科学版, 2014, 39(5): 611-615. doi: 10.13203/j.whugis20120137
    [14] 孙杰, 赖祖龙.  利用随机森林的城区机载LiDAR数据特征选择与分类 . 武汉大学学报 ● 信息科学版, 2014, 39(11): 1310-1313.
    [15] 康志忠, 王薇薇, 李珍.  多源数据融合的三维点云特征面分割和拟合一体化方法 . 武汉大学学报 ● 信息科学版, 2013, 38(11): 1317-1321.
    [16] 李宁, 田震, 张立华, 彭认灿.  一种改进的潮滩数字高程模型构建方法 . 武汉大学学报 ● 信息科学版, 2013, 38(10): 1178-1183.
    [17] 武雪玲, 任福, 牛瑞卿.  多源数据支持下的三峡库区滑坡灾害空间智能预测 . 武汉大学学报 ● 信息科学版, 2013, 38(8): 963-968.
    [18] 李连营, 许小兰, 吴中恒, 周祖浩.  多源导航电子地图数据融合更新方法研究 . 武汉大学学报 ● 信息科学版, 2008, 33(4): 409-412.
    [19] 王宇, 杨丽萍, 任杰, 张静, 孔金玲, 侯成磊.  . 武汉大学学报 ● 信息科学版, 0, 0(0): 0-0. doi: 10.13203/j.whugis20220008
    [20] 毛丽君, 李明诗.  GEE环境下联合Sentinel主被动遥感数据的国家公园土地覆盖分类 . 武汉大学学报 ● 信息科学版, 0, 0(0): 0-0. doi: 10.13203/j.whugis20200633
  • 加载中
图(9) / 表(1)
计量
  • 文章访问数:  205
  • HTML全文浏览量:  74
  • PDF下载量:  36
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-06-04
  • 刊出日期:  2022-09-05

多源空间大数据场景下的家装品牌线下广告选址

doi: 10.13203/j.whugis20190468
    基金项目:

    国家重点研发计划 2019YFB2102903

    国家自然科学基金 41801306

    国家自然科学基金 41671408

    国家自然科学基金 41901332

    武汉大学测绘遥感信息工程国家重点实验室开放基金 18S01

    湖北省自然科学基金 2017CFA041

    浙江省自然科学基金 LY18D010001

    作者简介:

    张嘉琪,硕士生,主要研究方向为城市计算。ningzetaolover@cug.edu.cn

    通讯作者: 姚尧,博士,副教授。yaoy@cug.edu.cn
  • 中图分类号: P208

摘要: 合理进行线下广告牌投放位置的选择对商家宣传品牌以及扩大营销市场具有十分积极的作用。由于商业数据较难获取,以往研究多停留在宏观理论层面,未能对线下广告选址的实际布局进行细尺度分析。以北京为研究区,通过耦合某大型家装品牌线下广告到店转化率和路网、感兴趣点数据等表征地理特征和商业经济特征的多源空间数据,构建了基于随机森林的广告到店转化率预测模型(R2=0.758),得到该品牌连锁家装商店在北京市广告选址适宜性空间分布结果,并对各影响特征进行分析。研究结果表明:该家装品牌线下广告到店转化率在北京整体呈现“中心高、外围低”的格局,且存在较强的空间自相关和高值聚集现象;同时,线下广告到店转化率与社会经济、商业政治和人群活动等具有较强相关性,且对同一群体持续进行广告曝光的位置对到店转化率的影响较大。该结果可为线下广告牌布局和商业选址等相关研究提供参考依据和理论基础。

English Abstract

张嘉琪, 杜开虎, 任书良, 王瑞凡, 关庆锋, 陈文辉, 姚尧. 多源空间大数据场景下的家装品牌线下广告选址[J]. 武汉大学学报 ● 信息科学版, 2022, 47(9): 1406-1415. doi: 10.13203/j.whugis20190468
引用本文: 张嘉琪, 杜开虎, 任书良, 王瑞凡, 关庆锋, 陈文辉, 姚尧. 多源空间大数据场景下的家装品牌线下广告选址[J]. 武汉大学学报 ● 信息科学版, 2022, 47(9): 1406-1415. doi: 10.13203/j.whugis20190468
ZHANG Jiaqi, DU Kaihu, REN Shuliang, WANG Ruifan, GUAN Qingfeng, CHEN Wenhui, YAO Yao. Site Selection of Outdoor Advertisement for Home Decoration Brands Based on Multi-source Spatial Big Data[J]. Geomatics and Information Science of Wuhan University, 2022, 47(9): 1406-1415. doi: 10.13203/j.whugis20190468
Citation: ZHANG Jiaqi, DU Kaihu, REN Shuliang, WANG Ruifan, GUAN Qingfeng, CHEN Wenhui, YAO Yao. Site Selection of Outdoor Advertisement for Home Decoration Brands Based on Multi-source Spatial Big Data[J]. Geomatics and Information Science of Wuhan University, 2022, 47(9): 1406-1415. doi: 10.13203/j.whugis20190468
  • 线下广告包括可以提供线下曝光的多媒体形式,如图片、文字和口头对话等[1],它们的重要特性是能够吸引目标用户群体的注意[2]。在竞争日益激烈的市场,企业为了增加产品的曝光率和品牌影响力,将线下媒体这种重要的媒体形式作为优先选择的对象[3]。为了最大限度地提高线下广告的效率,广告应该有针对性,即在适当的时间以适当的形式向适当的人提供适当的内容[4]。线下广告的成功与许多因素有关,如位置选择、内容设计、可见度,其中位置选择是最重要的因素[5]

    目前,线下广告的位置选择无法满足消费者的地理集中度及购物需求,并未广泛应用于企业及市场[1];同时,公共压力和政府监管也使得线下广告的投放量大幅减少,导致商家对线下广告所带来的经济效益提出质疑[6]。因此,选择合理的线下广告位置,不仅可以避免盲目投放的浪费,而且对商家产品销售和品牌宣传都会产生积极的影响。

    许多学者对线下广告的选址布局进行了相关研究。传统的线下广告选址多基于调查数据和经典条件作用进行线下广告和变量间的相关性研究。如Patel等[7]通过问卷调查发现线下广告的影响与性别等有关;Cantrell等[8]则通过烟草广告的调查数据研究广告与社区人口、烟草价格等的相关性。此外,随着空间统计学的发展,许多学者将广告位置和区域与购买人群相联系,如Rosewarne[9]探讨了线下广告内容与区域的空间特征间的相关性;Wilson等[6]研究和分析了广告位置对人们购买意愿的影响。

    早期的研究方式往往依赖于主观记忆,而主观记忆可能会因时间而被扭曲,并且有些研究数据需要专业机构进行采集,费时费力,灵活性较低[1011]。信息技术的发展和多源空间数据的出现,使得线下广告选址布局的相关研究有了新的思路。如Liu等[5]基于大规模出租车全球定位系统(global positioning system,GPS)轨迹,通过可视化分析进行广告牌位置选择;Anagnostopoulos等[12]利用社交媒体Twitter数据挖掘用户兴趣来进行广告牌选址研究;Huang等[10]耦合用户手机上网数据和位置数据进行了线下广告选址布局相关研究。但这些研究存在的问题是数据的有效性低导致研究的空间尺度较大,无法进行精细尺度的分析。由于缺乏数据和模型,大多研究只考虑影响广告效果的因素和用户兴趣,未能对线下广告实际布局和产生的效果进行更进一步的探讨。对此,本文首先利用某移动应用程序跟踪人口位置信息,获取到某大型家装品牌广告到店转化率数据;然后,结合表征地理和商业经济特征的多源空间数据,基于随机森林模型构建一个有效的数据挖掘框架;最后,预测得到研究区内精细尺度的线下广告到店转化率,并对线下广告选址的影响因子进行分析。

    • 北京市地处中国华北地区,是中国的首都及政治、文化中心,总面积16 410.540 km2,常住人口215 420 000人。北京市共有16‍个市辖区,包括中心主城区(东城区、西城区、海淀区、朝阳区、丰台区)、近郊区(大兴区、通州区、顺义区、昌平区、门头沟区、石景山区、房山区)、远郊区(怀柔区、平谷区、密云区、延庆区)[13],如图 1所示。

      图  1  北京市遥感影像

      Figure 1.  Remote Sensing Image of Beijing

      由于政府支持、国家政策等因素,北京市下辖各区经济发展水平存在差异,较为发达的辖区主要分布在中心主城区。以2017年为例,5个中心主城区的地区生产总值之和约占当年全市生产总值的68%[14]

    • 到店转化率是本文最重要的数据。该数据集来自一款移动应用程序,在北京市用户渗透率达80%以上,保证了数据的可靠性[15]。该应用程序根据用户隐私协议采集用户的位置信息。若用户见到广告牌并于3个月内至广告牌所属店内消费,则该用户被判定为广告转化成功用户。转化成功用户和看到广告牌的用户数量比例即为本文采用的到店转化率数据。

      针对原始到店转化率数据与研究区域网格间不完全重合,本文对数据进行重采样处理,得到网格化后的转化率数据集。针对采集的到店转化率数据是连续数值且存在冗余过高、部分区域异常的问题,本文通过对数据进行标准差等级划分来进行离散化处理[16]

      设研究区内每个网格内到店转化率的平均值和标准差分别为μσ,在数据预处理中,为了保证数据的可靠性,删除低于μ-3σ或者高于μ+3σ的样本数据[17],并将到店转化率数据进行归一化。北京市该家装品牌到店转化率的空间分布情况如图 2所示。

      图  2  北京市某家装品牌到店转化率分布

      Figure 2.  Distribution of the In‐Store Conversion Rate of a Home Decoration Brand in Beijing

      除到店转化率外,本文用到的多源空间大数据还包括道路网数据、感兴趣点(point of inter‍est,POI)数据、房价数据及其他基础地理数据。北京市道路网数据来源于OSM(OpenStreetMap)网站(https://www.openstreetmap.org/)。OSM数据库存储了巨大的环境空间数据集,其中包含了非常丰富的元数据,覆盖了世界上的主要城市[18]。本文在对原始OSM数据集进行清洗后,提取出一级公路、二级公路和三级公路3个类别。图 3为北京市OSM路网分布。

      图  3  北京市OSM路网

      Figure 3.  OSM Road Network Distribution in Beijing

      POI是指具有地理标识的空间特征物,包含名称、类别、经纬度等信息,是空间大数据分析的基础性数据。POI信息是数据供应商通过实地调查采集的,信息丰富而准确,更新及时[19]。本文所使用的POI数据来自中国最大的地图服务商之一高德地图(https://lbs.amap.com/)。共获取到701 494条高德POI记录,包括公司企业、餐饮服务、购物服务、交通设施、金融服务、科教文化、汽车服务、汽车维修、汽车销售、商务住宅、生活服务、体育休闲、停车场、政府机构、商场专卖店15种类别。采用核密度估计法计算离散点在周边邻域内的密度[20],使得研究对象密度呈现空间连续的变化[21],生成相应密度数据集,能够表达POI的分布模式和分布密度等特征[22]图 4显示了这15类POI数据的核密度分布情况。

      图  4  北京市各类POI核密度分布

      Figure 4.  Kernel Density Distribution of All Kinds of POIs in Beijing

      北京市房价数据来源于中国最大的在线住宅市场网站房天下(https://www.fang.com/)。房价和收入被认为是由稳定的长期关系联系在一起的,在中国城市住宅市场中,城市房价与城市平均收入水平正相关,城市居民的劳动收入水平越高,或者城市生活质量越好,城市的房价就会越高[2324]。在对原始数据进行清理后,采用反距离加权插值法对原始房价进行插值[25]图 5为北京市平均房价分布。

      图  5  北京市平均房价分布

      Figure 5.  Average Housing Price Distribution in Beijing

    • 本文基于随机森林模型挖掘多源空间数据与线下广告到店转化率间的相关关系,得到研究区内的线下广告到店转化率模拟结果作为广告选址适宜性,对各影响特征的重要程度和结果进行分析。在多源空间数据影响特征集的选择上,参考了Yao等[26]及Guo等[27]在商业店铺选址中所使用到的特征数据集,包括对应位置的居民属性和商业经济属性两个方面,共选取了包括路网数据、POI数据和基础地理数据共19个空间变量作为影响特征集。前人研究表明,将研究区进行网格级别的划分能够轻松地聚合或分解多源数据,促进了数据集成[28],同时能够对研究区不同位置的比较提供统一的尺度[29]。采用了Zhou等[30]和Zheng等[31]在研究中使用的1 km×1 km的网格分辨率,该网格划分能够同时避免因网格太小而没有足够特征,以及网格太大而导致研究过于粗糙的问题。本文相关技术路线见图 6

      图  6  本文技术路线

      Figure 6.  Technology Frame of This Study

    • 本文基于随机森林模型,刻画线下广告到店转化率与对应位置的地理特征及商业经济特征间的复杂相关关系。随机森林是广泛用于文献和应用领域的一种集成学习方法。前人的研究证明,随机森林模型用于空间分布预测研究具有很好的效果,与其他预测模型相比精度更高[3234]。随机森林模型在训练过程中采用的是Bootstrap重新抽样的方法,从原始样本中抽取多个样本,对每个Bootstrap样本构建决策树,将所有决策树的预测平均值作为最终预测结果[35]。随机森林模型具体的构建过程如图 7所示。

      图  7  随机森林模型构建流程

      Figure 7.  Construction Process of Random Forest Model

      在构建模型时,一些不相关的变量可能会对模型预测精度产生负面影响。变量选择技术也称特征选择,能够消除不相关的变量,达到模型精度改进的效果,规避过拟合现象[36]。递归特征消除法是用一个准则来消除特征的循环过程,包括3个步骤:(1)训练分类器;(2)计算排序准则;(3)去除排序得分最小的特征[37]

      将商家店铺位置与OSM路网叠加,计算其到道路的最近欧氏距离,并与1 km×1 km的空间网格匹配,得到道路距离特征数据集。其余特征集均与1 km×1 km的细尺度网格进行匹配,其中POI数据、房价数据分别以网格内的核密度和平均房价作为影响特征集。通过递归特征消除法建立基模型进行多轮训练,从多源空间数据集中构建出19类特征集,分别为公司企业密度、餐饮服务密度、购物服务密度、交通设施密度、金融服务密度、科教文化密度、汽车服务密度、汽车维修密度、汽车销售密度、商务住宅密度、生活服务密度、体育休闲密度、停车场密度、政府机构密度、房价、路网、道路距离、商场专卖店密度和人口流动。

    • 变量在回归中的重要性是应用统计学中的重要课题。随机森林模型能够处理大量变量并且提供对变量重要性的评估[3839]。随机森林模型进行变量重要性评估具体过程如下:每个采样集建立一棵回归决策树,用袋外数据(out of bag,OOB)测试集来预测,得到OOB残差均方差(mean squared error,MSE);变量xib个OOB样本中随机置换形成一个新的OOB集合,用已经建立的随机森林对新的OOB进行测试,得到随机置换后的OOB残差均方差MSEij,生成矩阵A为:

      A=MSE11MSE1bMSEp1MSEpb

      式中,p为影响因素变量个数;b为样本个数。变量xi的重要性评分Scorei可表示为:

      Scorei=j=1nMSEj-MSEij/b/SE

      式中,1ipMSEj为第j个样本的残差均方差;SE为标准误差。

    • 本文基于多源空间数据进行线下广告选址的适宜性制图,为了反映线下广告到店转化率空间化模型的精度水平,分别采用拟合优度(R2)、均方根误差(root mean square error,RMSE)和平均绝对误差(mean absolute error,MAE)3种精度评价指标,将模型预测的广告到店转化率结果和实际情况进行对比来定量评估模型的准确性。评价指标的计算公式如下:

      RMSE=1mi=1myi-y̑i2MAE=1mi=1myi-y̑iR2=1-i=1my̑i-yi2i=1my¯-yi2

      式中,yiy̑i分别是第i个样本广告到店转化率的实际和预测值;y¯为样本广告到店转化率真实值的平均值;m是研究区域内的总样本数量。

    • 本文以北京市某家装品牌线下广告到店转化率作为因变量,公司企业、交通设施等19个影响因子作为协变量,构建基于随机森林的该家装品牌线下广告到店转化率拟合模型。对北京市进行网格化,得到180×220个1 km×1 km网格,并对相应数据进行预处理共得到20 871组样本,随机划分为80%的训练数据和20%的验证数据。通过20次随机训练和预测,将北京市某家装品牌广告选址适宜性结果与真实有效广告到店转化率数据进行对比分析,进行准确性评估。结果具有较高的整体精度,R2为0.758,MAE为0.099,RMSE为0.018,表明预测值和实际值的差异小且相关程度高,预测精度较高,模型的预测效果较好。本文所提出的方法能够有效地挖掘多源空间大数据与该家装品牌线下广告到店转化率之间的关系,能够为线下广告选址适宜性的评估提供参考。

    • 将提取的北京市特征数据利用该模型拟合,得到北京市某家装品牌线下广告到店转化率预测结果,线下广告选址适宜性制图结果见图 8

      图  8  北京市某家装品牌线下广告选址适宜性制图结果

      Figure 8.  Site Suitability Results of Outdoor Advertising in Beijing

      地理学第一定律表明,所有事物都与其他事物相关,但是近处的事物比远处的事物更相关[40]。为了研究广告牌位置选择与地理位置间是否具有相关性,本文对模型得到的家装品牌线下广告到店转化率引入空间自相关分析,计算得到全局莫兰指数(Moran's I)为0.641,对应的p值为0.000,z得分为93.584。p值小于0.01表明具有统计学上的显著性,z得分远大于对应的临界值2.58,说明该家装品牌线下广告到店转化率呈现集聚现象,全局Moran's I大于0.6则表明存在明显的空间正相关。为进一步研究分布是否存在高/低值聚类的现象,得到高/低聚类指数,对应的p值和z得分分别为0.000和92.368,表明具有统计学上的显著性。高/低聚类指数的观测值(0.001) > 其期望值(0.000),说明该家装品牌线下广告到店转化率存在高值区域聚类的现象。

      上述分析结果表明,该家装品牌线下广告到店转化率的分布存在较强的空间正相关特征,呈现明显的高值聚集现象。从图 8可以发现,该家装品牌线下广告到店转化率的空间分布整体呈现“中心高、外围低”的格局,对应的中心处呈现高值聚集现象。这和地区实际经济情况符合,转化率高的区域主要位于北京市的中心主城区以及近郊区内靠近主城区的区域,而外围的远郊区和近郊区内远离中心城区的区域内转化率则较低,并且高低分界与北京市环线基本一致。

      弗里德曼的中心‐外围模式认为可以将区域的经济系统划分为中心和外围两部分[41]。中心区发展条件较优越,经济效益较高,处于支配地位,而外围区发展条件较差,经济效益较低,处于被支配地位,北京也是如此。2018年的统计数据显示,2017年北京市5个中心主城区的地区生产总值之和约占当年全市生产总值的68%,而远郊区仅占3%[14]

      从空间分布上看,由于自然地理条件不同、政府资源配置差异和部分区县优势产业[42],北京的经济发展差异较大。环线内经济发展良好,交通发达,人流量巨大,金融业高度聚集在北京中心城区的核心地带,并且聚集程度持续提升,科技、信息等生产者服务业也高度集中于中心圈层,如海淀区的东南部集中了较多的大型公司企业(包括百度大厦、中软国际、字节跳动等多家大型公司),这对商业发展和经济发展十分有利。

      为了进一步验证分析,本文选取了几个精细尺度区域(包括中心城区海淀区、近郊区房山区以及远郊区怀柔区)进行分析,如图 9所示。

      图  9  北京市典型区域的线下广告选址适宜性

      Figure 9.  Site Suitability Results of Outdoor Advertising in Typical Areas in Beijing

      图 9可以看出,3个区域的家装品牌广告到店转化率符合整体“中心高、外围低”的格局。其中,海淀区中关村软件园处,转化率较高。从地理位置上看,中关村软件园一带是由商务区和研发区组成的中国著名软件基地,园区东临上地信息产业基地,南靠规划绿化带及北大生物城,园区的边缘东南两侧建有软件广场、信息中心、孵化器、体育场馆、宾馆、公寓等配套设施,各种基础设施配套齐全。房山区的万科半岛广场虽然非物质文化遗产丰富,传统文化历史氛围浓厚,但地方人民政府注重于打造社区文化品牌,忽视了公司企业、交通设施等的发展,整体上经济水平稍显不足,广告到店转化率较低;而怀柔区的滨河公园以林地、绿地为主体,各类设施配置存在着明显的不足,广告到店转化率更低。

    • 通过制图直观地掌握广告选址的适宜性并进行定性分析后,还需要进一步对线下广告到店转化率的各驱动因素进行定量分析。模型给出的各变量重要性评估如表 1所示,值越大,表明该变量对广告到店转化率的影响越大。

      表 1  特征重要性排序

      Table 1.  Ranking of Feature Importance

      特征因子 特征来源 影响因子值
      公司企业 POI 0.424
      交通设施 POI 0.104
      购物服务 POI 0.089
      人口流动 社会经济数据 0.052
      停车场 POI 0.051
      政府机构 POI 0.029
      房价 社会经济数据 0.027
      商务住宅 POI 0.025
      路网 基础地理数据 0.023
      汽车维修 POI 0.022
      汽车销售 POI 0.022
      道路距离 基础设施数据 0.021
      金融服务 POI 0.019
      科教文化 POI 0.019
      汽车服务 POI 0.016
      商场专卖店 POI 0.016
      餐饮服务 POI 0.016
      生活服务 POI 0.014
      体育体闲 POI 0.011

      表 1可以看出,基于随机森林模型构建的线下广告选址适宜性评估方法中,社会经济、商业政治和人群活动较为重要。其中,重要性最高的特征为公司企业(0.424),广告选址适宜性空间分布的结果也证明了这一点。企业分布较多的区域人口密度相对较大,并且从接触广告的持续性来看,企业分布地是一个可以对工作群体进行长期固定宣传的区域。这增加了线下广告对企业工作人群的曝光度,更容易强化广告的宣传效果。同时,企业较多的区域也有很大的商业潜力,这为广告宣传转化为顾客到店提供了更大的可能。交通设施、购物服务的影响程度分别排在第2位(0.104)、第3位(0.089),两个特征集从侧面反映了社会经济水平以及基础设施建设水平,并且交通设施和购物服务场所往往人流量较大,受众较多,这与重要性程度紧随其后的人口流动(0.052)形成呼应。影响程度较小的因素,如生活服务(0.014)和体育休闲(0.011),这类场所多有特定的功能,无法对某一群体进行长期固定的宣传,广告转化效果较差。

      可以得出,在进行线下广告选址或商业选址时,除了地理区位上的商业聚集区域和人群活动活跃区域,还应关注广告位置的持续影响时间效果。公司企业这种既满足商业经济发达区位条件,又可以对工作群体进行持续宣传的位置能够强化广告宣传效果,提升广告的到店转化率,更好地发挥线下广告的作用。

    • 以往对线下广告的研究由于缺乏数据和模型,未能对选址的实际布局进行精细尺度分析,同时也未能发现商家的经济效益与地块属性之间的相关性。针对数据和模型缺乏问题,本文耦合多源空间数据,构建了基于多源空间大数据的线下广告到店转化率拟合模型,并对北京市某家装品牌进行线下广告选址适宜性评估。提出的方法有效地融合了自然地理特征和社会经济特征,具有较高的拟合精度(R2=0.758),能够准确地反映出北京市该家装品牌线下广告选址适宜性的空间分布差异。

      驱动因素的重要性分析表明,地理位置因素对线下广告选址有着非常重要的作用,社会经济、商业政治和人群活动对线下广告到店转化率的影响较大。此外,广告位置对固定人群的持续影响也很重要。公司企业这种能够对某一群体持续曝光宣传的位置能够强化广告宣传效果,提升广告的到店转化率。同时,线下广告选址适宜性制图结果说明北京市环线内该家装品牌线下广告到店转化率整体较高,并且存在明显的高值聚集现象,进一步说明了社会经济发展和地理位置对线下广告选址的适宜性有很大的影响。

      本文以某大型家装品牌为例,将广告到店转化率应用于线下广告的选址研究中,能够定量评估各位置的广告效果,为线下广告的选址布局提供决策支持,使广告的效益最大化。本文结果可为其他行业或品牌的广告选址提供一定参考,但本文所用重要数据源(该家装品牌的线下广告到店转化率)存在行业间偏差,且不同行业的广告选址影响特征还应适当考虑行业独特性。不同行业的客户受众、企业选址偏好和相应的竞争品牌也存在一定差异。这是今后需要考虑的重点。因此后续还需针对其他品牌或者行业的线下广告进行进一步研究,以得到更为普适的模型和结果。

      此外,本文中多源空间数据集的类型仍不完备,由于城区和郊区的社会经济和人群活动因素存在差异,可能会造成在缺少数据的郊区区域模型拟合精度不高。因此,后续研究将引入迁移学习模型,将城区和郊区的共性和区域性特征提取构建迁移模型[26],力求得到更高精度的模型,为线下广告的选址提供更加精确的参考。

参考文献 (42)

目录

    /

    返回文章
    返回