留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

融合线上线下轨迹的景观热度评价

唐炉亮 邹倩倩 张霞 任畅 李清泉

唐炉亮, 邹倩倩, 张霞, 任畅, 李清泉. 融合线上线下轨迹的景观热度评价[J]. 武汉大学学报 ● 信息科学版, 2018, 43(11): 1704-1711. doi: 10.13203/j.whugis20170043
引用本文: 唐炉亮, 邹倩倩, 张霞, 任畅, 李清泉. 融合线上线下轨迹的景观热度评价[J]. 武汉大学学报 ● 信息科学版, 2018, 43(11): 1704-1711. doi: 10.13203/j.whugis20170043
TANG Luliang, ZOU Qianqian, ZHANG Xia, REN Chang, LI Qingquan. Online and Offline Trajectory Data Fusion and Evaluation of Landscape Attractions[J]. Geomatics and Information Science of Wuhan University, 2018, 43(11): 1704-1711. doi: 10.13203/j.whugis20170043
Citation: TANG Luliang, ZOU Qianqian, ZHANG Xia, REN Chang, LI Qingquan. Online and Offline Trajectory Data Fusion and Evaluation of Landscape Attractions[J]. Geomatics and Information Science of Wuhan University, 2018, 43(11): 1704-1711. doi: 10.13203/j.whugis20170043

融合线上线下轨迹的景观热度评价

doi: 10.13203/j.whugis20170043
基金项目: 

国家重点研发计划 2017YFB0503604

国家自然科学基金 41671442

国家自然科学基金 41571430

国家自然科学基金 41271442

详细信息
    作者简介:

    唐炉亮, 博士, 教授, 主要从事时空GIS、大数据知识挖掘与时空建模、交通地理GIS-T。tll@whu.edu.cn

    通讯作者: 邹倩倩, 硕士。zqq77@whu.edu.cn
  • 中图分类号: P208

Online and Offline Trajectory Data Fusion and Evaluation of Landscape Attractions

Funds: 

The National Key Research and Development Program of China 2017YFB0503604

the National Natural Science Foundation of China 41671442

the National Natural Science Foundation of China 41571430

the National Natural Science Foundation of China 41271442

More Information
    Author Bio:

    TANG Luliang, PhD, professor, specializes in spatio-temporal GIS, big data mining & spatio-temporal modeling and GIS for tansportation geography.E-mail:tll@whu.edu.cn

    Corresponding author: ZOU Qianqian, master.E-mail:zqq77@whu.edu.cn
  • 摘要: 人们在线上网络空间和线下现实空间活动时, 会产生大量线上线下的痕迹(轨迹), 这种轨迹作为一种讯息会影响其他人的活动。现有研究大多单一地采用问卷调查、网络数据、GPS轨迹等方法, 忽略了移动互联时代线上线下空间活动的关联性以及历史活动足迹对日后活动的影响。基于对搜索量、签到和照片等网络大数据与线下GPS轨迹大数据的融合, 对人们线上线下活动进行时空行为模式分析, 建立基于信息素和回归分析的计算模型, 实现了对景观休憩空间的吸引力评价。以采样接近5 a的181个用户轨迹数据及相应时间段的网络大数据, 对北京28个景观进行实验, 并与单一线上或线下数据的研究方法进行比较, 结果表明所提方法不仅综合体现了景观热度, 且能够对未来的潜在游憩价值进行估计。
  • 图  1  信息素释放特点示意图

    Figure  1.  Diagram of Characteristic of the Pheromone Releasing Mechanism

    图  2  信息素影响未来到访率

    Figure  2.  Effects of Pheromone on Future Visitors

    图  3  Logistic回归结果

    Figure  3.  Logistic Regression Results

    图  4  不同挥发系数的回归效果

    Figure  4.  Regression Results with Different Volatility Coefficients

    图  5  实际来访率与模型拟合对比图

    Figure  5.  Comparison Between Actual Visiting Rate and Model Fitting Result

    图  6  热门游憩地的空间分布

    Figure  6.  Spatial Distribution of Popular Locations

    表  1  权重系数确定

    Table  1.   Determination of Weight Coefficients

    模型 相关性 标准化系数 显著性
    常量 - - 0.712(不显著)
    线上 0.664 0.415 0.016
    线下 0.684 0.459 0.008
    注:显著性表示小于0.05的显示数据分析具有统计学意义
    下载: 导出CSV

    表  2  不同方法拟合效果对比

    Table  2.   Comparison of Regression Results with Different Methods

    数据 拟合度R2
    基于线下轨迹数据 0.488
    基于线上网络数据 0.441
    融合模型 0.589
    下载: 导出CSV

    表  3  基于信息素思想的北京市景观热度评价

    Table  3.   Popularity Evaluation of Landscapes in Beijing Based on Pheromone

    排名 景观 评价结果 网络热度
    1 圆明园 101.114 90 5
    2 颐和园 95.591 89 4
    3 奥林匹克公园 79.359 68 1
    4 天坛公园 71.678 62 6
    5 故宫 70.964 30 2
    6 北京欢乐谷 64.316 67 11
    7 玉渊潭公园 63.256 01 17
    8 长城 61.027 03 3
    9 香山公园 60.945 09 14
    10 什刹海公园 60.810 20 8
    下载: 导出CSV
  • [1] Di Feng, Yang Zhaoping, Liu Xuling, et al.Estimation on Aesthetic Value of Tourist Landscapes in a Natural Heritage Site:Kanas National Nature Reserve, Xinjiang, China[J].Chinese Geographical Science, 2010, 20(1):59-65 doi:  10.1007/s11769-010-0059-3
    [2] Otero P I, Casermeiro Martínez M A, Ezquerra C A, et al.Landscape Evaluation:Comparison of Evaluation Methods in a Region of Spain[J].Journal of Environmental Management, 2007, 85(1):204-214
    [3] 袁烽.都市景观评价方法研究[J].城市规划汇刊, 1999(6):46-49, 57 doi:  10.3969/j.issn.1000-3363.1999.06.010

    Yuan Feng.Research on the Evaluation Method of Urban Landscape[J].Urban Planning Forum, 1999(6):46-49, 57 doi:  10.3969/j.issn.1000-3363.1999.06.010
    [4] 李芬, 孙然好, 陈利顶.北京城市公园湿地的休憩吸引力评价[J].应用生态学报, 2012, 23(8):2093-2099 http://d.old.wanfangdata.com.cn/Periodical/yystxb201208010

    Li Fen, Sun Ranhao, Chen Liding.Recreational Attraction of Urban Park Wetlands in Beijing[J].Chinese Journal of Applied Ecology, 2012, 23(8):2093-2099 http://d.old.wanfangdata.com.cn/Periodical/yystxb201208010
    [5] Quercia D, Schifanella R, Aiello L M.The Shortest Path to Happiness: Recommending Beautiful, Quiet, and Happy Routes in the City[C].The 25th ACM Conference on Hypertext and Social Media, New York, USA, 2014
    [6] 张霞, 赵玮丹, 江文萍, 等.基于网络热度的道路景观评价与最美路径推荐[J].同济大学学报(自然科学版), 2016, 44(3):383-388 http://d.old.wanfangdata.com.cn/Periodical/tjdxxb201603008

    Zhang Xia, Zhao Weidan, Jiang Wenping, et al.Road Landscape Evaluation and the Most Beautiful Route Planning Based on Big Website Data[J].Journal of Tongji University (Natural Science), 2016, 44(3):383-388 http://d.old.wanfangdata.com.cn/Periodical/tjdxxb201603008
    [7] 李君轶, 唐佳, 冯娜.基于社会感知计算的游客时空行为研究[J].地理科学, 2015, 35(7):814-821 http://www.cnki.com.cn/Article/CJFDTOTAL-DLKX201507002.htm

    Li Junyi, Tang Jia, Feng Na.Tourists' Spatio-Temporal Behavior Based on Socially Aware Computing[J].Scientia Geographica Sinica, 2015, 35(7):814-821 http://www.cnki.com.cn/Article/CJFDTOTAL-DLKX201507002.htm
    [8] Zheng Y, Zhang L, Xie X, et al.Mining Interesting Locations and Travel Sequences from GPS Trajectories[C].The 18th International Conference on World Wide Web, Madrid, Spain, 2009
    [9] Chen Y Y, Cheng A J, Hsu W H.Travel Recommendation by Mining People Attributes and Travel Group Types from Community-Contributed Photos[J].IEEE Transactions on Multimedia, 2013, 15(6):1283-1295 doi:  10.1109/TMM.2013.2265077
    [10] Subramaniyaswamy V, Vijayakumar V, Logesh R, et al.Intelligent Travel Recommendation System by Mining Attributes from Community Contributed Photos[J].Procedia Computer Science, 2015, 50:447-455 doi:  10.1016/j.procs.2015.04.014
    [11] Kisilevich S, Mansmann F, Keim D.P-DBSCAN: A Density Based Clustering Algorithm for Exploration and Analysis of Attractive Areas Using Collections of Geo-tagged Photos[C].International Conference and Exhibition on Computing for Geospatial Research & Application, Washington D C, USA, 2010
    [12] 朱鹤, 刘佳明, 陶慧, 等.基于网络信息的北京市旅游资源吸引力评价及空间分析[J].自然资源学报, 2015, 30(12):2081-2094 doi:  10.11849/zrzyxb.2015.12.010

    Zhu He, Liu Jiaming, Tao Hui, et al.Evaluation and Spatial Analysis of Tourism Resources Attraction in Beijing Based on the Internet Information[J].Journal of Natural Resources, 2015, 30(12):2081-2094 doi:  10.11849/zrzyxb.2015.12.010
    [13] 马丽君, 孙根年, 黄芸玛, 等.城市国内客流量与游客网络关注度时空相关分析[J].经济地理, 2011, 31(4):680-685 http://d.old.wanfangdata.com.cn/Periodical/jjdl201104026

    Ma Lijun, Sun Gennian, Huang Yunma, et al.A Correlative Analysis on the Relationship Between Domestic Tourists and Network Attention[J].Economic Geography, 2011, 31(4):680-685 http://d.old.wanfangdata.com.cn/Periodical/jjdl201104026
    [14] 柴彦威, 申悦, 肖作鹏, 等.时空间行为研究动态及其实践应用前景[J].地理科学进展, 2012, 31(6):667-675 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=QK201202036748

    Chai Yanwei, Shen Yue, Xiao Zuopeng, et al.Review for Space-Time Behavior Research:Theory Frontiers and Application in the Future[J].Progress in Geography, 2012, 31(6):667-675 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=QK201202036748
    [15] Ahas R, Aasa A, Mark U, et al.Seasonal Tourism Spaces in Estonia:Case Study with Mobile Positioning Data[J].Tourism Management, 2007, 28(3):898-910 doi:  10.1016/j.tourman.2006.05.010
    [16] 李婷, 裴韬, 袁烨城.人类活动轨迹的分类、模式和应用研究综述[J].地理科学进展, 2014, 33(7):938-948 http://d.old.wanfangdata.com.cn/Periodical/dlkxjz201407009

    Li Ting, Pei Tao, Yuan Yecheng, et al.A Review on the Classification, Patterns and Applied Research of Human Mobility Trajectory[J].Progress in Geography, 2014, 33(7):938-948 http://d.old.wanfangdata.com.cn/Periodical/dlkxjz201407009
    [17] Cord A F.Geocaching Data as an Indicator for Recreational Ecosystem Services in Urban Areas:Exploring Spatial Gradients, Preferences and Motivations[J].Landscape & Urban Planning, 2015, 144:151-162 https://www.sciencedirect.com/science/article/pii/S0169204615001863
    [18] 李山, 邱荣旭, 陈玲.基于百度指数的旅游景区网络空间关注度:时间分布及其前兆效应[J].地理与地理信息科学, 2008, 24(6):102-107 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=dlxygtyj200806025

    Li Shan, Qiu Rongxu, Chen Ling.Cyberspace Attention of Tourist Attractions Based on Baidu Index:Temporal Distribution and Precursor Effect[J].Geography and Geo-Information Science, 2008, 24(6):102-107 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=dlxygtyj200806025
    [19] 王守成, 郭风华, 傅学庆.基于自发地理信息的旅游地景观关注度研究—以九寨沟为例[J].旅游学刊, 2014, 29(2):84-92 doi:  10.3969/j.issn.1002-5006.2014.02.009

    Wang Shoucheng, Guo Fenghua, Fu Xueqing, et al.A Study of the Spatial Patterns of Tourist Sightseeing Based on Volunteered Geographic Information:The Case of the Jiuzhai Valley[J].Tourism Tribune, 2014, 29(2):84-92 doi:  10.3969/j.issn.1002-5006.2014.02.009
    [20] Dorigo M, Maniezzo V, Colorni A.The Ant System:Optimization by a Colony of Cooperating Agents[J].IEEE Transactions on Systems, Man and Cybernetics-Part B, 1996, 26(1):1-13 https://ci.nii.ac.jp/naid/80008849520
    [21] Czepiel S A.Maximum Likelihood Estimation of Logistic Regression Models: Theory and Implementation[EB/OL].http://www.czep.net/stat/mlelr.pdf, 1996
    [22] Gordon T.Hazards in the Use of the Logistic Function with Special Reference to Data from Prospective Cardiovascular Studies[J].Journal of Chronic Di-seases, 1974, 27(3):97-102 doi:  10.1016/0021-9681(74)90078-2
    [23] 祝昊冉, 冯健.北京城市公园的等级结构及其布局研究[J].城市发展研究, 2008, 15(4):76-83 doi:  10.3969/j.issn.1006-3862.2008.04.013

    Zhu Haoran, Feng Jian.The Hierarchy and Distribution of City Park in Beijing[J].Urban Development Studies, 2008, 15(4):76-83 doi:  10.3969/j.issn.1006-3862.2008.04.013
    [24] Kang J H, Welbourne W, Stewart B, et al.Extracting Places from Traces of Locations[C].The 2nd ACM International Workshop on Wireless Mobile Applications and Services on Wlan Hotspots, Philadelphia, PA, USA, 2004
    [25] Siłanowicka K, Vandrol J, Oshan T, et al.Analysis of Human Mobility Patterns from GPS Trajectories and Contextual Information[J].International Journal of Geographical Information Science, 2016, 30(5):881-906 doi:  10.1080/13658816.2015.1100731
  • [1] 朱建军, 宋迎春, 胡俊, 邹滨, 吴立新.  测绘大数据时代数据处理理论面临的挑战与发展 . 武汉大学学报 ● 信息科学版, 2021, 46(7): 1025-1031. doi: 10.13203/j.whugis20210232
    [2] 王圣音, 高勇, 陆锋, 刘瑜.  场所模型及大数据支持下的场所感知 . 武汉大学学报 ● 信息科学版, 2020, 45(12): 1930-1941. doi: 10.13203/j.whugis20200491
    [3] 朱晓寒, 李向阳, 刘昭阁.  大数据环境下城市内涝灾害的情景维度模型构建 . 武汉大学学报 ● 信息科学版, 2020, 45(11): 1818-1828. doi: 10.13203/j.whugis20190225
    [4] 刘涛, 张晓辉, 杜萍, 杜清运, 李爱勤, 龚丽芳.  文本大数据中地震应急的知识发现方法 . 武汉大学学报 ● 信息科学版, 2020, 45(8): 1205-1213. doi: 10.13203/j.whugis20200106
    [5] 刘纪平, 董春, 亢晓琛, 邱士可, 赵荣, 栗斌, 孙立坚.  大数据时代的地理国情统计分析 . 武汉大学学报 ● 信息科学版, 2019, 44(1): 68-76, 83. doi: 10.13203/j.whugis20180420
    [6] 张兵.  遥感大数据时代与智能信息提取 . 武汉大学学报 ● 信息科学版, 2018, 43(12): 1861-1871. doi: 10.13203/j.whugis20180172
    [7] 徐文, 邵俊, 喻文勇, 冯鹏.  陆地观测卫星数据中心:大数据挑战及一种解决方案 . 武汉大学学报 ● 信息科学版, 2017, 42(1): 7-13. doi: 10.13203/j.whugis20150172
    [8] 李绍俊, 杨海军, 黄耀欢, 周芹.  基于NoSQL数据库的空间大数据分布式存储策略 . 武汉大学学报 ● 信息科学版, 2017, 42(2): 163-169. doi: 10.13203/j.whugis20140774
    [9] 刘汇慧, 阚子涵, 孙飞, 段倩, 唐炉亮, 吴华意.  采用轨迹大数据探测短时非营运行为 . 武汉大学学报 ● 信息科学版, 2016, 41(9): 1192-1198. doi: 10.13203/j.whugis20150569
    [10] 杨元喜, 曾安敏, 景一帆.  函数模型和随机模型双约束的GNSS数据融合及其性质 . 武汉大学学报 ● 信息科学版, 2014, 39(2): 127-131. doi: 10.13203/j.whugis20130378
    [11] 刘瑜, 康朝贵, 王法辉.  大数据驱动的人类移动模式和模型研究 . 武汉大学学报 ● 信息科学版, 2014, 39(6): 660-666. doi: 10.13203/j.whugis20140149
    [12] 张晓祥.  大数据时代的空间分析 . 武汉大学学报 ● 信息科学版, 2014, 39(6): 655-659. doi: 10.13203/j.whugis20140143
    [13] 李清泉, 李德仁.  大数据GIS . 武汉大学学报 ● 信息科学版, 2014, 39(6): 641-644. doi: 10.13203/j.whugis20140150
    [14] 李德仁, 姚远, 邵振峰.  智慧城市中的大数据 . 武汉大学学报 ● 信息科学版, 2014, 39(6): 631-640. doi: 10.13203/j.whugis20140135
    [15] 李连营, 许小兰, 吴中恒, 周祖浩.  多源导航电子地图数据融合更新方法研究 . 武汉大学学报 ● 信息科学版, 2008, 33(4): 409-412.
    [16] 郭东美, 李军, 熊熊, 刁法启.  地壳运动速度场的数据融合研究 . 武汉大学学报 ● 信息科学版, 2008, 33(2): 212-215.
    [17] 杨元喜, 曾安敏.  大地测量数据融合模式及其分析 . 武汉大学学报 ● 信息科学版, 2008, 33(8): 771-774.
    [18] 王文, 芮国胜, 邢福成.  基于数据融合的多尺度图像去噪方法 . 武汉大学学报 ● 信息科学版, 2006, 31(4): 329-331.
    [19] 张永军.  基于数据融合的行树与篱笆三维信息自动提取 . 武汉大学学报 ● 信息科学版, 2005, 30(11): 970-974.
    [20] 许才军, 王华, 黄劲松.  GPS与INSAR数据融合研究展望 . 武汉大学学报 ● 信息科学版, 2003, 28(S1): 58-61,78.
  • 加载中
图(6) / 表(3)
计量
  • 文章访问数:  731
  • HTML全文浏览量:  36
  • PDF下载量:  239
  • 被引次数: 0
出版历程
  • 收稿日期:  2017-07-17
  • 刊出日期:  2018-11-05

融合线上线下轨迹的景观热度评价

doi: 10.13203/j.whugis20170043
    基金项目:

    国家重点研发计划 2017YFB0503604

    国家自然科学基金 41671442

    国家自然科学基金 41571430

    国家自然科学基金 41271442

    作者简介:

    唐炉亮, 博士, 教授, 主要从事时空GIS、大数据知识挖掘与时空建模、交通地理GIS-T。tll@whu.edu.cn

    通讯作者: 邹倩倩, 硕士。zqq77@whu.edu.cn
  • 中图分类号: P208

摘要: 人们在线上网络空间和线下现实空间活动时, 会产生大量线上线下的痕迹(轨迹), 这种轨迹作为一种讯息会影响其他人的活动。现有研究大多单一地采用问卷调查、网络数据、GPS轨迹等方法, 忽略了移动互联时代线上线下空间活动的关联性以及历史活动足迹对日后活动的影响。基于对搜索量、签到和照片等网络大数据与线下GPS轨迹大数据的融合, 对人们线上线下活动进行时空行为模式分析, 建立基于信息素和回归分析的计算模型, 实现了对景观休憩空间的吸引力评价。以采样接近5 a的181个用户轨迹数据及相应时间段的网络大数据, 对北京28个景观进行实验, 并与单一线上或线下数据的研究方法进行比较, 结果表明所提方法不仅综合体现了景观热度, 且能够对未来的潜在游憩价值进行估计。

English Abstract

唐炉亮, 邹倩倩, 张霞, 任畅, 李清泉. 融合线上线下轨迹的景观热度评价[J]. 武汉大学学报 ● 信息科学版, 2018, 43(11): 1704-1711. doi: 10.13203/j.whugis20170043
引用本文: 唐炉亮, 邹倩倩, 张霞, 任畅, 李清泉. 融合线上线下轨迹的景观热度评价[J]. 武汉大学学报 ● 信息科学版, 2018, 43(11): 1704-1711. doi: 10.13203/j.whugis20170043
TANG Luliang, ZOU Qianqian, ZHANG Xia, REN Chang, LI Qingquan. Online and Offline Trajectory Data Fusion and Evaluation of Landscape Attractions[J]. Geomatics and Information Science of Wuhan University, 2018, 43(11): 1704-1711. doi: 10.13203/j.whugis20170043
Citation: TANG Luliang, ZOU Qianqian, ZHANG Xia, REN Chang, LI Qingquan. Online and Offline Trajectory Data Fusion and Evaluation of Landscape Attractions[J]. Geomatics and Information Science of Wuhan University, 2018, 43(11): 1704-1711. doi: 10.13203/j.whugis20170043
  • 当今社会, 环境空间资源配置与人群时空活动规律不匹配的现象十分常见。其中, 因忽视公众出行规律而对文化景点、风景区等环境空间的不合理配置, 导致了诸如拥挤、管理资源浪费、服务设施缺乏等问题, 影响了公众出行游憩的舒适度。因此, 如何正确评价空间的吸引力、合理设计空间以满足人群活动, 其意义重大。

    传统方法主要以调查问卷获得的公众行为喜好和地点评价或专家评价为依据进行分析[1-5], 耗时长, 工作量大, 成本高, 无法获取人们使用空间的详细数据, 更难以获取人们体验空间的行为特征和规律。在大数据时代, 有学者利用轨迹数据或网络数据对时空行为进行了研究[6-19]。如张霞等[6]提出了基于搜索量、签到和点赞等网络大数据建立景观热度评估模型, 并结合视域评价美丽度; 李君轶等[7]基于社会感知计算, 结合数字足迹概念对游客时空行为进行了研究; Zheng等[8]基于GPS轨迹, 根据不同地点的被访问次数以及访问者的旅行经历, 挖掘了人们兴趣度最高的地点, 并进行了经典旅行推荐; Chen等[9]通过对Flic-ker用户的签到、照片、个人信息的挖掘, 个性化提出了旅行推荐; Ahas等[15]利用手机数据研究了季节对游憩的影响。这些研究只是单一地利用轨迹数据或网络数据, 忽视了线上线下活动的关联性, 也没有考虑到历史足迹对日后活动的影响。Cord[17]虽然结合手机游戏Geocaching与网络调查数据对休闲活动在城市空间的空间梯度、喜好和动力进行了研究, 但调查数据不能与海量大数据相提并论。

    本文首次提出了线上线下数据融合, 以独特的视角分析人们的行为特点, 将之与生物觅食进行比较。通过将人们在真实地理空间及虚拟网络空间中留下的数字轨迹进行融合并建立模型, 空间的吸引力得到了量化描述与评价。利用采样接近5 a的轨迹数据及网络大数据, 对北京28个游憩空间进行实验, 本文方法计算得到的信息素分布不仅体现了空间的实际游憩价值, 而且为未来的潜在游憩价值提供了参考。

    • 在自然界中, 昆虫通过生物信息素进行通信, 信息素由个体分泌到体外, 被同物种生物察觉, 使后者作出反应。例如, 蚂蚁在移动时, 既会在经过的路径上留下信息素, 也会感知已有信息素, 受其影响朝浓度高的方向移动。因此, 由大量蚂蚁组成的蚁群集体行为便表现出一种信息正反馈现象:某一路径上经过的蚂蚁越多, 则后来者选择该路径的概率就越大[20]。当蚁群中的一只蚂蚁寻觅到了食物, 其余蚂蚁也能沿着信息素迅速找到食物。蚂蚁间通过这种方式的信息交流达到高效搜索食物的目的。

      人们在网络和现实空间进行日常活动时, 也会产生大量线上线下的痕迹, 此类轨迹将影响其他人活动。这种规律与生物觅食时释放信息素吸引同伴的模式很相似。从个体角度来说, 每个人像一只蚂蚁, 在空间中搜寻着愉悦的景观。当人们对感兴趣的地点进行搜索、签到、点赞与朋友圈推荐时, 会在线上空间产生相应数据, 反映出景观线上热度; 而人们在线下现实空间中游憩、拍照, 留下的轨迹数据则暗示了景观线下热度。偏好及正面评价的效果如同信息素, 增强了地点吸引力。从群体角度来说, 人们是作用于空间的智能群体, 像蚂蚁一样在空间中根据信息素觅食, 与同伴之间互相影响。

      在生物觅食模式中, 蚂蚁受信息素影响, 往浓度高的方向移动, 通往食物的路径因此被更多的蚂蚁经过, 积累了高浓度信息素, 又吸引了更多蚂蚁。依据空间吸引力与信息素的类比, 本文以同样模式衡量人们在未来受各景观空间吸引的程度。

    • 基于生物信息素思想, 本文首先提出了景观热度信息素(M)的概念, 描述人们与空间交互过程中留下的具有吸引作用的信息。信息的强弱以信息素浓度表示, 它综合表现了景观当前热度以及未来游憩潜力等, 即信息素浓度越高的空间在未来可能吸引更多的人, 正如生物信息素浓度高的路径会吸引更多蚂蚁一样。用Mi表示第i个景观的信息素浓度, 是标准化的无量纲值, 由人们在现实和网络空间中留下的数字轨迹所决定, 其值越高, 该地点的游客来访率(P)越高。

    • 人们在不同景观的停留时长是不同的, 这与景观人文历史、自然风景与舒适性有关, 停留时长反映了人们对该处的喜好程度。人们在某地的停留时间越长, 表现出对该地的喜好越浓厚, 释放的信息素也越多。基于日常研究与观察, 这种关系是非线性的。在较短的时间(如5~10 min), 停留行为可能只是简单经过, 停留长短只体现了很小的喜好度差异; 而当停留时间较长时, 喜好度会随着停留时间的延长而显著增加; 但当人们停留相当长的时间时, 说明人们对环境的喜好度已达到了很高的水平, 此时喜好度不再因停留延长产生显著变化, 如停留3~4 h体现出的喜好度差异很小。基于此, 本文假设停留时长与喜好度间的关系呈S型曲线, 如图 1所示(图 1只作为方便理解的假设示意图, 不是真实的量化关系, 曲线应通过实验确定)。

      图  1  信息素释放特点示意图

      Figure 1.  Diagram of Characteristic of the Pheromone Releasing Mechanism

      Logistic模型是被广泛应用的经典S型曲线模型[21-22], 基本公式如下:

      $$ y = \frac{{{{\rm{e}}^{\alpha x}}}}{{1 + {{\rm{e}}^{\alpha x}}}} $$ (1)

      本文以该模型为基础, 建立如下的线下空间信息素释放模型:

      $$ {\tau _{ik}} = \frac{{{{\rm{e}}^{\alpha {T_{ik}} + \beta }}}}{{1 + {{\rm{e}}^{\alpha {T_{ik}} + \beta }}}} $$ (2)
      $$ {T_{ik}} = \frac{{{T_{ik}}^*}}{{{S_i}}} $$ (3)

      式(1)、(2)中, τik表示游憩时贡献的信息素; αβ分别为Logistic回归待确定参数; Tik表示游客k在景观i的停留时长(已去除面积影响)。式(3)中, Tik* 表示游客k在景观i的真实停留时长; Si表示场地面积。

      与生物信息素释放类似, 游憩空间大小也影响了人们的停留时间和信息素释放。在生物觅食模式中, 较长路径上的信息素总量较多, 但其信息素浓度却可能较低, 低浓度并不能达到吸引同类的效果。游憩行为中, 在整个空间范围停留的时间也受到场地大小的影响, 导致停留的时间长短不能直接说明人们留下的景观热度信息素浓度。因此在式(3)中, 模型类比浓度思想将场地面积的影响进行了标准化。

      在线上空间中, 信息素的释放主要由人们对景观的关注与评价体现。网络搜索量、签到数和照片数与景观热度信息素紧密相关, 景观等级则是景观受欢迎程度的另一相关因素, 因此评估时都需要被考虑。此处, 线上信息素Aik的计算参考了张霞等[6]基于网络热度的道路景观评价中的方法:

      $$ {A_{ik}} = \frac{{{L_{ik}}}}{2}{G_{ik}}({w_1}{H_{ik}} + {w_2}{Q_{ik}}) $$ (4)

      式中, LikHikGikQik分别表示景观ik时期的等级、景观图片数、网络搜索量、签到人数; w1w2根据文献[6]取0.5。不同评价时间段的计算, 使用截止到不同时间的数据。

    • 生物信息素具有挥发性, 随着时间流逝, 信息素逐渐挥发, 强度递减。对于景观热度信息素, 挥发性体现在:距离评估时间越久的行为产生的信息素挥发得越多, 时间权重越小。比如多年前某景观受到很高的关注, 而今却不再受欢迎了。特殊事件也会影响空间吸引力, 例如北京刚举办奥运会时, 鸟巢与水立方的热度较高, 但随着时间流逝, 其吸引力减弱。因此线下时空活动应具有合适的权重, 即:

      $$ {w_t}\left( t \right) = {\rho ^{\frac{{{t_n}-t}}{{120}}}}\;\;\;\;\;\;\;\;(\rho \in \;\left( {0, 1} \right), \;{t_n} > t) $$ (5)

      式中, ρ为挥发系数, 参考蚁群算法[20]; tnt分别表示评价时间和游憩时间; 120 d为挥发周期。挥发系数决定了某行为产生的信息素经过一个周期后残留的比率, 在实验中确定; 而确立挥发周期时, 取值过长, 时间影响微弱, 表现不出挥发效果, 若周期过短, 不符合实际变化情况时, 容易因数据质量影响效果。

      对于不同景观类型, 挥发系数和挥发周期的取值不会产生变化, 且周期为120 d, 主要有以下原因:首先, 对于自然风景类, 其吸引力变化大多是季节性的, 已有研究探讨了游憩行为的季节性差异[15]; 其次, 对于事件引起的时效性, 如新建的游憩空间或举办的活动(如奥运会、电影拍摄地等), 其挥发周期难以确定; 最后, 对于像故宫这类经典景区, 其时效性不明显。因此, 在研究中主要考虑季节性周期, 并考虑到经典景区的时效较长, 适当扩展周期至120 d, 而挥发系数由实验确定; 在不同研究目的下, 可调整挥发周期, 挥发系数也产生相应变化, 应由初步实验来确定最佳值。

      每个游憩空间中, 不同人访问产生的信息素会不断累积, 来访人次越多, 信息素浓度也会越高。对于此特点, 模型对公众在每个景观点产生的信息素进行加权累计, 以体现总体的游憩偏好。此过程包含了依据来访时间进行挥发处理和对所有来访的集成, 可以表示为:

      $$ {\tau _i} = \sum {\tau _{ik}} \times {w_{tk}} $$ (6)

      式中, τi表示线下空间第i个景点所有人留下的信息素集成浓度; τik表示游客k贡献的信息素量; wtk表示这一时空活动的时间权重。

      显然, 线上空间信息素也具有挥发性, 因此在对线上数字轨迹累计时, 也同样需要添加时间权重。而根据线上轨迹数据量较大的特征, 本文方法将其按120 d周期分别计算线上热度, 再乘以时间权重进行累加, 得:

      $$ {A_i} = \sum {A_{ik}} \times {w_{tk}} $$ (7)

      式中, Ai表示线上空间中第i个景点的全部研究时段的信息素浓度; Aik表示景观i在时段k的信息素量, 时段的长度为120 d。

    • 现实空间和网络空间的时空数据在对象类型和尺度上具有异质性和关联性。现实空间中的轨迹体现的是实际游憩喜好, 而网络热度则暗示潜在价值和关注度; 在研究群体上, 前者仅限于到访过的对象, 而后者则是全国乃至全世界的网民; 相对而言, 线下轨迹数据的时空尺度更精细。在融合线上、线下信息素之前, 为了消除数量级的影响, 便于比较线上、线下信息素的差异, 先将线下信息素τi与网络热度Ai分别作标准化处理, 公式为:

      $$ x = \frac{{x^\prime-{x_{{\rm{min}}}}}}{{{x_{{\rm{max}}}}-{x_{{\rm{min}}}}}} \times 100\% $$ (8)

      式中, x为标准化值; x′为原始数值; xminxmax分别为最小值、最大值。

      标准化线下信息素τi与网络热度Ai后, 按照如下数学模型:

      $$ {M_i} = {w_\tau }{\tau _i} + {w_A}\;{A_i} $$ (9)

      以多项式加权的方式将人们在线上、线下两个空间释放出的信息素进行融合, 计算最终的景观热度信息素。式(9)中, wτwA分别是线下、线上空间的融合权重, 通过实验回归分析确定; Mi表示第i个景观的信息素集成浓度。

    • 信息素浓度越高的空间在未来具有更大的可能性来吸引更多的人, 正如生物信息素浓度高的路径上会吸引更多的蚂蚁往该路径方向运动的模式一样。基于该思想, 本文以真实来访率Pi作为观测值与信息素浓度作多元回归实验。最终以数学模型(9)为基础, 计算信息素浓度(Mi)的高低, 作为评价指标, 对每个游憩空间的当前热度与未来吸引力进行评估。

      在回归分析过程中, 根据评价时刻的信息素, 按照式(10)计算每个地点的游憩来访率, 并与真实来访率(式(11))进行比较, 以构建回归模型。

      $$ {P_i} = \eta \frac{{{M_{i}}}}{{\sum {M_i}}} $$ (10)
      $$ {P_i} \approx \frac{n}{N} $$ (11)

      式(10)和式(11)中, ∑Mi表示所有景观的信息素集成浓度之和; η是系数; nN分别表示未来一定时间段内该景观的来访人次与人们实际出行总人次。

    • 本文将北京市作为实验区, 利用2007-2012年采集的181个样本在北京进行户外活动时的GPS数据和相应时间网络中的北京市景观搜索量、签到数、微博照片数等作为主要数据源, 辅以景观等级、游览面积等数据进行实验。其中, 线下轨迹样本主要由本地青年群体构成:75%的样本年龄在22~30岁之间, 低于22岁和高于30岁的样本比例分别为16%和9%。低于25岁的学生占58%, 其他人为政府机构及公司的工作人员, 男女比例均衡。而网络数据的搜索量根据谷歌的高级搜索筛选, 微博签到与照片数利用微博开发平台与爬虫手段获取。

      为了提高效率并挖掘公众的游憩模式和偏好, 本文对原始数据进行了筛选、提取、无量纲化等工作。对轨迹数据的预处理依次包括:对原始采样点进行轨迹段识别; 筛选低速段(小于1.6 m/s); 提取低速轨迹段的中心。而对网络数据的预处理主要是无量纲化, 参考文献[6]的方法, 通过式(12)对景观面积、相应时间的搜索量、微博签到数和照片发布数等, 采用对数法进行无量纲化处理。

      $$ x = {\rm{lg}}{x^*} $$ (12)

      式中, x表示处理后的数据; x*为处理前的数据。

      此外, 在选定评价景观时, 本文参考了文献[4, 12, 23]所研究的地点以及旅游网站上的热门景点, 结合公众在活动轨迹中心的空间核密度分析结果中表现出的偏好特点, 筛选出28个北京市热门游憩场所作为研究对象。

    • 在基本数学模型中, 许多权重与参数并未确定。不同地区的景观热度受线上、线下因素的影响程度存在差异, 大城市的网络数据比乡村丰富, 而时间挥发参数也未确定。因此评估模型的最优参数应以信息素模式的基本特征为规则, 通过实验模拟来确定。图 2是将数据按时间分为两部分, 模拟历史人群活动对未来人群到访产生影响的过程, 采用Logistic回归和多元线性回归, 获取最佳的参数与权重。

      图  2  信息素影响未来到访率

      Figure 2.  Effects of Pheromone on Future Visitors

      首先, 利用SPSS软件对式(2)进行Logistic回归以确定αβ。为了简化分析, 也因时间挥发系数未知, 暂不考虑挥发, 以平均停留时长代替单次停留时间, 以游憩来访率代替单次信息素释放。分析得到α=0.001 35, β=-3.367, 拟合结果如图 3所示。

      图  3  Logistic回归结果

      Figure 3.  Logistic Regression Results

      按照式(10)和式(11), 以Pi拟合真实来访率, 分别计算挥发系数及融合权重(η对权重比例确定无影响, 因此不考虑)。在确定挥发系数时, 以0.6~0.9为候选范围, 与不挥发的情况进行比较。若系数过小, 会因过分挥发损失数据, 导致拟合不佳; 而当系数过大甚至不挥发时, 对时间挥发的体现过小, 忽视了事件的时间相关性。因此, 合理的参数应通过实验确定。图 4为不同挥发系数的回归效果。由图 4可见, 当挥发系数为0.9时, 可达到拟合度(R2)峰值, 且优于无权重的情况。

      图  4  不同挥发系数的回归效果

      Figure 4.  Regression Results with Different Volatility Coefficients

      在确定线上、线下信息素的融合权重时, 实验主要依据式(2)至式(9)计算了每个景观所有游憩者释放的线下信息素及相应的线上网络热度, 按式(8)标准化处理后, 对两个空间的信息素进行线性回归分析, 以确定合理系数, 结果如表 1所示, 对分析结果的标准化系数进行归一化处理后, 确定了权重wτ=0.53, wA =0.47, 则式(9)为:

      $$ {M_i} = 0.53{\tau _i} + 0.47{A_i} $$ (13)

      表 1  权重系数确定

      Table 1.  Determination of Weight Coefficients

      模型 相关性 标准化系数 显著性
      常量 - - 0.712(不显著)
      线上 0.664 0.415 0.016
      线下 0.684 0.459 0.008
      注:显著性表示小于0.05的显示数据分析具有统计学意义

      式中, τiAi均为标准化后的值。

    • 本文研究将现实空间时空轨迹与网络热度进行融合, 并以生物信息素模式特点为指导, 对吸引力进行量化分析。与基于网络热度的评价方法[6]比较, 本文实验计算出的信息素浓度与未来到访率有更高的相关性, 一定程度上对公众时空活动规律和每个地点的被访问率具有参考意义。表 2对比了不同方法的拟合效果。由表 2可知, 融合模型对实际值的拟合度达到了58.9%, 而单独基于线下数据的方法和单独基于网络热度的方法[6]则分别达到48.8%和44.1%。可见, 融合评价模型对于未来到访人次的回归拟合表现出优于单靠网络数据或线下轨迹数据为研究指标的方法, 体现了线上、线下数据综合考虑的优势。

      表 2  不同方法拟合效果对比

      Table 2.  Comparison of Regression Results with Different Methods

      数据 拟合度R2
      基于线下轨迹数据 0.488
      基于线上网络数据 0.441
      融合模型 0.589

      与具有严密数学物理背景的拟合分析相比, 本文研究的现象受到不确定因素(如社会、情感、个人习惯、突发事件)的影响, 因此最终拟合效果要逊色一些; 但与研究同现象的方法比较, 则表现出了优越性。

      图 5为3种方法的拟合效果, 可以看出, 融合模型的拟合效果优于线上或线下拟合, 但也存在几个突出的地点拟合不一致的情况, 主要原因之一是个体的习惯性游憩行为。根据相关研究[24-25], 因受个人喜好和时空约束, 个体的活动地点较为固定。数据前期集中对一些个体进行了长期取样, 因此过高估计了某地点的热度, 导致了后期拟合不佳。同样, 后期一些样本的习惯性行为也影响了拟合效果。例如9号什刹海公园在后期的访问率非常高, 在拟合中表现出了不一致, 是由于后期某样本习惯性的访问所致。与之相似, 2号恭王府的拟合不一致则是由前期某样本习惯性游憩行为导致。此外, 重大事件的影响也是其一大原因。如2008年北京奥运会期间, 相关游憩空间在此期间较热门, 访问率高, 而后期则没有那么高的访问率, 从而导致了拟合误差。

      图  5  实际来访率与模型拟合对比图

      Figure 5.  Comparison Between Actual Visiting Rate and Model Fitting Result

      依据确立的模型, 对北京市28个主要城市景观的信息素浓度进行计算, 图 6以三维方式对比了本文方法与张霞等基于网络热度方法[6]的最终评价结果。表 3列出了结果中前10名景观热度信息素浓度的评价结果, 前5名依次为圆明园、颐和园、奥林匹克公园、天坛公园、故宫, 而未列出的明城墙遗址公园、皇城根遗址公园及南馆公园的信息素浓度最低。

      图  6  热门游憩地的空间分布

      Figure 6.  Spatial Distribution of Popular Locations

      表 3  基于信息素思想的北京市景观热度评价

      Table 3.  Popularity Evaluation of Landscapes in Beijing Based on Pheromone

      排名 景观 评价结果 网络热度
      1 圆明园 101.114 90 5
      2 颐和园 95.591 89 4
      3 奥林匹克公园 79.359 68 1
      4 天坛公园 71.678 62 6
      5 故宫 70.964 30 2
      6 北京欢乐谷 64.316 67 11
      7 玉渊潭公园 63.256 01 17
      8 长城 61.027 03 3
      9 香山公园 60.945 09 14
      10 什刹海公园 60.810 20 8

      图 6可见, 1~5号地点的热度在两种方法中都比较高, 均为前5位。8号长城在信息素方法中表现出的热度较低, 6、7号的热度则较网络方法高, 原因在于信息素模型的线下部分考虑了地点空间分布的优劣条件。长城的地理位置距市中心较远, 交通便利度低, 因此线下数据访问量受到影响, 而在网络空间中, 人们的关注则较少考虑了游憩地的空间分布。

      实验结果中, 一些线上热度高的地点, 信息素评价值却可能不高, 原因除了上述的空间条件外, 还源于线下数据样本中一些长期居住实验者倾向于去一些景观质量高、安静、不拥挤的地点进行休憩。而线上空间的信息素则多分布于知名度较高的景点, 当实验中长期居住者较多时, 样本受到网络的影响将比纯游客样本小, 这一点也体现在融合模型的线上线下信息素权重差异方面(wτ=0.53, wA=0.47)。此外, 因数据中存在少量比例的样本取样横跨了两个时期, 可能导致个人的习惯性游憩行为[24-25]对结果产生了一定影响。

      在传统方法中, 李芬等[4]以统计数据与调查问卷为主要数据, 对北京城市公园湿地的休憩吸引力进行了研究。在此结果中, 具有高休憩吸引力的公园湿地依次为颐和园、奥林匹克公园、青龙湖公园、北海公园、圆明园, 在本文结果中, 颐和园、奥林匹克公园、圆明园也获得了较高的评估值。但与之不同, 本文的研究对象不限于公园湿地, 还增加了知名度较高的地点, 同时不仅考虑了景观对本地居民的休憩吸引力, 还考虑了景观的旅游价值与网络知名度。与传统方法相比, 本文利用客观大数据反映了人群活动规律, 模拟了信息素影响人们访问景观的过程, 参数通过回归分析获得, 能适应于不同的评价对象与时间。

      此外, 在以北京为研究区域的实验中, 对游憩空间吸引力的评价结果具有一定程度的时效性。这种时效性是指结果中各地点信息素浓度的高低, 暗示的仅为与评价时间(2012年9月)比较近的未来时间内的空间吸引力, 而已发生或将发生的事件都将影响这种时效性。例如, 在北京举办奥运会后, 鸟巢水立方的热度会较高, 但随着时间流逝, 其对人们的吸引力减弱。在本文实验中, 并未对特定时间段进行研究, 如果未来有更丰富的特定时间段(特定季节或节假日等)的数据, 可根据本文方法对时间段进行限制, 分析特定季节或节假日的情况, 以进行更深入的研究。

    • 本文首次将时空轨迹大数据与网络社交媒体大数据进行了融合, 并将生物信息素的思想引入到时空行为分析研究中, 建立了景观空间吸引力评估模型, 并拟合了未来到访率, 以校正模型结构。实验以北京市为例, 选取了28处景观进行验证, 结果表明, 与仅考虑网络数据或线下轨迹数据的方法相比较, 本文方法的结果与未来各空间的吸引力相关度更高, 体现出新方法对人们的实际出行感受和景观潜在游憩价值的综合分析能力。与传统方法相比, 本文利用众源大数据, 客观分析了人们的行为特征和规律, 且模型参数根据回归实验确定, 适应于不同研究对象与时间, 具有广泛应用性。其中, 对线上线下时空行为活动特征的综合分析为未来相关数据融合研究也提供了参考意义。基于信息素的线上线下数据融合和时空行为分析具有的综合性、挖掘性、时效性等特点, 对不同时间段、不同群体的行为特征进行分析, 并进一步应用于城市空间的优化配置、最美路径规划等方面, 将是下一步更深入的研究方向。

参考文献 (25)

目录

    /

    返回文章
    返回