文章信息
- 李伟, 陈毓芬, 李萌, 钱凌韬, 方潇
- LI Wei, CHEN Yufen, LI Meng, QIAN Lingtao, FANG Xiao
- 基于情境的POI个性化推荐方法研究
- A Method of Context-based POI Personalized Recommendation
- 武汉大学学报·信息科学版, 2015, 40(6): 829-833
- Geomatics and Information Science of Wuhan University, 2015, 40(6): 829-833
- http://dx.doi.org/10.13203/j.whugis20130657
-
文章历史
- 收稿日期:2013-11-07
2. 广州75711部队, 广东 广州 510515
2. 75711 Troops, Guangzhou 510515, China
地图服务由大众信息管理拓展至个性知识推理,成为学科研究的新趋势,用户需求的新方向[1]。随着社会经济的蓬勃发展,基于各种需求以及具有标注意义的兴趣点(point of interest,POI)日益增多,POI推荐受到学者广泛的关注。文献[2]提出了基于人机交互和地理位置的用户兴趣度评价算法,从而向用户主动提供个性化地理信息;文献[3]通过旅游者网络爬虫寻路功能,基于情境提供POI;文献[4]则采用了多约束条件挖掘用户交互行为的方法推荐POI;文献[5]通过自适应部门空间模型和基于地图服务访问日志的用户偏好挖掘方法,分析了尺度、语义和要素等偏好挖掘过程;文献[6]提出了空间尺度叠加高维符号的POI信息组织及可视化策略。
由于目前的研究缺乏对POI地理时空特性及其关联因素的统一分析,无法顾及推荐时的地理时空因素,本文通过分析POI多维情境因素,尝试探讨基于情境的POI推荐策略,提出顾及效用的改进逼近理想解排序法(technique for order preference by similarity to an ideal solution,TOPSIS)个性化推荐算法,使POI个性化推荐更加科学有效,从而提升地图服务的个性化和智能化。
1 POI个性化推荐情境分析情境是决定用户使用行为、交互进行中或用户感兴趣的一系列环境状况及设置[7]。POI的个性化体现在用户对现实世界事物的认知差异和兴趣偏好,而该差异受用户的自身因素、POI空间分布以及其他关联因素的共同影响,由此分析POI属性及其地理时空等情境,通过用户需求进行动态综合推荐,才能有效适应用户的个性化需求,包括以下三个方面。
1)时空情境。一类POI对个体用户而言仅为潜在的偏好预选点,影响用户对POI兴趣度的关键既取决于该POI关键属性是否满足用户的特定需求,又要考虑POI与用户间的地理方位、空间分布,以及用户特殊需求的位置、路线、区域等地理要素、路径距离、达到时间等时空情境。
2)关联情境。由于人行为的关联性及其对事物兴趣的扩展性,POI兴趣在实际应用中并不孤立,当用户对POI搜索和分析时,常常不仅只考虑单一事物。互联网产品推荐的思路[8]无法适应用户多类POI多因素的时空序列分析,而POI的推荐要考虑关联情境,即以某类POI为主进行关联分析。
3)认知情境。基于标注或点选的单类型符号表达[6],或一类符号统一突出显示等方式,无法让用户直观、清晰地认知POI个性化推荐结果。除考虑硬软件设备、影响屏幕显示的自然环境因素外,还要基于用户认知特征进行符号细分和重组,灵活组合符号视觉变量,依据兴趣推荐次序分级显示,与未推荐POI区别表达。
2 POI个性化推荐方法 s 2.1 POI个性化推荐策略POI个性化推荐需要分析历史记录,参考好友兴趣,获取注册信息,根据用户交互获取约束条件,基于时空等多维情境因素,考虑POI属性,以用户位置及其指定位置、路径和区域进行拓扑分析(相邻、包含等)、网络路径分析(欧氏距离、路径距离等)和空间几何特性提取(方位、距离、面积等)的时空情境筛选;必要时根据用户需求及POI类型的因果关联,以初步推荐的一类POI为基础进行其他类POI的推荐分析和情境筛选;最后综合分析结果,感知软硬件设备和服务系统应用环境,实现适应用户认知特征的个性表达。流程如图 1所示。
本文引入经济学效用理论,该理论认为用户对某物品的价值判定既取决于价格等成本付出,又受物品对该用户重要程度、价值认可等效益因素的综合影响。经济学家用它来解释理性消费者如何分析有限资源实现对商品的最大满足[9]。效用理论可对待推荐POI的情境因素视为成本展开统一分析,为用户基于其个人历史记录创建相应的效能函数和权重指标,从而动态分析该用户基于多维情境因素的POI兴趣度,并且能够服务于用户兴趣的关联扩展,在进行其他类POI推荐时,复用该类POI的效能函数和权重指标,实现多类POI的综合推荐。
2.2 顾及效用的改进TOPSIS推荐算法TOPSIS对多目标决策分析行之有效[10]。其基本原理是检测评价对象与最优解、最劣解的距离排序,如评价对象最靠近最优解同时又最远离最劣解则为最好,其中最优解的各指标值都达到各评价指标最优值。
TOPSIS适用多评价对象、多指标的大样本数据,能全面分析多元指标,但也存在效用度估计偏差导致特征值分布过于集中、缺乏动态化机制的不足[11]。为此,顾及效用的改进TOPSIS算法将优化数据规范处理以及主客观偏好值计算,实现效益型和成本型指标集的规范统一,由历史评价矩阵使主观偏好值与客观偏好值之间的总偏差最小,并针对个体用户POI推荐形成动态效用评价权重,使结果能够精确反映各评价方案之间的差距,实现效用评估偏差最小化,综合评价得出准确的兴趣度。算法流程如图 2所示。
1) 整理POI数据。根据用户对该类POI搜索、点击、评价的历史数据,以及用户查询该类POI后显示或选择的结果,基于该类POI已选的m个点,通过n个评价指标域分析兴趣子集,由各POI的评价指标值组成矩阵 X ,xij表示第i 个POI的第 j个评价指标值。
对于一类POI特征及其相应评价,首先考虑该类POI的属性特征,其次分析该类POI与用户单个或多个地理位置的距离(最短路径距离、最优路径距离以及特殊约束路径距离等一种或多种),并获知用户出行工具,提取用户对POI空间分布、通达距离及时间成本的关注,获取该类POI路径距离、时间成本等时空情境指标。
2) 数据规范处理。因n个指标各自具有不同的量级,成本性评价指标与效益型评价指标正负向量不一致,因此先对各评价指标值进行趋同化处理,将低优指标向高优指标转化,绝对数采用倒数法、相对数采用差数法进行数据规范。设yij表示第 i 个POI的第j个规范化的评价指标值,其计算公式为:
3) 分析指标权重。 对于POI各属性权重系数,采用层次分析法评价矩阵的参数设置,βj表示该类POI第j个规范化评价指标权重主观偏好系数。随机挑选n个用户偏好POI点,由规范评价指标值形成数据规范处理的历史评价矩阵,采用比率度量属性间的相对重要性,由n个函数组解出βj:
一般情况下,用户对POI的主观和客观偏好存在一定差异,且历史POI的选择偏好往往具备自我合理性,因此POI属性权重向量ω 的选择应尽量保证用户主观偏好值和客观偏好值的总偏差最小化。通过式(1)、式(2)计算用户对该类POI中xi的主观偏好值βi,βi∈[0, 1],βi越接近1,则用户越偏好xi,因此把规范化矩阵(rij)n×m中的属性值rij作为用户在属性uj下对xi的客观偏好值,由此形成用户的个性化约束规则和权重:
解式(3)得到POI属性各权重向量ωj:
4)构造加权矩阵。基于POI预选数据库,根据用户对POI的特征需求进行约束预处理或历史数据分析预处理,形成预选POI集,并完成POI数据整理、数据规范处理等步骤。由于一类POI各属性的重要性不同,所以通过指标权重分析,为预选POI集的规范化数据增加熵权,构成加权矩阵:
5)算正负理想解。根据加权矩阵,比较预选POI集评价对象的理想解和负理想解:
6)分析效能距离。计算预选POI集各评价指标与理想解和负理想解的效能距离:
7)排序相对接近度。相对接近度为负向距离与正负向距离之和的比值,根据接近度大小对预选POI集的用户偏好进行排序,实现推荐兴趣度的数值化。
3 实验验证与分析 3.1 算法实验本实验将测试如何运用改进 的TOPSIS算法为用户提供基于情境的酒店、商场等POI个性化推荐。首先由用户提供A城市和B城市的酒店类POI偏好选择和兴趣评价,以A城市酒店类POI兴趣评价为历史数据,通过本算法进行B城市酒店类POI个性化推荐,并实现个性化表达,对比用户主观兴趣评价,再由均方根误差(root-mean-square error,RMSE )客观度量预测精度[8]。
实验以酒店类POI环境质量、服务品质、菜品质量(百分比)和人均消费(元)等属性信息为基础,首先根据用户选择及历史数据提取用户饮食口味、出行交通工具(公交或出租车)等约束规则,对酒店类POI进行约束条件预处理。网络距离(单位:km)则根据用户位置点进行最短网络路径分析获取,时间成本(单位:min)则根据用户出行交通工具及道路通行情况由平均速度计算得出,整理POI数据如表 1所示。
编号 | 环境/% | 服务/% | 菜品/% | 消费/元 | 距离/m | 时间/min |
POI1 | 98 | 95 | 98 | 60 | 9.5 | 19 |
POI2 | 95 | 99 | 99 | 80 | 14 | 30 |
POI3 | 93 | 92 | 94 | 55 | 12 | 20 |
POI4 | 90 | 90 | 93 | 65 | 8 | 18 |
POI5 | 96 | 88 | 92 | 58 | 10 | 24 |
POI6 | 88 | 90 | 93 | 45 | 16 | 36 |
其后,进行数据规范处理,对人均消费、网络距离及时间成本等成本性评价指标进行趋同化处理,获得规范化后的矩阵 Y ,再以A城市酒店类POI兴趣评价的历史数据为基础,采用层次分析法,由规范评价指标值形成数据规范处理的历史评价矩阵,用比率度量属性之间的相对重要性,由大于n的函数组解出β=(0.152 5,0.158 3,0.195 1,0.181 3,0.135 9,0.176 9),并计算出该用户酒店类POI属性权重向量ω=(0.143 6,0.147 5,0.201 6,0.197 3,0.126 5,0.183 5),再构建加权矩阵:
确定预评价POI集理想解和负理想解,V+=(0.061 5,0.064 5,0.085 9,0.103 5,0.068 9,…) V-=(0.055 2,0.057 3,0.079 8,0.058 3,0.034 5,…)。分析POI集各点与理想解和负理想解的效能距离d1+=0.028 5,d1-=0.052 5,…, 由此计算相对接近度C1=0.665,C2=0.184,…,对评价POI集进行效用排序,得出顾及该用户个性化效用需求的预选POI集推荐顺序为{ POI1,POI4,POI3,POI5,POI6,POI2}。
最后在该用户酒店类POI个性化推荐结果的基础上,以POI1、POI4、POI3为位置基点迭代使用本算法进行宾馆类POI的个性化关联推荐。
3.2 验证分析对于测试集中的用户和物品(u,i),用户u对物品i的真实评价是pui,而推荐算法预测的用户u对物品i的评价为qui,那么一般可用RMSE度量预测的精度,通过评分预测找到最小化测试集的RMSE值。
本算法依据上述评价方法对算法推荐出的B城市酒店类POI兴趣效能值C转换为最高10分的数据集{10.00,2.77,8.99,9.68,7.65,6.53},与该用户相应主观评价获得的数据集{9.80,4.50,9.00,9.20,5.00,6.00}通过RMSE 度量分析得值为0.542,由此对比分析其他实验用户相关的实验数据。实验验证认为,顾及效用的改进TOPSIS算法的POI推荐评价误差较低,而且比未考虑时空等多维情境因素的推理更为科学有效。最后以用户位置中心进行道路网络通达等时分析,以含推荐次序的符号表达POI评价顺序,推荐可视化效果如图 3所示,用户主观满意度综合评价为96.8%。
4 结 语本文通过分析 POI推荐多维情境因素,统一考虑基于多情境因素的推荐策略,引入效用理论并提出改进的TOPSIS推荐算法。实验证明,所提出的个性化推荐策略和方法具有较高的可用性,考虑POI推荐中的地理时空等多维情境,能提高用户推荐准确度,为解决地图服务POI推荐提供新思路。当然,本方法在涉及多类POI或POI关联推荐方面,是以某类POI初步推荐结果为基础进行其他类POI推荐的迭代,虽然能为用户提供相对准确的推荐结果,但在算法复杂度方面会因POI集的数量呈几何增长,这有待下一步重点研究。
[1] | Wang Jiayao. Development Trends of Cartography and Geographic Information Engineering[J]. Acta Geodaetica et Cartographica Sinica, 2010,39(2):115-119(王家耀.地图制图学与地理信息工程学科发展趋势[J].测绘学报,2010,39(2):115-119) |
[2] | MacAoidh E, McArdle G, Petit M, et al. Personalization in Adaptive and Interactive GIS[J].Annals of GIS, 2009, 15(1):23-33 |
[3] | Rodriguez-Sanchez M C, Martinez-Romo J, Borromeo S, et al. GAT:Platform for Automatic Context-aware Mobile Services for m-tourism[J]. Expert Systems with Applications, 2013,40(10):4 154-4 163 |
[4] | Ying J C, Lu E H, Huang C M, et al. A Framework for Cloud-based POI Search and Trip Planning Systems[C]. International Conference on Orange Technologies, Tainan, China, 2013 |
[5] | Liu Jiangtao, Du Qingyun, Peng Zifeng. Study on User Preference Mining Methods in SDI Information Services[J]. Geomatics and Information Science of Wuhan University,2013, 38(3):329-333(刘江涛,杜清运,彭子凤.SDI信息服务部门用户偏好挖掘方法研究[J].武汉大学学报·信息科学版,2013,38 (3):329-333) |
[6] | Yu Changbin,Hu Qiao,Ren Fu,et al. Information Organization Method and Visualization Strategy of POI Based on B/S Structure[J].Geomatics and Information Science of Wuhan University,2012,37(2):233-236(虞昌彬,胡乔,任福,等.利用B/S架构的POI信息组织方法及可视化策略研究[J].武汉大学学报·信息科学版,2012,37(2):233-236) |
[7] | Chen G, Kotz D. A Survey of Context-aware Mobile Computing Research[R]. Technical Report TR2000-381, Department of Computer Science, Dartmouth College, 2000 |
[8] | Xiang Liang. Recommended System Practice[M].Beijing:Posts & Telecom Press,2012(项亮. 推荐系统实践[M].北京:人民邮电出版社,2012) |
[9] | Blang M. Economic Theory in Retrospect[M]. 5th ed.Cambridge:The Press Syndicate of the University of Cambridge,1997 |
[10] | Hwang C L,Yoon K P. Multiple Decision Making:Methods and Applications[M].New York:Springer-Verlag Press,1981 |
[11] | Chen C T. Extensions of the TOPSIS for Group Decision-making Under Fuzzy Environment[J]. Fuzzy Sets and Systems, 2000, 114(1):1-9 |