-
摘要: 对社交媒体所包含文本数据的深入挖掘,有利于有效地进行后续的时空分析。提出了一种新的基于共词网络的社交媒体数据主题挖掘方法,依据词频-逆文档频率分析,自动筛选出与主题相关的关键词汇,基于微博间是否包含相同的关键词汇,提出构建以微博为节点的共词网络,并结合Louvain社区探测算法进行文本主题挖掘。所提出的方法是一种无监督方法,且具有不需要指定聚类数目的优点。实验表明,该方法在主题挖掘表现上,准确率和召回率均优于常用的文档主题生成模型。以收集的2012年北京暴雨期间包含关键词的微博为例,利用提出的方法对微博数据集进行挖掘和时空分析,结果表明所提方法在实际应用中的有效性。
-
关键词:
- 共词网络 /
- 社交媒体 /
- Louvain社区探测 /
- 主题挖掘
Abstract: The in-depth exploration of the text data contained in social media facilitates efficient analysis of time and space. This paper proposes a new social media topic mining method based on the concept of co-word network and community detection. The method uses term frequency-inverse document frequency (TF-IDF) analysis to identify the key words of the messages automatically. Based on the problem whether the microblogs contain the same key words or not, we put forward the concept of microblog co-word network with microblog as the node. The network combined with the Louvain community detection algorithm is used to classify the microblogs into different clusters with topics. The proposed method is an unsupervised method. The advantage of this method is that there is no need to specify the number of clusters. Experiments demonstrate that the performance of the proposed method is better than the commonly used latent dirichlet allocation (LDA) model on both precision and recall. Taking the collected microblogs during the 2012 Beijing rainstorm as the case study, the method is used to conduct in-depth mining and time-space analysis of the microblogs dataset. The results demonstrate that the proposed method is effective in real world applications.-
Keywords:
- co-word network /
- social media /
- Louvain community detection /
- topic mining
-
卫星精密轨道确定中光压建模一直是一个重要研究课题。GPS卫星导航系统是目前力学机理模型较为清楚的导航系统,其定轨精度从最初的米级提高到现在的厘米级,很大一部分得益于光压模型的不断的精化[2]。北斗卫星导航系统(BeiDou Navigation Satellite System, BDS)是中国自主研制的卫星导航系统,与其他导航系统相比,中国的BDS系统由GEO、IGSO、MEO三类卫星组成,目前BDS卫星定轨精度尚没有达到GPS那样的定轨精度,一个很大的原因就是没有建立适合这三类卫星的光压模型,因此应该根据这三类卫星的轨道、姿态、物理特性建立不同的光压模型,以期提高这三类卫星定轨的精度。
回顾GPS光压模型建模的历程,一般分为分析型光压模型、经验型光压模型、半分析半经验型光压模型。分析型光压模型主要有ROCK模型[3]、T10/T20/T30模型[4];经验型光压模型有Colombo模型[5]、JPL使用的GSPM(GPS solar pressure model)模型[6]、CODE建立的ECOM模型、BERNE1、BERNE2[2, 7];半分析型半经验型光压模型有Adjustable box-wing模型[8]。Bernese ECOM光压模型是CODE针对GPS卫星建立的经验型光压模型,该模型是目前IGS几大分析中心定轨软件中使用最多、定轨效果较好的光压模型。该模型认为太阳是引起轨道共振的激发源,因此与Colombo模型的RTN方向不同,ECOM模型在DYB坐标轴下,采用3个相互正交方向上分别使用3组参数(共9个参数)来吸收残余摄动力影响,可使定轨精度达到厘米级。但是由于该模型吸收了其他一些未能建模的摄动力,其模型的意义已不再是单纯的光压摄动,更确切的是将物理机理不清楚的力学因素用9参数函数模型来表达,因参数的时效性有限,定轨时需分段逼近。但是该模型包含的估计参数较多,由于定轨参数间的相关性,并非解算全部9参数会得到最优解,故结合每个参数的贡献大小和显著性水平寻求最佳的参数组合,以期提高卫星定轨精度。对于GPS卫星定轨,目前普遍认为定轨效果比较好的办法是只解算D、Y、B轴上长期项D0、Y0、B0和B轴上的周期项Bc、Bs共5个参数,武汉大学PANDA软件中采用的就是这样的方式[9-11],但是这只是经验上的设定,并没有文献通过理论上的分析去说明,甚至是否还有更优的参数解算方式,这都是值得研究的。另外,ECOM模型是针对GPS卫星建立的,GPS全部是由MEO卫星组成,该模型用到BDS上未必合适,比如BDS中GEO采用零偏航的姿态控制模式,这与ECOM模型的建立方式有偏差,因此也应该进行相关的研究。
文献[12]使用了GPS的SP3精密星历,对GPS卫星的ECOM光压模型参数进行了统计分析,对于GPS卫星定轨估计8个参数较为合理。文献[2]基于历史的GPS精密星历研究了光压参数的变化规律,并将其中的一部分参数固定,形成了新的光压模型CODE98,该模型特别适合GPS卫星快速定轨和预报。这两种方法为BDS光压模型的研究提供了思路,但也存在些问题, 如文献[13]研究采用了轨道拟合的方式,而用实测L波段的载波和相位观测数据进行定轨时,定轨的观测方程与轨道拟合的观测方程形式不同,轨道拟合时的设计矩阵A和B实际为状态转移矩阵Φ和敏感矩阵S,而采用L波段的观测数据定轨时观测方程中的设计矩阵还需乘上测站至卫星方向的3个方向余弦,因此仅靠轨道拟合方式得到的光压参数组合在采用实测L波段数据定轨时并不一定是效果最佳的;而CODE98将一部分参数固定,实际定轨时这部分参数的不确定度很可能会被其他参数吸收,参数也失去了原来的意义。而且这两种方式都是针对GPS卫星的,因此本文借鉴这两种处理方式,分析ECOM模型在BDS定轨中参数最佳的组合方式。将一年的BDS精密星历作为观测量进行轨道拟合,对拟合得到的9个参数时间序列进行分析,研究参数的量级以及变化规律,结合参数相关性分析结果,构建线性回归参数显著性假设,最终确定出参数的最佳组合方式,最后利用MGEX实测数据进行定轨,轨道和钟差比较结果表明,只解算D0、Y0、B0、Bc、Bs共5个参数定轨效果最佳。
1 ECOM光压模型
ECOM光压模型定义eD、ey、eB作为3个基本坐标单位向量,eD为卫星至太阳方向单位向量,正向指向太阳,ey为卫星至地心方向的单位向量,eB为卫星太阳帆板轴向单位向量,ex、ey, ez为星固坐标系坐标轴的单位向量,有ey=ez×eD,ex=ey×ez,eB=eD×ey[8]。
ECOM模型加速度计算公式如下:
$$ \begin{array}{l} \mathit{\boldsymbol{a}}{_s} = \frac{{a_u^2}}{{|\mathit{\boldsymbol{r}}{_s} - \mathit{\boldsymbol{r}}{|^2}}}\left[ {D\left( u \right) \cdot \mathit{\boldsymbol{e}}{_D} + Y\left( u \right)\cdot{\rm{ }}\mathit{\boldsymbol{e}}{_y} + } \right.\\ \left. {B\left( u \right)\cdot{\rm{ }}\mathit{\boldsymbol{e}}{_B}} \right] \end{array} $$ (1) 其中
$$ \begin{array}{l} D\left( u \right) = {D_0}\left[ {\lambda {\rm{SRP}}\left( 1 \right)} \right. + {\rm{SRP}}\left( {\rm{4}} \right) \cdot \cos \left( u \right) + \\ \left. {{\rm{SRP}}\left( 5 \right) \cdot \sin \left( u \right)} \right] \end{array} $$ (2) $$ \begin{array}{l} Y\left( u \right) = {D_0}\left[ {{\rm{SRP}}\left( 2 \right)} \right. + {\rm{SRP}}\left( 6 \right) \cdot \cos \left( u \right) + \\ \left. {{\rm{SRP}}\left( 7 \right) \cdot \sin \left( u \right)} \right] \end{array} $$ (3) $$ \begin{array}{l} B\left( u \right) = {D_0}\left[ {{\rm{SRP}}\left( 3 \right)} \right. + {\rm{SRP}}\left( 8 \right) \cdot \cos \left( u \right) + \\ \left. {{\rm{SRP}}\left( 9 \right) \cdot \sin \left( u \right)} \right] \end{array} $$ (4) 式中,SRP(i)(i=1, 2, …, 9)为待估参数;u定义为卫星在轨道平面上距升交点的角度;λ为阴影因子;αu代表天文单位的长度;rs、r分别为惯性系下太阳和卫星的位置;D0为与卫星型号有关的面质比参数,其取值与卫星型号以及质量有关。
2 BDS光压参数相关性分析
线性化后的定轨观测方程可写为:
$$ \mathit{\boldsymbol{AX + BY + \boldsymbol{\varDelta} = L}} $$ (5) 其中,X为定轨基本参数,即系统参数;Y为附加参数;Δ为观测误差;L为观测量。参数相关性分析时X为6个轨道根数,而Y为ECOM模型的9个光压参数。
对光压模型参数的相关性检核的具体方法如下:使用2014年的GFZ解算的BDS星历作为伪观测值,选择6个轨道根数及9个光压参数作为解算参数,形成观测方程并得到权逆阵,并按式(6)计算相关系数:
$$ {p_{ij}} = {q_{ij}}/\left( {\sqrt {{q_i}{q_j}} } \right) $$ (6) 式中,qij为权逆阵第i行第j列元素;qi、qj为权逆阵对角线第i、j元素。统计每天每颗卫星解算的相关系数大于0.80的参数对,一年中超过30 d都相关的参数对情况如表 1。
表 1 BDS定轨中ECOM模型9参数相关性分析Table 1. Correlation Analysis of Nine Parameters of ECOM in BDS POD卫星号 参数1 参数2 所有卫星C01-C14 D0 Dc D0 Ds Ys Bc Bs Yc C02、C03、C10、C11、C12、C13、C14 Y0 Yc C03、C05、C06、C08、C09、C10、C11、C12、C13、C14 Y0 Ys 以C03卫星为例,解算出来的相关系数一年的变化情况如图 1,其他卫星与此类似。
从表 1中看出,所有卫星D0参数与Dc和Ds强相关,而Ys与Bc、Bs与Yc强相关;除了C01、C02、C04、C07卫星外,其他卫星Y0与Ys强相关;而对于GEO和MEO卫星Y0与Yc参数强相关,对于IGSO卫星则相关性较弱。
其中,D0参数代表对日方向的加速度,所以D0参数是必须解算的,Dc、Ds参数就不需要解算,对于其他4个参数Yc、Ys、Bc、Bs是否解算,需要进行参数的显著性检验,与文献[13]的处理方式不同,因为实测数据定轨时的法方程与轨道拟合的法方程不同,故本文除了通过统计检验的方式进行参数的显著性分析,还对这4个参数一年的时间序列进行分析,从参数的量级以及参数的年变化规律分析参数可解与参数不需要解算的情况。
3 光压参数的周年特性分析与显著性检验
3.1 参数周年特性分析
以C01卫星为例,Y0、Yc、Ys、Bc、Bs参数一周年的序列值如图 2。
图 2中方框内的时期为地影期,这时间段内的光压参数是不稳定的,剔除这两段时期的数据进行统计,可以看出Bc、Bs参数存在一个以年为单位的周期项,而且Bc、Bs参数的量级要比Y0、Yc、Ys参数的大,这5个参数的均值mean和均方根RMS如表 2。
表 2 C01卫星5参数的均值和均方根/(10-9m·s-2)Table 2. The Mean and RMS of 5 Parameters of Satellite C01/(10-9m·s-2)参数 Y0 Yc Ys Bc Bs mean -0.221 -0.157 -0.145 -0.448 -0.107 RMS 0.862 0.892 0.924 5.371 3.846 为了分析Bc、Bs参数的周期特性,下面采用快速傅里叶变换对Bc、Bs参数周期进行分析,详细步骤如下:
1) 数据预处理,对剔除的粗差点进行插值处理,得到等间隔的参数时间序列;
2) 利用谱分析方法对数据进行分析,得到频谱图;
3) 选择最大周期,对光压序列进行拟合,拟合的结果与原始的序列如图 3、图 4。
3.2 参数的显著性检验
参数的显著性检验采用文献[13]的方式进行,通过不同类型参数定轨结果方差比的F检验方法来实现。
构造原始假设H0:σ02=σ12
备选假设H1:σ02 < σ12
实际计算中σ02取为9参数模型计算得到的单位权中误差,即σ02=VTPV/t,t为多余观测数;V为采用9参数模型定轨得到的观测量验后残差;σ12=(V1TPV1-VTPV)/t0,其中t0为待检核的参数数量,比如仅仅要检核光压参数SRP(i),则t0=8;V1为不估计检核参数SRP(i)得到的残差。若统计量σ12/σ02大于由给定显著水平及子样容量确定的F分布积分上限,则说明这些参数是显著的,应该在模型中体现,否则说明该参数在定轨中可不估计。
采用上节GFZ解算的一年的精密星历作为伪观测量,每天一个弧段依次对Yc、Ys、Bc、Bs共4个参数进行显著性检验,给定显著性水平0.05,得到F0.05(1, 270)=3.880,则方差比超过该值就认为该参数是显著的,统计4个参数这一年中通过显著性检验的比率,见表 3。
表 3 14颗卫星4个参数显著性检验通过的比率/%Table 3. Passing Rate of 4 Parameters Significance Test of 14 Satellites/%Yc Ys Bc Bs C01 20.14 24.73 43.11 47.35 C02 4.53 5.66 28.68 24.53 C03 7.43 11.52 29.74 29.74 C04 18.84 18.49 40.75 34.59 C05 9.84 8.85 30.16 30.16 C06 24.84 22.93 47.13 39.81 C07 22.68 24.28 40.58 52.40 C08 19.86 21.63 37.59 41.13 C09 27.94 30.79 47.62 43.81 C10 27.16 28.75 41.85 42.17 C11 24.48 23.22 62.15 60.25 C12 22.27 20.06 55.52 54.89 C13 26.10 23.66 65.85 58.54 C14 24.75 22.85 66.46 60.13 从表 3中看出,Bc、Bs参数通过检验的比率明显大于Yc、Ys参数,而且GEO卫星更明显,这说明Yc、Ys的显著性较弱,为了检验不解算Yc、Ys参数的定轨效果,与文献[12]的方式不同,本文采用L波段实测数据定轨来验证。
4 实测数据定轨结果分析
收集了2014年年积日069-079期间共50个MGEX监测站的数据进行定轨,测站分布如图 5,设计3种不同的参数解算方案:
方案1 解算D0、Dc、Ds、Y0、Yc、Ys、B0、Bc、Bs;
方案2 仅解算D0、Y0、Yc、Ys、B0、Bc、Bs;
方案3 仅解算D0、Y0、B0、Bc、Bs。
定轨采用的模型和参数如下:观测量采用B1、B2频点无电离层组合伪距和相位非差观测量;解算弧段为3 d,采样间隔为300 s;截止高度角7°;EOP参数固定为IERS C04值;模糊度采用浮点解;跟踪站坐标固定为GPS PPP结果;测站潮汐改正考虑地球固体潮、固体极潮、海洋极潮、测站海潮;对流层采用Saastamoinen + GMF估计湿延迟参数。
在定轨解算过程中,考虑的摄动力模型包括以下几项:JPL DE405太阳、行星摄动,EGM96 10×10阶重力场模型,IERS-Conventions 2010地球固体潮、海潮、地球极潮、海洋极潮,积分器采用的是RKF6/7起步、Adams预报校正多步法。
采用内符和外符两种方式评估3种方案的定轨结果:①重叠弧段比较;②与GFZ结果进行比较。
4.1 重叠弧段比较结果
统计3种方案10 d定轨结果,采用3 d重叠2 d的方式评估3种方案的定轨精度,比如“069-070-071”和“071-072-073”两个3 d弧段,统计重叠071天的结果,10 d共重叠第7 d,给出7 d的平均值,分别采用径向和用户距离误差(user range error, URE)衡量3种方案的定轨精度。URE是卫星轨道误差在全球范围内用户观测方向上投影的平均值,表征了导航卫星轨道误差对用户测距的影响[15],计算公式为:
$$ \begin{array}{l} {\rm{UR}}{{\rm{E}}_{{\rm{BDS(GEO,IGSO)}}}} = \\ \sqrt {{{\left( {0.99\Delta R} \right)}^2} + \frac{1}{{127}}(\Delta {T^2} + \Delta {N^2})} \end{array} $$ $$ \begin{array}{l} {\rm{UR}}{{\rm{E}}_{{\rm{BDS(MEO)}}}} = \\ \sqrt {{{\left( {0.98\Delta R} \right)}^2} + \frac{1}{{54}}(\Delta {T^2} + \Delta {N^2})} \end{array} $$ 式中,ΔR、ΔT、ΔN分别为卫星轨道在R、T、N方向上的误差。
重叠弧段比较结果如图 6,可以看出:无论是径向还是URE,方案3的定轨精度都是最佳,方案3相对方案1径向提高72.9%,URE提高58.6%。
4.2 与GFZ结果比较
统计3种方案10 d定轨结果,将结果与GFZ解算结果进行比较,GFZ目前提供了多系统星历产品的解算策略[15],10 d的平均值结果如表 4。可以看出:对于GEO卫星,方案3中R、N两个方向精度明显高于方案2,但是T方向的精度最差,这与文献[11]的结果一致,文献[11]采用切向经验力补偿了GEO卫星切向残余的摄动力,提高了GEO卫星定轨的切向精度[11];对于IGSO/MEO卫星,在R、T、N方向上方案3的定轨结果都是最佳的,IGSO卫星方案3相对于方案1,3个方向分别提高82.92%、17.70%、31.86%,MEO卫星方案3相对于方案1,3个方向分别提高61.02%、15.30%、25.84%。
表 4 3种方案定轨精度比较结果/mTable 4. POD Accuracy Comparison of Different Schemes/m方案1 方案2 方案3 R T N R T N R T N C01 0.505 5.260 0.516 0.348 7.634 0.457 0.266 8.798 0.301 C03 1.030 5.084 0.324 0.205 5.831 0.246 0.161 5.427 0.153 C04 0.644 1.813 0.396 0.630 2.931 0.389 0.466 2.588 0.145 C05 0.739 3.573 0.374 0.263 4.160 0.236 0.191 4.095 0.198 mean 0.730 3.933 0.403 0.362 5.139 0.332 0.271 5.227 0.199 C06 0.892 0.634 0.340 0.217 0.635 0.303 0.141 0.575 0.275 C07 0.564 0.512 0.379 0.173 0.462 0.337 0.107 0.367 0.222 C08 1.791 0.509 0.379 0.395 0.468 0.364 0.235 0.490 0.255 C09 0.861 0.592 0.285 0.270 0.669 0.248 0.196 0.587 0.190 C10 0.782 0.492 0.311 0.234 0.275 0.257 0.154 0.238 0.212 mean 0.978 0.548 0.339 0.258 0.502 0.302 0.167 0.451 0.231 C11 0.294 0.284 0.241 0.112 0.278 0.212 0.098 0.302 0.213 C12 0.259 0.348 0.219 0.125 0.310 0.169 0.100 0.283 0.193 C13 0.211 0.294 0.340 0.132 0.276 0.304 0.104 0.248 0.204 C14 0.253 0.330 0.268 0.112 0.261 0.244 0.094 0.231 0.180 mean 0.254 0.314 0.267 0.120 0.281 0.232 0.099 0.266 0.198 比较3种方案10 d定轨解算的钟差结果,比较时需要消除两家定轨结果中不同的钟差基准影响,通常采用所谓的“二次差”法[13],本文选择C01卫星作为参考星,然后其他卫星计算的钟差结果相对C01卫星的钟差做一次差,并将消除了基准钟差影响的计算结果之间做二次差,统计其他卫星的RMS值,结果如图 7。
从图 7的结果可以看出,方案3的钟差之差的均值为0.31 ns,方案2的钟差之差的均值为0.51 ns,方案1的钟差之差的均值为1.86 ns,方案3的结果最好,这与轨道的评估结果一致。
5 结语
BDS卫星精密定轨中应用最多的经验型光压模型是ECOM模型,但是该模型解算参数较多,不一定解算全部参数定轨效果最佳,因此本文针对ECOM模型在BDS定轨中的应用特性,分析参数的特性,寻求最佳的参数组合方式,以期提高BDS卫星精密定轨的精度,主要结论如下。
1) 将2014年GFZ解算的BDS星历作为伪观测值,采用几何轨道平滑的方式,解算出ECOM模型的9个光压参数,统计了这9参数一年的相关性、量级及周期特性,发现Bc、Bs参数存在明显的周年特性,而Yc、Ys则不明显,且Bc、Bs的量级较Yc、Ys高,参数显著性检验也证明Bc、Bs参数的显著性水平明显高于Yc、Ys;
2) 采用MGEX实测数据进行定轨,根据以上分析的参数不同的组合方式,选择了3种不同的方案,分别采用内符合和外符合两种方式评估3种方案定轨精度,结果表明:只解算D0、Y0、B0、Bc、Bs 5个参数定轨效果最佳,因此建议BDS定轨中使用5参数的ECOM经验型光压模型。
-
表 1 微博共词网络中的概念定义
Table 1 Conceptions Table of the Microblog Co-word Networks
序号 定义 解释 1 u, v 表示网络的节点,即微博 2 U={i}, V={j} 表示微博u, v所包含的词汇集合,其中i、j表示词汇 3 E(u, v) 表示网络中连接节点u, v之间的边。当U∩V≠$\emptyset $, 且U∩V$ \subseteq $T, E(u, v)存在 4 T={t} 表示能够代表微博主题信息的关键词集合, 其中t表示主题关键词 5 Nco-wordsu, v 表示微博u, v中相同关键词出现的总次数 6 Ntotal-wordsu, v 表示微博u, v所包含所有词汇的个数 7 WE(u, v) 表示网络中边E(u, v)的权重,${W_{E(u, v)}} = \frac{{N_{{\rm{co - words}}}^{u, v}}}{{N_{{\rm{total - words}}}^{u, v}}} $ 表 2 基于共词网络的社交媒体数据主题挖掘方法与LDA主题模型的准确率和召回率对比
Table 2 Precision and Recall of the Co-word Based Topic Mining Method and LDA Topic Model
纯度 基于共词网络的社交媒体数据主题挖掘方法 LDA模型 准确率 召回率 准确率 召回率 0.3 0.66 0.60 0.55 0.42 0.4 0.70 0.56 0.58 0.35 0.5 0.81 0.46 0.69 0.23 0.6 0.84 0.41 0.73 0.18 0.7 0.88 0.38 0.80 0.08 0.8 0.94 0.27 0.83 0.07 0.9 0.97 0.23 1.00 0 -
[1] Sakaki T, Okazaki M, Matsuo Y. Earthquake Shakes Twitter Users: Real-Time Event Detection by Social Sensors[C]. The 19th International Conference on World Wide Web, New York, NY, USA, 2010 http://dl.acm.org/citation.cfm?id=1772777
[2] Liu Y, Sui Z, Kang C, et al. Uncovering Patternsof Inter-Urban Trip and Spatial Interaction from Social Media Check-In Data[J]. Plos One, 2014, 9(1): e86026 doi: 10.1371/journal.pone.0086026
[3] Caverlee J, Cheng Z, Sui D Z, et al. Towards Geo-Social Intelligence: Mining, Analyzing, and Leveraging Geospatial Footprints in Social Media[J]. IEEE Data Eng Bull, 2013, 36(3): 33-41 http://www.sciencedirect.com/science/article/pii/S092427161300124X
[4] Li L, Goodchild M F, Xu B. Spatial, Temporal, and Socioeconomic Patterns in the Use of Twitter and Flickr[J]. Cartography and Geographic Information Science, 2013, 40(2): 61-77 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=abcf51fbc8888fe17125ec9e7101904b
[5] Nagel A C, Tsou M H, Spitzberg B H, et al. The Complex Relationship of Realspace Events and Messages in Cyberspace: Case Study of Influenza and Pertussis Using Tweets[J]. Journal of Medical Internet Research, 2013, 15(10):e237-1-e237-13 http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3841359/
[6] Salathé M, Khandelwal S. Assessing Vaccination Sentiments with Online Social Media: Implications for Infectious Disease Dynamics and Control[J]. Plos Computational Biology, 2011, 7(10): e1002199 doi: 10.1371/journal.pcbi.1002199
[7] Achrekar H, Gandhe A, Lazarus R, et al. Predicting Flu Trends Using Twitter Data[C]. Computer Communications Workshops (INFOCOM WKSHPS) on 2011 IEEE Conference, Shanghai, China, 2011 http://www.researchgate.net/publication/224243222_Predicting_Flu_Trends_using_Twitter_data
[8] 王艳东, 荆彤, 姜伟, 等.利用社交媒体数据模拟城市空气质量趋势面[J].武汉大学学报·信息科学版, 2017, 42(1):14-20 http://ch.whu.edu.cn/CN/abstract/abstract5629.shtml Wang Yandong, Jing Tong, Jiang Wei, et al. Mo-deling Urban Air Quality Trend Surface Using Social Media Data[J]. Geomatics and Information Science of Wuhan University, 2017, 42(1):14-20 http://ch.whu.edu.cn/CN/abstract/abstract5629.shtml
[9] Yates D, Paquette S. Emergency Knowledge Management and Social Media Technologies: A Case Study of the 2010 Haitian Earthquake[J]. International Journal of Information Management, 2011, 31(1): 6-13 doi: 10.1016/j.ijinfomgt.2010.10.001
[10] Tsou M H, Yang J A, Lusher D, et al. Mapping Social Activities and Concepts with Social Media (Twitter) and Web Search Engines (Yahoo and Bing): A Case Study in 2012 US Presidential Election[J]. Cartography and Geographic Information Science, 2013, 40(4): 337-348 doi: 10.1080/15230406.2013.799738
[11] Tumasjan A, Sprenger T O, Sandner P G, et al. Predicting Elections with Twitter: What 140 Cha-racters Reveal About Political Sentiment[J]. Icwsm, 2010, 10(1): 178-185
[12] Ferrari L, Rosi A, Mamei M, et al. Extracting Urban Patterns from Location-Based Social Networks[C]. The 3rd ACM SIGSPATIAL International Workshop on Location-Based Social Networks, Chicago, Illinois, USA, 2011 http://www.researchgate.net/publication/241622554_Extracting_urban_patterns_from_location-based_social_networks
[13] Culotta A. Towards Detecting Influenza Epidemics by Analyzing Twitter Messages[C]. The First Workshop on Social Media Analytics, New York, USA, 2010 http://www.researchgate.net/publication/224890435_Towards_detecting_influenza_epidemics_by_analyzing_Twitter_messages
[14] Huang Q, Xiao Y. Geographic Situational Awareness: Mining Tweets for Disaster Preparedness, Emergency Response, Impact, and Recovery[J]. ISPRS International Journal of Geo-Information, 2015, 4(3): 1 549-1 568 doi: 10.3390/ijgi4031549
[15] 王艳东, 李昊, 王腾, 等.基于社交媒体的突发事件应急信息挖掘与分析[J].武汉大学学报·信息科学版, 2016, 41(3): 290-297 http://ch.whu.edu.cn/CN/abstract/abstract4565.shtml Wang Yandong, Li Hao, Wang Teng, et al. The Mining and Analysis of Emergency Information in Sudden Events Based on Social Media[J]. Geoma-tics and Information Science of Wuhan University, 2016, 41(3): 290-297 http://ch.whu.edu.cn/CN/abstract/abstract4565.shtml
[16] 段炼, 呙维, 朱欣焰, 等.基于时空主题模型的微博主题提取[J].武汉大学学报·信息科学版, 2014, 39(2):210-213 http://ch.whu.edu.cn/CN/abstract/abstract2922.shtml Duan Lian, Guo Wei, Zhu Xinyan, et al. Constructing Spatio-Temporal Topic Model for Microblog Topic Retrieving[J]. Geomatics and Information Science of Wuhan University, 2014, 39(2):210-213 http://ch.whu.edu.cn/CN/abstract/abstract2922.shtml
[17] Zhao W X, Jiang J, Weng J, et al. Comparing Twitter and Traditional Media Using Topic Models[C]. Advances in Information Retrieval, Berlin, Garmany, 2011 http://www.springerlink.com/content/9614610q7q13m4k6
[18] Kireyev K, Palen L, Anderson K. Applications of Topics Models to Analysis of Disaster-Related Twitter Data[C]. NIPS Workshop on Applications for Topic Models: Text and Beyond, Whistler, Canada, 2009
[19] 程齐凯, 王晓光.一种基于共词网络社区的科研主题演化分析框架[J].图书情报工作, 2013, 57(8): 91-96 http://d.old.wanfangdata.com.cn/Periodical/tsqbgz201308017 Cheng Qikai, Wang Xiaoguang. A New Research Frame for Analyzing the Evolution of Research Topics Based on Co-word Network Communities[J]. Library and Information Service, 2013, 57(8): 91-96 http://d.old.wanfangdata.com.cn/Periodical/tsqbgz201308017
[20] 路永和, 李焰锋.改进TF-IDF算法的文本特征项权值计算方法[J].图书情报工作, 2013, 57(3): 90-95 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=QKV20132013050600094694 Lu Yonghe, Li Yanfeng. Improvement of Text Feature Weighting Method Based on TF-IDF Algorithm[J]. Library and Information Service, 2013, 57(3): 90-95 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=QKV20132013050600094694
[21] Jiang B. Head/Tail Breaks: A New Classification Scheme for Data with a Heavy-Tailed Distribution[J]. The Professional Geographer, 2013, 65(3): 482-494 doi: 10.1080/00330124.2012.700499
[22] Sampson G. Word Frequency Distributions[J]. Computational Linguistics, 2002, 28(4): 565-569 http://d.old.wanfangdata.com.cn/Periodical/jsjkxjsxb-e201101003
[23] Blondel V D, Guillaume J L, Lambiotte R, et al. Fast Unfolding of Communities in Large Networks[J]. Journal of Statistical Mechanics: Theory and Experiment, 2008, DOI: 10.1088/1742-5468/2008/10/P10008
[24] Heinrich G. Parameter Estimation for Text Analysis[EB/OL]. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.74.6555&rep=rep1&type=pdf, 2008
[25] Bakillah M, Li R Y, Liang S H L. Geo-Located Community Detection in Twitter with Enhanced Fast-Greedy Optimization of Modularity: The Case Study of Typhoon Haiyan[J]. International Journal of Geographical Information Systems, 2015, 29(2):258-279 doi: 10.1080/13658816.2014.964247
[26] 孙继松, 何娜, 王国荣, 等. "7.21"北京大暴雨系统的结构演变特征及成因初探[J].暴雨灾害, 2012, 31(3):218-225 http://d.old.wanfangdata.com.cn/Periodical/hbqx201203004 Sun Jisong, He Na, Wang Guorong, et al. Preliminary Analysis on Synoptic Configuration Evolvement and Mechanism of a Torrential Rain Occurring in Beijing on 21 July, 2012[J]. Torrential Rain and Disasters, 2012, 31(3):218-225 http://d.old.wanfangdata.com.cn/Periodical/hbqx201203004
-
期刊类型引用(5)
1. 李鹏杰,张捍卫,谢孟辛,赵东方. 北斗三号卫星精密定轨中的光压模型研究. 天文学报. 2023(04): 127-139 . 百度学术
2. 李子强,辛洁,郭睿,李晓杰,唐成盼,田翌君. 基于北斗星间链路的卫星自主导航可行性分析. 武汉大学学报(信息科学版). 2022(01): 55-60 . 百度学术
3. 常春涛,慕仁海,程鹏飞,成英燕. 新太阳光压模型在GNSS定轨中的应用. 测绘科学. 2021(02): 78-84 . 百度学术
4. 王磊,赵春梅,何正斌,马天明. 低轨卫星激光测距轨道预报方法及精度分析. 导航定位学报. 2021(04): 24-31 . 百度学术
5. 薛建华,刘超,赵瑞. 先验光压模型对Galileo卫星产品性能的影响分析. 地球物理学进展. 2019(03): 969-973 . 百度学术
其他类型引用(7)