-
摘要: 中文地名识别是命名实体识别的重要研究课题之一,也是提高地理信息系统应用水平的关键。传统的地名识别主要基于词性或地名要素特征,特征类型有限。提出了一种基于复合特征的中文地名识别方法,挖掘中文地名在自然语言中的特点,设计了类型、路径、距离和数量四种句法特征,基于地名要素特征、词性特征、句法特征三种复合特征利用条件随机场模型实现了中文地名的训练和识别。通过实验对比复合特征在中文地名识别方法的效果,结果表明复合特征能够有效提高中文地名识别的准确率和召回率,尤其是对于复杂地名的识别,具有良好的效果。Abstract: Chinese place name recognition is a research topic in named entity recognition, and a key to improve the application level of the geographic information systems in China. The traditional place name recognition method is based on the element characteristics of a place name and the part of speech of words, and employs limited features. This paper proposes a method of Chinese place name recognition method using syntactic features, and mines the syntactic characteristics of place names in natural language. The design employs four syntactic features, class, path, distance, and number, in conditional random fields (CRF) to train and recognize Chinese place names based on place name element s, position of speech (POS) and syntactic features. Comparative experiments with composite features and traditional features for Chinese place name show that with the help of the three composite feature, s Chinese place name recognition accuracy and recall rate can be improved effectively and with good results for complex place names.
-
公路、铁路隧道施工多采用矿山法、明挖法或暗挖法。在施工过程中需要对其超欠挖情况进行快速、准确地检测与评估,对控制施工成本、分析围岩稳定性、确保施工安全具有重要意义。传统检测方法使用全站仪、断面仪等设备对断面进行逐点测量,无法对全断面进行检测,效率较低。三维激光扫描技术具备高穿透性、高密度、高精度等特点,将其应用于隧道超欠挖检测,能够快速获取施工区域隧道绝对点云,实现目标断面提取、超欠挖检测、超欠挖方量计算等目标。
使用激光点云进行隧道超欠挖检测的一般思路是获取隧道中线[1-6]、点云滤波[7]、截面提取及超欠挖计算。文献[8-9]将地面三维激光扫描技术应用于隧道全断面变形测量,给出测站间距和扫描分辨率的最佳取值;文献[10]基于非均匀有理B样条(non-uniform rational B-splines, NURBS)曲面理论,对配准、去噪、精简后的点云建立三维模型,将多期测量结果叠加分析,得到隧道变化情况;文献[11]通过对两期地铁隧道点云连续断面提取与分析,获得不同时期的隧道变形量;文献[12]通过单调链凸包算法提取隧道轮廓线,剔除噪声后进行超欠挖计算;文献[13]使用统计滤波去噪、主成分分析法提取隧道轴线的方式进行断面提取与超欠挖检测;文献[14]将三维点云展平,通过图像分析判断超欠挖;文献[15]通过多视影像获得三维点云,进而计算超欠挖;文献[16-17]则通过双三次B样条拟合隧道曲面,对模型进行格网分析,从而求取超欠挖结果;文献[18]使用NURBS曲面对隧道建模,并与设计曲面进行布尔运算,判断超欠挖。
上述方法或要求已知设计中线,或规定隧道必须是指定形状,与公路、铁路隧道建设实际不符,且没有考虑站式扫描点云不均匀带来的计算效率和效果差异,对海量三维点云进行建模、影像处理等手段效率较低,不适合现场工作。本文提出了一种基于三维激光扫描点云的隧道超欠挖高精度即时快速检测算法,通过基于外包矩形和设计文件的中线快速提取、基于中线微元垂线簇的断面提取、点云下采样参数优化、点云投影和投影面滤波对数据进行预处理,采用基于内轮廓的反距离加权方法计算超欠挖结果。算法流程如图1所示。
1 隧道断面提取算法
1.1 基于外包矩形和设计文件监督的隧道中线快速提取
隧道断面提取的前提是中线已知,由于爆破、沉降等原因,在初支、二衬阶段,设计中线与实际中线存在一定误差,导致实际断面与设计断面匹配错误。当隧道处于弯曲处,对中线进行插值加密也会导致设计中线与实际中线不符,如图2(a)中
与 所示。隧道点云在XOY平面投影的最大、最小坐标分别为( , )、( , ),确定的包围矩形如图2(a)蓝色矩形所示。 本文通过提取点云在XOY平面的外包矩形判别隧道轴向,结合拱顶计算中线点,并联合设计中线加密隧道中线,在保持高效的同时获得了较好的效果,具体过程如下:在待检测隧道区段放置至少3个靶球,使用全站仪测量隧道逐桩控制点坐标,通过后方交会原理获取靶球十字丝中心坐标;使用三维激光扫描仪获取区段点云,从中提取球型靶标并拟合其中心;获取至少3对靶球中心坐标,通过站间坐标转换得到绝对点云。绝对点云获取原理如图3所示。
现场工作时,对单站点云或若干站拼接后的点云进行处理,其范围往往较小,不存在大角度转弯,则外包矩形存在一条对角线贯穿隧道。如图2(a)所示,根据几何关系,求
与 、 与 的距离之和,计算式分别为: (1) 式中,
为隧道半径; 为隧道长度; 是隧道壁与包围盒X轴的夹角; 是设计中线与包围盒X轴的夹角,二者的几何关系为: (2) 如图2(b)和2(c)所示,当隧道与X轴夹角接近45°时,
、 分别对应隧道最大直径、隧道长度;当隧道向坐标轴旋转时,后者大于前者,且二者之差逐渐缩小;当隧道与坐标轴平行时,二者相等,根据距离可判断 为隧道的近似轴向。 按照工程要求,设置合理的距离初值,在
方向生成一组相互平行的直线簇,与隧道边界交点为 、 ;由于从任意角度截取隧道断面时,拱顶点与中线点在XOY平面重合,因此可以取该截面内的拱顶点集,计算拱顶中点坐标作为该区段的初始中线点。没有设计文件参考时,将该点作为截面的计算中点;有设计文件参考时,在对应里程处的插值点坐标为 ,则新的中线点计算式为: (3) 式中,
是用于计算中线点的边界点权重,隧道曲率越大,该权重越大。 1.2 基于隧道中线微元垂线簇的断面提取
初步获取隧道中线后,可以采用插值进一步加密中线,以提高断面截取的效率。设加密后中线点集为
,对于任意两个相邻中点 、 ,它们连接形成的直线段是隧道轴线微元,与该线段相交且垂直的直线斜率相同,计算式为: (4) 任意里程处断面截取如图4所示,要获取某个里程点
处、长度为 范围内的投影截面,可以计算前后各d/2处的中线点 和 。在斜率 下,对应的截距 和 限制了截面的里程范围。对于任意实际测量点,落在该目标截面的条件计算式为: (5) 式中,
和 分别是实际测量点到起止里程处隧道中线微元垂线的距离; 是将该点坐标代入解析式得到的截距。 1.3 断面点云非均匀下采样优化
使用地面三维激光扫描仪对隧道进行测量,能够获取超高密度的点云数据,但原始点云数据量过大,直接计算效率低,需要对其进行下采样。由于测站到各点的距离不同,隧道点云本身存在非均匀问题,下采样过度会导致两端点云过于稀疏,下采样不足则导致中间处计算效率低下。
扫描角度影响测点距离的原理如图5所示。在理想情况下,测站设置在隧道中心线上,当扫描仪转动相同的角度时,隧道远端点间距
大于垂直处点间距 。当远端光线与垂直光线的夹角为 时,远端区域和垂直区域的点云密度关系计算式为: (6) 式中,
是扫描仪的测角分辨率; 是扫描仪到隧道的垂直距离; 和 分别是远端区域和垂直区域的点密度。 为满足后续计算需要,设每米断面内的点数为
,最小点数为 ,推荐点数为 。在边缘区域,对于长度为 的断面,其包含的点数为: (7) 分断面下采样的步骤为:当断面内点数小于
时,建议不取该断面计算;当断面内点数小于 且大于 时,不进行下采样;否则,下采样至 点。 和 均由后续实验给出。 1.4 截面点云快速投影
要进一步进行超欠挖检测,需要将符合要求的空间点云投影到隧道轴向垂线所在的平面
,断面投影过程如图6所示。以该目标里程的中线点为原点,分别计算点到轴线的距离和Z方向的距离,可以避免复杂坐标转换,直接得到投影截面结果,将断面截取从秒级[19]提示至亚毫秒级,计算式为: (8) 式中,
是中线点所在直线的截距; 是该里程处的中线点; 是落在该截面内的实际测量点的点号; 是对应点号的实际测量点坐标。 1.5 断面非隧道壁结构噪声剔除
传统基于圆柱或椭圆柱拟合[20-22]的隧道点云滤波方法以设计断面为依据,剔除拟合后不满足距离条件的点。但在隧道建设过程中,尤其是开挖、初支阶段,隧道壁本身存在很大变化,这类方法容易将超欠挖部分当作噪声剔除。本文利用截面点云连续性,在设计断面辅助下对非隧道壁结构噪声进行剔除,能够尽可能地还原真实情况。
断面噪声剔除原理如图7所示。以原点为极点,建立用于滤波的极坐标系。将设计断面与当前断面在该坐标系下显示,任给定一个角度
,在其 邻域内均有对应的设计点集与实测点集。正常情况下,设计点与实测点到极点的距离应较为接近,且作为隧道壁的实测点,应当具备连续性。 首先,分别计算同一角度下设计点和实测点到极点的距离,比较二者距离,筛选出距离差大于阈值
的点,剔除测量过程中的非隧道壁结构(图7中①区域)。然后,使用局部随机采样一致性(random sample consensus, RANSAC)圆拟合方法,对该范围的实测点和设计点进行拟合,对比二者的半径,若计算半径差小于阈值 ,则说明该段点云与设计断面一致,可以进一步缩小该段的阈值 以剔除离群点(图7中②区域);若计算半径差大于阈值,则说明该段出现了较大的误差,需要经统计滤波去除离群点后,保留其用于超欠挖计算(图7中③区域)。 2 超欠挖检测算法
2.1 隧道超欠挖检测
依据设计断面与实测断面之间的关系可以计算超欠挖结果[23]。在实际施工过程中,对隧道工程建设影响最大的是欠挖现象,因此本文基于点到极点的距离赋权,获得用于计算的断面点。
在断面的任一角度范围内,计算滤波后的实测断面点到极点的距离,减去最小距离后计算反距离权值,计算式为:
(9) 式中,
是该角度范围内对应点下标; 为反距离权值, ; 是指数值; 是对应点个数; 是最小距离; 是实测距离。此处超欠挖值的计算式为: (10) 式中,
是设计断面对应角度点到极点的距离。 按一定里程间隔
连续取断面、每个断面划分为 个扇形,,则超欠挖方量计算式为: (11) 其中,
是 长度下、以 为间隔截取的截面个数, 。 和 的取值越小,计算精度越高、速度越慢。 2.2 超欠挖结果可视化模型生成
通过超欠挖结果点云构建不规则三角网(triangulated irregular network,TIN),进行三维模型生成与可视化,能够直观地反映超欠挖结果。参与计算的点云包含位置信息和超欠挖信息
,构成超欠挖结果点云。通过位置信息构建不规则三角网,生成三维模型;使用超欠挖结果信息生成色带,对相应位置进行渲染,能够得到表征隧道超欠挖结果的三维模型。 3 实验与分析
3.1 实验数据
本文以广西壮族自治区南湛高速某条正在建设的隧道为实验场景,获取了该隧道左洞的三维点云数据。测量现场如图8所示,其中图8(a)为初支阶段,图8(b)为二衬阶段,图8(b)按里程由小到大为正方向,隧道右侧存在一条输气管道,左侧存在过爆导致的超挖。由于仍处于施工状态,存在大量非隧道壁点云、噪声点。
使用Faro公司生产的某激光扫描仪进行扫描,其扫描参数如表1所示,每站扫描范围12~15 m,共计扫描12站,获得点云数据5.75 GB。设置间隔初值为2 m获取隧道中线点,将计算得到的中线和中线微元垂线簇可视化。图9为扫描得到的40 m里程范围内3站扫描数据配准拼接得到的结果。根据中线划分断面点云,不同截面被赋予不同颜色,黑色框即为§1.1中的外包矩形,红色虚线为过中线点的中线微元垂线簇。
表 1 扫描仪主要参数Table 1. Main Parameters of Scanner技术指标 参数 数据获取速度/(104点·s-1) 97.6 扫描距离/m 0.6~350 测距精度/mm ±1 视场 300°×360° 测角精度/(°) 0.015 由扫描仪参数和§1.3分析可知,隧道点云中间区域每米理论上能测得458.37万点,密度远大于计算超欠挖的最低要求。进行超欠挖计算时,一般设置断面长度为0.05 m,对
取不同值时,断面点云结果如图10所示。分析提取到20个断面,对截取断面内实际平均点数、每1°平均点数、隧道壁连续情况进行统计,对应分析见表2。 表 2 每米不同点数对应的断面截取结果定量分析Table 2. Analysis of Section Interception Results Corresponding to Different Points Per Meter每米点数 截面内实际平均点数 每1°平均点数 隧道壁结构不连续平均次数 隧道壁结构完整性 是否能用于超欠挖计算 4 000 191.95 0.53 >15 不完整 否 8 000 388.61 1.08 >15 不完整 否 15 000 739.83 2.06 7.27 较完整 是,但不建议 25 000 1 226.90 3.41 3.54 较完整 是,一般建议 40 000 1 946.58 5.41 1.98 完整 是,建议取值 60 000 2 923.03 8.12 1.35 完整 是,密度偏大 为保证超欠挖计算的准确性,需要断面内点云投影后的隧道壁结构尽量完整,综合隧道壁结构连续性、点云完整性结果,当
时,下采样后的点云能够用于后续计算,但仍存在部分区域不完整;当 时,下采样结果基本一致,得到的点云能够保证超欠挖计算顺利进行。因此,建议取 , 。 3.2 隧道断面超欠挖结果
根据施工要求,对隧道点云按里程增大方向,每隔1 m截取断面,断面厚度为0.05 m,共得到39个符合要求的断面。实验区间数据详情、配准用时、断面提取用时和超欠挖计算用时见表3。
表 3 数据详情及处理时间Table 3. Data Details and Processing Time评价指标 参数结果 点云数目 92 803 943 配准耗时/s 27.83 格式转换耗时/s 178.51 断面提取耗时/s 39.27 超欠挖计算耗时/s 1.53 图11是不同里程处连续6个断面的超欠挖计算结果,其中右侧是隧道内输气管道。在第3个断面,即图11(c)里程处,使用全站仪测量该断面的超欠挖值,逐点测量和本文算法结果对比见表4,该断面的观测值中误差为0.69 mm。
表 4 第3个断面的超欠挖结果对比Table 4. Comparison Results at the Third Section角度/(°) 计算值/mm 实测值/mm 相对误差/mm 45 44.75 43.97 0.78 60 51.41 51.68 -0.27 90 56.75 56.23 0.52 120 66.66 67.73 -1.07 135 74.47 75.10 -0.63 使用相同设备连续测量上述6个断面的相同角度处超欠挖值,得到的实测结果中误差分别为0.83 mm、0.88 mm、0.69 mm、1.27 mm、0.96 mm、1.10 mm。在该里程范围内,本文所提超欠挖检测算法计算结果与实测值中误差为0.96 mm。
图12为最后生成的超欠挖结果三维模型。获取原始数据后,经过数据预处理、中线生成、断面截取与投影、超欠挖计算得到最终结果,耗时247.14 s,小于传统方法测量用时,且超欠挖计算结果与实测一致,证明本文算法能够实现在线解算,为施工人员提供即时、直观的超欠挖检测结果。
4 结语
针对高密度三维激光扫描技术运用于隧道超欠挖检测,存在数据量大、计算效率低的问题,本文提出了一种现场解算超欠挖结果的算法。利用隧道设计文件先验信息,结合激光扫描仪获取的隧道点云及其包围盒,在顾及设计中线的前提下精确提取实际隧道中线,基于提取到的中线微元垂线簇获取隧道的连续断面;考虑三维激光扫描仪测量原理,对用于隧道超欠挖计算的激光
点云最优密度进行探究,实现下采样参数的优化,兼顾效率与精度;将隧道断面内点云投影至平面,通过局部拟合和相邻点连续性判别,剔除非隧道壁结构点;考虑到欠挖对隧道开挖的影响更大,采用基于内轮廓的反距离加权方法计算超欠挖结果。
实验结果表明,本文方法在总长度为40 m的在建隧道中,数据配准拼接、计算耗时247.14 s,超欠挖计算结果与全站仪实测值的相对中误差为0.96 mm,满足测量精度要求。相比于传统测量方法,能够实现高密度、全断面、精细化的隧道超欠挖检测。本文方法计算复杂度较低,单断面超欠挖结果计算精度高、速度快,但超欠挖体积计算精度取决于截面间距,今后应从高效、高精度三维建模角度探究更优的超欠挖体积计算方法。
-
表 1 地名要素特征表
Table 1 Gazetteer Feature Table
要素类别 要素符号 举例说明 行政区界 省级 RD1 省、直辖市、自治区、特别行政区 市级 RD2 市、地区、盟、自治州 县区级 RD3 县、旗、区 乡镇级 RD4 乡、镇、街道办 村级 RD5 村、庄、屯、里 道路 LR 路、大道、道、大街、街、巷、胡同、条、里 住宅小区 PA 里、区、园、坊、居、寓、苑 标志建筑 PH 大厦、广场、饭店、中心、大楼、楼、场、广场、馆、酒店、局 门牌号 PD 号、# 表 2 句法特征集
Table 2 Syntactic Feature Set
分类 标记 特征名称 说明 类型特征 TP 短语类型 当前词语位于的短语结构类型 TD 依存类型 当前词语与其支配词之间的依存类型 路径特征 PP 短语结构路径 当前词语到第三层父节点之间的路径 PD 依存关系路径 当前词语到第三层父节点之间的路径 距离特征 DP 语法树距离 当前词语在语法树中的层级深度 DD 依存距离 当前词语与核心词之间的依存关系数量 数量特征 NP 名词短语数量 从当前词语到语法树根部的名词短语数量 表 3 中文地名识别实验结果/%
Table 3 Result of Chinese Place Name Recognition Experiment/%
特征组合 准确率 召回率 综合值 GP+POS 87.05 84.45 85.73 GP+POS+TP 88.07 85.71 86.87 GP+POS+TP+TD 88.13 85.65 86.87 GP+POS+TP+TD+PP 91.08 90.56 90.82 GP+POS+TP+TD+PP+PD 91.17 90.37 90.76 GP+POS+TP+TD+PP+PD+DP 92.99 90.98 91.97 GP+POS+TP+TD+PP+PD+DP+DD 93.03 90.88 91.94 GP+POS+TP+TD+PP+PD+DP+DD+NP 92.52 91.02 91.76 表 4 简单与复杂地名识别实验结果/%
Table 4 Result of Simple and Complex Place Name Recognition Experiment/%
特征组合 简单地名 复杂地名 准确率 召回率 综合值 准确率 召回率 综合值 GP+POS 95.31 92.76 94.02 76.43 73.78 75.08 GP+POS+TP 95.55 94.58 95.06 78.45 74.32 76.33 GP+POS+TP+TD 95.57 94.55 95.06 78.57 74.21 76.33 GP+POS+TP+TD+PP 96.24 95.12 95.68 84.45 84.71 84.58 GP+POS+TP+TD+PP+PD 96.29 95.07 95.68 84.58 84.32 84.45 GP+POS+TP+TD+PP+PD+DP 97.44 95.82 96.62 87.28 84.75 86.00 GP+POS+TP+TD+PP+PD+DP+DD 97.46 95.58 96.51 87.34 84.83 86.07 GP+POS+TP+TD+PP+PD+DP+DD+NP 97.37 95.43 96.39 86.29 85.35 85.82 -
[1] 张雪英, 张春菊, 闾国年.地理命名实体分类体系的设计与应用分析[J].地球信息科学学报, 2010(02):2220-2227 https://wap.cnki.net/qikan-DQXX201002012.html Zhang Xueying, Zhang Chunju, Lv Guonian. Design and Analysis of a Classification Scheme of Geographical Named Entities[J]. Journal of Geo-information Science, 2010(02):2220-2227 https://wap.cnki.net/qikan-DQXX201002012.html
[2] 李玉森, 张雪英, 袁正午.面向GIS的地理命名实体识别研究[J].重庆邮电大学学报(自然科学版), 2008, 20(6):719-726 doi: 10.3979/j.issn.1673-825X.2008.06.021 Li Yusen, Zhang Xueying, Yuan Zhengwu. Study on Geographical Entity Recognition in GIS[J]. Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition). 2008, 20(6):719-726 doi: 10.3979/j.issn.1673-825X.2008.06.021
[3] 程昌秀, 于滨.一种基于规则的模糊中文地址分词匹配方法[J].地理与地理信息科学, 2011(03):26-29 http://www.docin.com/p-1034547956.html Cheng Changxiu, Yu Bin. A Rule-Based Segmenting and Matching Method for Fuzzy Chinese Addresses[J]. Geography and Geo-Information Science. 2011(03):26-29 http://www.docin.com/p-1034547956.html
[4] 张雪英, 闾国年, 李伯秋.基于规则的中文地址要素解析方法[J].地球信息科学学报, 2010(01):9-16 http://or.nsfc.gov.cn/handle/00001903-5/52841 Zhang Xueying, Lv Guonian, Li Boqiu. Rule-based Approach to Semantic Resolution of Chinese Addresses[J]. Journal of Geo-information Science. 2010(01):9-16 http://or.nsfc.gov.cn/handle/00001903-5/52841
[5] 谭侃侃. 基于规则的中文地址分词与匹配方法[D]. 青岛: 山东科技大学, 2011 http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=D300758 Tan Kankan. Rule-based Chinese Address Segmentation and Matching Methods[D]. Qingdao: Shandong University of Science and Technology, 2011 http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=D300758
[6] 杜萍, 刘勇.基于本体的中文地名识别[J].西北师范大学学报(自然科学版), 2011, 47(06):87-93 doi: 10.3969/j.issn.1001-988X.2011.06.017 Du Ping, Liu Yong. Recognition of Chinese Place Names Based on Ontology[J]. Journal of Northwest Normal University(Natural Science), 2011, 47(06):87-93 doi: 10.3969/j.issn.1001-988X.2011.06.017
[7] 邱莎, 阿圆, 王付艳, 等.基于统计的中文地名自动识别研究[J].计算机技术与发展, 2011, 21(11):35-38 doi: 10.3969/j.issn.1673-629X.2011.11.010 Qiu Sha, A. Yuan, Wang Fuyan, et al. Study on Automatic Recognition of Chinese Location Names Based on Statistical Method[J]. Computer Technology and Development, 2011, 21(11):35-38 doi: 10.3969/j.issn.1673-629X.2011.11.010
[8] 唐旭日, 陈小荷, 张雪英.中文文本的地名解析方法研究[J].武汉大学学报·信息科学版, 2010, 35(08):930-935 http://ch.whu.edu.cn/CN/abstract/abstract1028.shtml Tang Xuri, Chen Xiaohe, Zhang Xueying. Research on Toponym Resolution in Chinese Text[J]. Geomatics and Information Science of Wuhan University, 2010, 35(08):930-935 http://ch.whu.edu.cn/CN/abstract/abstract1028.shtml
[9] Aaron L F H, Derek F W, Lidia S C. Chinese Named Entity Recognition with Conditional Random Fields in the Light of Chinese Characteristics[M]. LP & ⅡS2013, Warsaw:Springer, 2013
[10] Chen Wenliang, Zhang Yujie, Hitoshi Isahara. Chinese Named Entity Recognition with Conditional Random Fields[C]. Proceedings of the Fifth SIGHAN Workshop on Chinese Language Processing, Sydney, Australia, 2006 https://www.researchgate.net/publication/228884241_Chinese_Named_Entity_Recognition_with_Conditional_Random_Fields?_sg=-ok_AMlW8JZUsxa7A_ar8WyW2cnVkuRLSsoF7zlYRg7jaeJzhBh39xhpGVVQfPYldZxrB__bXwS6ZASISBcFEw
[11] 高玲玲. 基于依存语法的汉语句法分析研究[D]. 青岛: 中国海洋大学, 2009 http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y1503127 Gao Lingling. A Study on Chinese Syntax Analysis Based on Dependency Grammer[D]. Qingdao: Ocean University of China, 2009 http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y1503127
[12] 尹德春. 基于语言实体关系模型的汉语句法分析[D]. 北京: 北京理工大学, 2014 http://cdmd.cnki.com.cn/article/cdmd-10007-1014086884.htm Yin Dechun. Chinese Syntactic Parsing Based on Linguistic Entity Relationship Model[D]. BeiJing: Beijing Institute of Technology, 2014 http://cdmd.cnki.com.cn/article/cdmd-10007-1014086884.htm
[13] Lafferty J, Mccallum A, Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C]. Proc of the 18th ICML, San Francisco, USA, 2001 http://dl.acm.org/citation.cfm?id=655813&dl=
[14] 李正华. 汉语依存句法分析关键技术研究[D]. 哈尔滨: 哈尔滨工业大学, 2013 http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=D421199 Li Zhenghua. Research on Key Technologies of Chinese Dependency Parsing[D]. Harbin: Harbin Institute of Technology, 2013 http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=D421199
[15] 俞士汶, 段慧明, 朱学锋, 等.北京大学现代汉语语料库基本加工规范[J].中文信息学报, 2002(05):49-64 doi: 10.3969/j.issn.1003-0077.2002.05.008 Yu Shiwen, Duan Huiming, Zhu Xuefeng, et al. The Basic Processing of Contemporary Chinese Corpus at Peking University[J]. Journal of Chinese Information Processing, 2002(05):49-64 doi: 10.3969/j.issn.1003-0077.2002.05.008
[16] Benajiba Y, Zitouni I, Diab M, et al. Arabic Named Entity Recognition: Using Features Extracted from Noisy Data[C]. Proceedings of the ACL 2010 Conference Short Papers, Uppsala, Sweden, 2010
[17] Laokulrat N, Miwa M, Tsuruoka Y, et al. Uttime: Temporal Relation Classification Using Deep Syntactic Features[C]. Second Joint Conference on Lexical and Computational Semantics, Atlanta, USA, 2013 http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.310.4967
[18] Arisoy E, Saraclar M, Roark B, et al. Syntactic and Sub-lexical Features for Turkish Discriminative Language Models[C]. Acoustics Speech and Signal Processing, Dallas, USA, 2010 http://ieeexplore.ieee.org/document/5495226/
[19] Hancke J, Vajjala S, Meurers D. Readability Classification for German Using Lexical, Syntactic, and Morphological Features[C]. 24th International Conference on Computational Linguistics, Mumbai, India, 2012 https://www.researchgate.net/publication/261797318_Readability_Classification_for_German_using_Lexical_Syntactic_and_Morphological_Features
[20] Bykh S, Meurers D. Exploring Syntactic Features for Native Language Identification: A Variationist Perspective on Feature Encoding and Ensemble Optimization[C]. 25th International Conference on Computational Linguistics, Dublin, Ireland, 2014
[21] 戴敏, 王荣洋, 李寿山, 等.基于句法特征的评价对象抽取方法研究[J].中文信息学报, 2014, 28(04):92-97 doi: 10.3969/j.issn.1003-0077.2014.04.012 Dai Min, Wang Rongyang, Li Shoushan, et al. Opinion Target Extraction with Syntactic Features[J]. Journal of Chinese Information Processing, 2014, 28(04):92-97 doi: 10.3969/j.issn.1003-0077.2014.04.012
[22] 郭喜跃, 何婷婷, 胡小华, 等.基于句法语义特征的中文实体关系抽取[J].中文信息学报, 2014, 28(6):183-189 http://d.g.wanfangdata.com.cn/Periodical_zwxxxb201406026.aspx Guo Xiyue, He Tingting, Hu Xiaohua, et al. Chinese Named Entity Relation Extraction Based on Syntactic and Semantic Features[J]. Journal of Chinese Information Processing, 2014, 28(6):183-189 http://d.g.wanfangdata.com.cn/Periodical_zwxxxb201406026.aspx
[23] 徐冰, 赵铁军, 王山雨, 等.基于浅层句法特征的评价对象抽取研究[J].自动化学报, 2011, 37(10):1241-1247 https://www.wenkuxiazai.com/doc/61c552da69eae009591bec62.html Xu Bing, Zhao Tiejun, Wang Shanyu, et al. Extraction of Opinion Targets Based on Shallow Parsing Features[J]. Acta Automatica Sinica, 2011, 37(10):1241-1247 https://www.wenkuxiazai.com/doc/61c552da69eae009591bec62.html
[24] Mukherjee S, Tiwari A, Gupta M, et al. Shallow Discourse Parsing with Syntactic and (a Few) Semantic Features[C]. Proceedings of the Nineteenth Conference on Computational Natural Language Learning, Beijing, China, 2015 https://www.researchgate.net/publication/301446652_Shallow_Discourse_Parsing_with_Syntactic_and_a_Few_Semantic_Features
[25] Johansson R, Moschitti A. Syntactic and Semantic Structure for Opinion Expression Detection[C]. Proceedings of the Fourteenth Conference on Computational Natural Language Learning, Uppsala, Sweden, 2010 http://dl.acm.org/citation.cfm?id=1870578
[26] Stein D, Peitz S, Vilar D, et al. A Cocktail of Deep Syntactic Features for Hierarchical Machine Translation[C]. Conference of the Association for Machine Translation, Denver, USA, 2010 https://www.researchgate.net/publication/265358795_A_Cocktail_of_Deep_Syntactic_Features_for_Hierarchical_Machine_Translation
[27] Loni B, Van T G, Wiggers P, et al. Question Classification by Weighted Combination of Lexical, Syntactic and Semantic Features[M]. Text, Speech and Dialogue, Pilsen, Czech: Springer, 2011
[28] Grundström J, Nugues P. Using Syntactic Features in Answer Reranking[C]. AAAI 2014 Workshop on Cognitive Computing for Augmented Human Intelligence, Québec, Canada, 2014 https://aaai.org/ocs/index.php/WS/AAAIW14/paper/view/8716
[29] 蒋文明, 张雪英, 李伯秋.基于条件随机场的中文地址要素识别方法[J].计算机工程与应用, 2010, 46(13):129-131 doi: 10.3778/j.issn.1002-8331.2010.13.038 Jiang Wenming, Zhang Xueying, Li Boqiu. CRFs-based Approach to Recognition of Chinese Address Element[J]. Computer Engineering and Application, 2010, 46(13):129-131 doi: 10.3778/j.issn.1002-8331.2010.13.038