基于句法结构分析的同义词识别方法研究

被引:18
作者
于娟 [1 ]
尹积栋 [2 ]
费庶 [3 ]
机构
[1] 福州大学公共管理学院
[2] 江西省标准化研究院
[3] 大连职业技术学院图书馆
关键词
同义词识别; 句法结构分析; 文本挖掘;
D O I
暂无
中图分类号
TP311.13 []; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对同义词识别方法中因重心后移造成的语义相似度计算偏差问题,提出一种基于句法结构分析的同义词识别方法。首先采用句法结构分析方法处理需要做同义词识别的词(或短语),然后基于同义词词林来计算词(或短语)间的相似度。该方法等价地分析词(或短语)中的各个原子词,从而消除重心后移方法所造成的识别偏差。实验证明,该同义词识别方法性能良好,具有较高的可行性,可以为文本挖掘和语义检索领域提供新思路。
引用
收藏
页码:35 / 40
页数:6
相关论文
共 9 条
[1]
基于同义词词林的词语相似度计算方法 [J].
田久乐 ;
赵蔚 .
吉林大学学报(信息科学版), 2010, 28 (06) :602-608
[2]
结合词性分析与串频统计的词语提取方法 [J].
于娟 ;
党延忠 .
系统工程理论与实践, 2010, (01) :105-111
[3]
基于词汇语义计算的文本相似度研究 [J].
余刚 ;
裴仰军 ;
朱征宇 ;
陈华月 .
计算机工程与设计, 2006, (02) :241-244
[4]
改进的中文同义词相似匹配方法 [J].
王兰成 ;
李超 .
中国图书馆学报, 2005, (03) :61-64
[5]
基于层叠隐马模型的汉语词法分析 [J].
刘群 ;
张华平 ;
俞鸿魁 ;
程学旗 .
计算机研究与发展, 2004, (08) :1421-1429
[6]
基于N-最短路径方法的中文词语粗分模型 [J].
张华平 ;
刘群 .
中文信息学报, 2002, (05) :1-7
[7]
计算机识别汉语同义词的两种算法比较和测评 [J].
朱毅华 ;
侯汉清 ;
沙印亭 .
中国图书馆学报, 2002, (04)
[8]
汉语词汇字面相似性原理与后控制词表动态维护研究[J] 宋明亮 情报学报 1996, 04
[9]
后控规范的计算机处理 [J].
王源 ;
吴晓滨 ;
涂从文 ;
刘滨 ;
章元峰 ;
王金娥 .
现代图书情报技术, 1993, (02) :4-7