学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于句法结构分析的同义词识别方法研究
被引:18
作者
:
论文数:
引用数:
h-index:
机构:
于娟
[
1
]
尹积栋
论文数:
0
引用数:
0
h-index:
0
机构:
江西省标准化研究院
福州大学公共管理学院
尹积栋
[
2
]
论文数:
引用数:
h-index:
机构:
费庶
[
3
]
机构
:
[1]
福州大学公共管理学院
[2]
江西省标准化研究院
[3]
大连职业技术学院图书馆
来源
:
现代图书情报技术
|
2013年
/ 09期
关键词
:
同义词识别;
句法结构分析;
文本挖掘;
D O I
:
暂无
中图分类号
:
TP311.13 [];
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
针对同义词识别方法中因重心后移造成的语义相似度计算偏差问题,提出一种基于句法结构分析的同义词识别方法。首先采用句法结构分析方法处理需要做同义词识别的词(或短语),然后基于同义词词林来计算词(或短语)间的相似度。该方法等价地分析词(或短语)中的各个原子词,从而消除重心后移方法所造成的识别偏差。实验证明,该同义词识别方法性能良好,具有较高的可行性,可以为文本挖掘和语义检索领域提供新思路。
引用
收藏
页码:35 / 40
页数:6
相关论文
共 9 条
[1]
基于同义词词林的词语相似度计算方法
[J].
论文数:
引用数:
h-index:
机构:
田久乐
;
论文数:
引用数:
h-index:
机构:
赵蔚
.
吉林大学学报(信息科学版),
2010,
28
(06)
:602
-608
[2]
结合词性分析与串频统计的词语提取方法
[J].
论文数:
引用数:
h-index:
机构:
于娟
;
论文数:
引用数:
h-index:
机构:
党延忠
.
系统工程理论与实践,
2010,
(01)
:105
-111
[3]
基于词汇语义计算的文本相似度研究
[J].
余刚
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
余刚
;
裴仰军
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
裴仰军
;
论文数:
引用数:
h-index:
机构:
朱征宇
;
陈华月
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
陈华月
.
计算机工程与设计,
2006,
(02)
:241
-244
[4]
改进的中文同义词相似匹配方法
[J].
王兰成
论文数:
0
引用数:
0
h-index:
0
机构:
解放军南京政治学院上海分院信息管理系
王兰成
;
李超
论文数:
0
引用数:
0
h-index:
0
机构:
解放军南京政治学院上海分院信息管理系
李超
.
中国图书馆学报,
2005,
(03)
:61
-64
[5]
基于层叠隐马模型的汉语词法分析
[J].
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所北京,北京大学计算语言学研究所北京,北京,中国科学院研究生院北京,北京,北京
刘群
;
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所北京,北京大学计算语言学研究所北京,北京,中国科学院研究生院北京,北京,北京
张华平
;
俞鸿魁
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所北京,北京大学计算语言学研究所北京,北京,中国科学院研究生院北京,北京,北京
俞鸿魁
;
程学旗
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所北京,北京大学计算语言学研究所北京,北京,中国科学院研究生院北京,北京,北京
程学旗
.
计算机研究与发展,
2004,
(08)
:1421
-1429
[6]
基于N-最短路径方法的中文词语粗分模型
[J].
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
张华平
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
刘群
.
中文信息学报,
2002,
(05)
:1
-7
[7]
计算机识别汉语同义词的两种算法比较和测评
[J].
论文数:
引用数:
h-index:
机构:
朱毅华
;
论文数:
引用数:
h-index:
机构:
侯汉清
;
沙印亭
论文数:
0
引用数:
0
h-index:
0
机构:
江苏南京农业大学情报系
沙印亭
.
中国图书馆学报,
2002,
(04)
[8]
汉语词汇字面相似性原理与后控制词表动态维护研究[J] 宋明亮 情报学报 1996, 04
[9]
后控规范的计算机处理
[J].
论文数:
引用数:
h-index:
机构:
王源
;
吴晓滨
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院计算机化学实验室,中国科学院计算机化学实验室,中国科学院计算机化学实验室,,,上海,上海,上海
吴晓滨
;
涂从文
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院计算机化学实验室,中国科学院计算机化学实验室,中国科学院计算机化学实验室,,,上海,上海,上海
涂从文
;
论文数:
引用数:
h-index:
机构:
刘滨
;
论文数:
引用数:
h-index:
机构:
章元峰
;
王金娥
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院计算机化学实验室,中国科学院计算机化学实验室,中国科学院计算机化学实验室,,,上海,上海,上海
王金娥
.
现代图书情报技术,
1993,
(02)
:4
-7
←
1
→
共 9 条
[1]
基于同义词词林的词语相似度计算方法
[J].
论文数:
引用数:
h-index:
机构:
田久乐
;
论文数:
引用数:
h-index:
机构:
赵蔚
.
吉林大学学报(信息科学版),
2010,
28
(06)
:602
-608
[2]
结合词性分析与串频统计的词语提取方法
[J].
论文数:
引用数:
h-index:
机构:
于娟
;
论文数:
引用数:
h-index:
机构:
党延忠
.
系统工程理论与实践,
2010,
(01)
:105
-111
[3]
基于词汇语义计算的文本相似度研究
[J].
余刚
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
余刚
;
裴仰军
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
裴仰军
;
论文数:
引用数:
h-index:
机构:
朱征宇
;
陈华月
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
陈华月
.
计算机工程与设计,
2006,
(02)
:241
-244
[4]
改进的中文同义词相似匹配方法
[J].
王兰成
论文数:
0
引用数:
0
h-index:
0
机构:
解放军南京政治学院上海分院信息管理系
王兰成
;
李超
论文数:
0
引用数:
0
h-index:
0
机构:
解放军南京政治学院上海分院信息管理系
李超
.
中国图书馆学报,
2005,
(03)
:61
-64
[5]
基于层叠隐马模型的汉语词法分析
[J].
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所北京,北京大学计算语言学研究所北京,北京,中国科学院研究生院北京,北京,北京
刘群
;
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所北京,北京大学计算语言学研究所北京,北京,中国科学院研究生院北京,北京,北京
张华平
;
俞鸿魁
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所北京,北京大学计算语言学研究所北京,北京,中国科学院研究生院北京,北京,北京
俞鸿魁
;
程学旗
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所,中国科学院计算技术研究所北京,北京大学计算语言学研究所北京,北京,中国科学院研究生院北京,北京,北京
程学旗
.
计算机研究与发展,
2004,
(08)
:1421
-1429
[6]
基于N-最短路径方法的中文词语粗分模型
[J].
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
张华平
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
刘群
.
中文信息学报,
2002,
(05)
:1
-7
[7]
计算机识别汉语同义词的两种算法比较和测评
[J].
论文数:
引用数:
h-index:
机构:
朱毅华
;
论文数:
引用数:
h-index:
机构:
侯汉清
;
沙印亭
论文数:
0
引用数:
0
h-index:
0
机构:
江苏南京农业大学情报系
沙印亭
.
中国图书馆学报,
2002,
(04)
[8]
汉语词汇字面相似性原理与后控制词表动态维护研究[J] 宋明亮 情报学报 1996, 04
[9]
后控规范的计算机处理
[J].
论文数:
引用数:
h-index:
机构:
王源
;
吴晓滨
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院计算机化学实验室,中国科学院计算机化学实验室,中国科学院计算机化学实验室,,,上海,上海,上海
吴晓滨
;
涂从文
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院计算机化学实验室,中国科学院计算机化学实验室,中国科学院计算机化学实验室,,,上海,上海,上海
涂从文
;
论文数:
引用数:
h-index:
机构:
刘滨
;
论文数:
引用数:
h-index:
机构:
章元峰
;
王金娥
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院上海有机化学研究所,中国科学院计算机化学实验室,中国科学院计算机化学实验室,中国科学院计算机化学实验室,,,上海,上海,上海
王金娥
.
现代图书情报技术,
1993,
(02)
:4
-7
←
1
→