学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于同义词链的中文关键词提取算法
被引:12
作者
:
论文数:
引用数:
h-index:
机构:
张颖颖
论文数:
引用数:
h-index:
机构:
谢强
丁秋林
论文数:
0
引用数:
0
h-index:
0
机构:
南京航空航天大学信息科学与技术学院
丁秋林
机构
:
[1]
南京航空航天大学信息科学与技术学院
来源
:
计算机工程
|
2010年
/ 36卷
/ 19期
关键词
:
关键词提取;
同义词链;
语义;
消歧;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
针对传统中文关键词提取对语义和同义词的不重视而导致的精确度和召回率低的问题,提出基于同义词链的中文关键词提取算法。利用上下文窗口和消歧算法解决词语在上下文中的语义问题,利用文档中的同义词构建同义词链,简化候选词的选取。根据同义词链的特征,得到相应的权重计算公式,对候选词进行过滤。实验结果表明,该算法在同义词较多的文档中精确度和召回率有较大的提高,平均性能也有明显改善。
引用
收藏
页码:93 / 95
页数:3
相关论文
共 2 条
[1]
基于自动文本分类的关键词抽取算法
论文数:
引用数:
h-index:
机构:
张虹
[J].
计算机工程,
2009,
35
(12)
: 145
-
147
[2]
Using lexical chains for keyword extraction
Ercan, Gonenc
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06800 Ankara, Turkey
Bilkent Univ, Dept Comp Engn, TR-06800 Ankara, Turkey
Ercan, Gonenc
Cicekli, Ilyas
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06800 Ankara, Turkey
Bilkent Univ, Dept Comp Engn, TR-06800 Ankara, Turkey
Cicekli, Ilyas
[J].
INFORMATION PROCESSING & MANAGEMENT,
2007,
43
(06)
: 1705
-
1714
←
1
→
共 2 条
[1]
基于自动文本分类的关键词抽取算法
论文数:
引用数:
h-index:
机构:
张虹
[J].
计算机工程,
2009,
35
(12)
: 145
-
147
[2]
Using lexical chains for keyword extraction
Ercan, Gonenc
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06800 Ankara, Turkey
Bilkent Univ, Dept Comp Engn, TR-06800 Ankara, Turkey
Ercan, Gonenc
Cicekli, Ilyas
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06800 Ankara, Turkey
Bilkent Univ, Dept Comp Engn, TR-06800 Ankara, Turkey
Cicekli, Ilyas
[J].
INFORMATION PROCESSING & MANAGEMENT,
2007,
43
(06)
: 1705
-
1714
←
1
→