一种基于知网的中文词汇链构建算法研究

被引:3
作者
张明宝
谢宗旺
机构
[1] 南京航空航天大学信息管理与电子商务系
关键词
词汇链; 语义相似性; 知网;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
词汇链能够帮助计算机正确理解词汇语义和掌握文档主旨,使得它在信息检索、文本挖掘和自动翻译等领域有着广泛的应用。提出了一种知网的中文词汇链抽取算法。该算法通过知网词典来规范词汇的语义并且通过计算词汇之间的语义相似性来确定词汇在具体语境中的语义。为了提高词汇链词汇语义的精确性和词汇链抽取的速度,算法采用非贪婪策略来确定词汇语义,按照贪婪策略来构建词汇链。实验结果表明该算法是有效的。
引用
收藏
页码:51 / 53
页数:3
相关论文
共 1 条
[1]   Efficiently computed lexical chains as an intermediate representation for automatic text summarization [J].
Silber, HG ;
McCoy, KF .
COMPUTATIONAL LINGUISTICS, 2002, 28 (04) :487-496