基于树状语料库的中文短语相似度计算

被引:4
作者
费洪晓
莫天池
林青
杨艳群
谭叶清
严星俊
机构
[1] 中南大学软件学院
关键词
自然语言处理; 文件摘要; 中文短语相似度计算; 树状语料库; 关键词序列;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
在诸如文件摘要、个性化搜索、学术诚信检测、常见问题自动解答、自动翻译等领域,短语相似度计算是核心算法。通过引入树状语料库,精确定义、计算词汇相似度,对基于抽取关键词序列的中文短语相似度算法做进一步改进。实验证明,该方法在提高中文短语相似度计算的准确率上达到了预期效果,更符合人的直观感觉。
引用
收藏
页码:18 / 20+42 +42
页数:4
相关论文
共 8 条
[1]   一种改进的基于句子相似度的检测算法 [J].
邢长征 ;
孙伟 .
计算机系统应用, 2010, 19 (02) :90-92
[2]   一种改进的句子相似度计算模型 [J].
杨思春 .
电子科技大学学报, 2006, (06) :956-959
[3]   一种基于知网的句子相似度计算方法 [J].
程传鹏 ;
吴志刚 .
计算机工程与科学, 2012, 34 (02) :172-175
[4]   基于《知网》的词语相似度算法研究 [J].
刘青磊 ;
顾小丰 .
中文信息学报, 2010, (06) :31-36
[5]  
基于《知网》的句子相似度计算的研究[D]. 张玉娟.中国地质大学(北京) 2006
[6]   汉语词语语义相似度计算研究 [J].
夏天 .
计算机工程, 2007, (06) :191-194
[7]   一种综合多特征的句子相似度计算方法 [J].
吴全娥 ;
熊海灵 .
计算机系统应用, 2010, 19 (11) :110-114
[8]  
Semantic similarity measure for short sentence. Z N Liao. . 2011