基于树状语料库的中文短语相似度计算

被引：4

作者：

费洪晓

莫天池

林青

杨艳群

谭叶清

严星俊

机构：

[1] 中南大学软件学院

来源：

计算机应用与软件 | 2013年 / 30卷 / 08期

关键词：

自然语言处理; 文件摘要; 中文短语相似度计算; 树状语料库; 关键词序列;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

在诸如文件摘要、个性化搜索、学术诚信检测、常见问题自动解答、自动翻译等领域,短语相似度计算是核心算法。通过引入树状语料库,精确定义、计算词汇相似度,对基于抽取关键词序列的中文短语相似度算法做进一步改进。实验证明,该方法在提高中文短语相似度计算的准确率上达到了预期效果,更符合人的直观感觉。

引用

页码：18 / 20+42 +42

页数：4

共 8 条

[1] 一种改进的基于句子相似度的检测算法 [J].

邢长征 ;

孙伟 .

计算机系统应用, 2010, 19 (02) :90-92

[2] 一种改进的句子相似度计算模型 [J].

杨思春 .

电子科技大学学报, 2006, (06) :956-959

[3] 一种基于知网的句子相似度计算方法 [J].

程传鹏 ;

吴志刚 .

计算机工程与科学, 2012, 34 (02) :172-175

[4] 基于《知网》的词语相似度算法研究 [J].

刘青磊 ;

顾小丰 .

中文信息学报, 2010, (06) :31-36

[5]

基于《知网》的句子相似度计算的研究[D]. 张玉娟.中国地质大学（北京） 2006

[6] 汉语词语语义相似度计算研究 [J].

夏天 .

计算机工程, 2007, (06) :191-194

[7] 一种综合多特征的句子相似度计算方法 [J].

吴全娥 ;

熊海灵 .

计算机系统应用, 2010, 19 (11) :110-114

[8]

Semantic similarity measure for short sentence. Z N Liao. . 2011

← 1 →