学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种基于向量词序的句子相似度算法研究
被引:14
作者
:
论文数:
引用数:
h-index:
机构:
程志强
[
1
]
闵华松
论文数:
0
引用数:
0
h-index:
0
机构:
武汉科技大学信息科学与工程学院
武汉科技大学冶金自动化与检测技术教育部工程研究中心
武汉科技大学信息科学与工程学院
闵华松
[
1
,
2
]
机构
:
[1]
武汉科技大学信息科学与工程学院
[2]
武汉科技大学冶金自动化与检测技术教育部工程研究中心
来源
:
计算机仿真
|
2014年
/ 31卷
/ 07期
关键词
:
向量空间模型;
特征领域权重;
词序;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题。为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予更高的权重,同时,在向量空间模型的基础上,引入词序因子,计算句子词序相似度。使用包含6个领域的2651个句子作为语料库,实验结果表明,改进方法使特征领域内句子相似度计算的准确度得到提高。
引用
收藏
页码:419 / 424
页数:6
相关论文
共 12 条
[11]
知网和汉语研究[J].董振东,董强. 当代语言学.2001(01)
[12]
基于属性论的文本相似度计算[J].潘谦红,王炬,史忠植. 计算机学报.1999(06)
←
1
2
→
共 12 条
[11]
知网和汉语研究[J].董振东,董强. 当代语言学.2001(01)
[12]
基于属性论的文本相似度计算[J].潘谦红,王炬,史忠植. 计算机学报.1999(06)
←
1
2
→