一种基于向量词序的句子相似度算法研究

被引:14
作者
程志强 [1 ]
闵华松 [1 ,2 ]
机构
[1] 武汉科技大学信息科学与工程学院
[2] 武汉科技大学冶金自动化与检测技术教育部工程研究中心
关键词
向量空间模型; 特征领域权重; 词序;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题。为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予更高的权重,同时,在向量空间模型的基础上,引入词序因子,计算句子词序相似度。使用包含6个领域的2651个句子作为语料库,实验结果表明,改进方法使特征领域内句子相似度计算的准确度得到提高。
引用
收藏
页码:419 / 424
页数:6
相关论文
共 12 条
  • [1] 基于互信息和关系积理论的特征选择方法[J].何绍荣,梁金明,何志勇. 计算机工程.2010(13)
  • [2] 基于VSM的文本相似度计算的研究[J].郭庆琳,李艳梅,唐琦. 计算机应用研究.2008(11)
  • [3] 基于改进编辑距离和依存文法的汉语句子相似度计算[J].刘宝艳,林鸿飞,赵晶. 计算机应用与软件.2008(07)
  • [4] 词语相似度计算研究[J].秦春秀,赵捧未,刘怀亮. 情报理论与实践.2007(01)
  • [5] 基于语句相似度计算的FAQ自动回复系统设计与实现[J].张亮,冯冲,陈肇雄,黄河燕. 小型微型计算机系统.2006(04)
  • [6] 一种基于实例的汉英机器翻译策略[J].胡国全,陈家骏,戴新宇,尹存燕. 计算机工程与设计.2005(04)
  • [7] 一种新的句子相似度度量及其在文本自动摘要中的应用[J].张奇,黄萱菁,吴立德. 中文信息学报.2005(02)
  • [8] 基于语义依存的汉语句子相似度计算[J].李彬,刘挺,秦兵,李生. 计算机应用研究.2003(12)
  • [9] 基于语义的文本过滤系统的设计与实现[J].晋耀红. 计算机工程与应用.2003(17)
  • [10] 基于向量的相似度计算方案[J].陶跃华. 云南师范大学学报(自然科学版).2001(05)