共 2 条
基于属性的文本相似度计算算法改进
被引:6
作者:
袁正午
[1
]
李玉森
[1
]
张雪英
[2
]
机构:
[1] 重庆邮电大学中韩合作GIS研究所
[2] 南京师范大学虚拟地理环境教育部重点实验室
来源:
关键词:
相似度计算;
属性坐标系;
属性重心点;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
基于属性的重心剖分模型是一种较为新颖的文档相似度计算模型,但容易导致语义信息丢失和效率低下。针对上述问题,提出一种改进的重心剖分模型,通过计算查询线与文档单纯形的交点与文档重心点之间的相似度,使得结果保留属性坐标系中文档向量的特征。实验结果表明,该模型的查全率、查准率和F1值可以提高2%~4%左右。
引用
收藏
页码:4 / 6
页数:3
相关论文