共 4 条
科技项目查重中特征词TF-IDF值计算方法的改进
被引:14
作者:
方延风
机构:
[1] 福建省科学技术信息研究所
来源:
关键词:
文本特征;
特征词权值;
TF-IDF;
算法改进;
项目查重;
科技项目;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
针对科技项目查重的需要,利用分词的结果,将科技项目文档转换为文本向量空间模型,抽取特征词,并将特征词的位置和词的长度2个因素考虑进来,提出一种TF-IDF值的改进计算方法,并实例验证该方法有一定的改善效果。
引用
收藏
页码:1 / 3
页数:3
相关论文