共 4 条
一种改进的TFIDF网页关键词提取方法
被引:30
作者:
李静月
李培峰
朱巧明
机构:
[1] 苏州大学计算机科学与技术学院
来源:
关键词:
文本结构;
关键词抽取;
TFIDF;
D O I:
暂无
中图分类号:
TP393.092 [];
学科分类号:
080402 ;
摘要:
传统TFIDF关键词提取方法虽然实现起来简单,时间复杂度低,但是效果并不理想,难以获得对文本内容起到关键性作用的特征。提出了一种在考虑中文文本结构特征和中文词语词性特征的基础上,借助扩展的同义词词林,利用改进的TFIDF公式来提取的方法。实验结果表明:该方法明显优于传统方法,能够抽取到令人满意的结果。
引用
收藏
页码:25 / 27
页数:3
相关论文