共 4 条
基于TFIDF算法的关键词提取方法
被引:5
作者:
章志华
陆海良
郁钢
机构:
[1] 浙江中烟工业有限责任公司
来源:
关键词:
文本挖掘;
关键词提取;
词频;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
企业知识库数据量以爆炸性的速度增长,其中大部分信息是非结构化的文本数据,系统往往不能快速准确地满足企业用户的查询请求。为解决这一问题,提出了一种基于TFIDF算法同义替换和相邻合并的文本挖掘技术。这种技术可以降低服务器压力,使服务人员可以更快更准确的从知识库中寻找出相关信息。最后以实例验证了本算法的有效性。
引用
收藏
页码:158 / 160
页数:3
相关论文