基于TFIDF算法的关键词提取方法

被引:5
作者
章志华
陆海良
郁钢
机构
[1] 浙江中烟工业有限责任公司
关键词
文本挖掘; 关键词提取; 词频;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
企业知识库数据量以爆炸性的速度增长,其中大部分信息是非结构化的文本数据,系统往往不能快速准确地满足企业用户的查询请求。为解决这一问题,提出了一种基于TFIDF算法同义替换和相邻合并的文本挖掘技术。这种技术可以降低服务器压力,使服务人员可以更快更准确的从知识库中寻找出相关信息。最后以实例验证了本算法的有效性。
引用
收藏
页码:158 / 160
页数:3
相关论文
共 4 条
[1]   基于云计算的微博数据挖掘研究综述 [J].
贾冲冲 ;
王名扬 ;
郑丹 ;
张晓霞 .
安徽农业科学, 2014, 42 (31) :11193-11195
[2]   基于文本挖掘的专利技术主题分析研究综述 [J].
胡阿沛 ;
张静 ;
雷孝平 ;
张晓宇 .
情报杂志, 2013, 32 (12) :88-92+61
[3]   文本挖掘技术研究 [J].
林海文 .
电脑知识与技术, 2008, 4 (34) :1711-1712+1720
[4]   汉语语言的无词典分词模型系统 [J].
韩客松 ;
王永成 ;
陈桂林 .
计算机应用研究, 1999, (10) :8-9