文本挖掘技术在科技管理领域热点主题抽取方向的应用研究

被引:5
作者
施韶亭
曹方
机构
[1] 甘肃省科学技术情报研究所
关键词
科技管理; 文本挖掘; 信息抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
科技管理领域热点主题抽取过程主要历经文本挖掘技术中的数据采集与清洗、信息抽取、主题分析三个阶段。其中,热点主题抽取采用TF-IDF信息抽取算法,主题聚类采用共现方法中的合并聚类。通过热点主题抽取、趋势分析和聚类分析,可以实现领域热点工作的提前预测和科学决策,有助于推动政务领域信息的智能化和知识化。
引用
收藏
页码:109 / 111+140 +140
页数:4
相关论文
共 8 条
[1]  
gCLUTO:an interactive clustering,visualiza-tion,and analysis system. Rasmussen M,Karypis G. University of Minnesota,Department of Computer Science and Engineering,Tech.Rep.TR04-021 . 2004
[2]  
gCLUTO-Graphical Clustering Toolkit. Karypis G. http://glaros.dtc.umn.edu/gkhome/cluto/gcluto/overview .
[3]  
Unstructured Data and the80Percent Rule. Grimes S. http://www.clarabridge.com/default.aspx?tabid=137&ModuleID=635&ArticleID=551 . 2011
[4]  
Text Mining:Applications and Theory. Berry M W,Kogan J. . 2010
[5]  
The integration of business intelligence and knowledge management. W Cody,J Kreulen,V Krishna,W Spangler. IBM Systems Journal . 2010
[6]   Is science becoming more interdisciplinary? Measuring and mapping six research fields over time [J].
Porter, Alan L. ;
Rafols, Ismael .
SCIENTOMETRICS, 2009, 81 (03) :719-745
[7]  
科学计量学高级教程[M]. 科学技术文献出版社 , 袁军鹏, 2010
[8]  
适用于隐含主题抽取的K最近邻关键词自动抽取[J]. 张庆国,章成志,薛德军,张君玉.  报学报. 2009 (02)