基于图模型的关键词挖掘方法

被引:3
作者
翟周伟
刘刚
吕玉琴
机构
[1] 北京邮电大学电子工程学院
关键词
计算机应用; 中文信息处理; 关键词挖掘; 复杂网络; 综合测度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文章提出一种基于图模型的关键词挖掘方法,应用K最邻近耦合图构造文档的图模型,将文档映射为一个语义结构图,然后结合聚类系数变化量,平均路径变化量,TF-IDF以及区域位置因子来衡量词语节点的重要性,根据重要性得分选择候选关键词集,最后根据短语合并规则形成最终的关键词,实验结果表明,该方法相比于TF-IDF和小世界特征方法性能有所提高。
引用
收藏
页码:9 / 13
页数:5
相关论文
共 13 条
[1]  
Topical Keyphrase Extraction from Twitter. Xin Zhao,Jing JIANG,Jing He,Yang Song,Palakorn Achananuparp,Ee Peng LIM,Xiaoming Li. Proceedings of the49th Annual Meeting of the Association for Computational Linguistics:Human Language Technologies . 2011
[2]  
A study on feature selection algorithm in textcategorization technology. Xu Yan,Li Jin-Tao,Wang Bin,Sun Chun-Ming,Zhang Shen. Journal of Computer Research and Development . 2008
[3]  
Language Net- works: their structure, function and evolution. Sole R V,Corominas B,Valverde S,Steels L. Journal of Complexity . 2010
[4]  
A.keywords ex-traction of Chinese Document Using Small WorldStructure. Mengxiao,Z.,C.Zhi,,C.Q. Proceedings of the 11th IEEE/ACMInternational Symposium on Modeling,Analysis andSimulation of Computer Telecommunications Systems(MASCOTS’03) . 2003
[5]  
The small world problem. Milgram S. Psychology Today . 1967
[6]   基于小世界模型的复合关键词提取方法研究 [J].
马力 ;
焦李成 ;
白琳 ;
周雅夫 ;
董洛兵 .
中文信息学报, 2009, 23 (03) :121-128
[7]   上下文相关广告中的关键词抽取研究(英文) [J].
刘建毅 ;
王枞 ;
姚文斌 .
中国通信, 2010, 7 (04) :51-57
[8]   基于加权复杂网络的文本关键词提取 [J].
谢凤宏 ;
张大为 ;
黄丹 ;
谢福鼎 .
系统科学与数学, 2010, 30 (11) :1592-1596
[9]  
Pattern based keyword extraction for contextual advertising. Kushal S Dave,Vasudeva Varma. CIKM’’10Proceedings of the19th ACM international conference on Information and knowledge management . 2010
[10]  
KeywordExtraction Using Word Co-occurrence. Wartena C,Brussee,R,Slakhorst,W. Database and Expert Systems Applications (DEXA) . 2010