文本主题识别关键技术研究综述

被引:12
作者
许海云 [1 ,2 ]
董坤 [2 ,3 ]
刘春江 [2 ]
王超 [2 ,3 ]
王振蒙 [2 ,3 ]
机构
[1] 中国科学技术信息研究所
[2] 中国科学院成都文献情报中心
[3] 中国科学院大学
关键词
主题识别; 文本分析; 主题挖掘; 语义分析; 多元关系融合;
D O I
10.13833/j.cnki.is.2017.01.029
中图分类号
G254 [文献标引与编目];
学科分类号
1205 ; 120501 ;
摘要
【目的/意义】文本主题自动识别是多种情报分析,如文献分类、检索以及领域前沿识别的基础,因此对文本主题自动识别方法的研究意义显著。【方法/过程】系统调研了当前文本主题识别的关键技术,包括主题词获取方法、知识单元的关联强度计算以及面向多元关系融合的主题分析方法及实践。【结果/结论】在总结当前文本主题识别方法的不足之处的基础上,本文提出综合全面的主题词获取方法,并在抽取范围以及语法、语义层面结合运用;在主题词关联计算中,充分利用已有语义词典和领域本体,将基于语义词典相似度和知识单元共现分析结合,并考虑主题关联的多元关系融合。
引用
收藏
页码:153 / 160
页数:8
相关论文
共 45 条
[11]  
基于突发监测的全身炎症反应综合征治疗药物研究趋势分析[D]. 徐爽.中国医科大学. 2010
[12]   Analysis of keyword networks in MIS research and implications for predicting knowledge evolution [J].
Choi, Jinho ;
Yi, Sangyoon ;
Lee, Kun Chang .
INFORMATION & MANAGEMENT, 2011, 48 (08) :371-381
[13]  
Mapping research specialties[J] . Steven A.Morris,BetsyVan der Veer Martens.Ann. Rev. Info. Sci. Tech. . 2009 (1)
[14]   Hybrid clustering for validation and improvement of subject-classification schemes [J].
Janssens, Frizo ;
Zhang, Lin ;
De Moor, Bart ;
Glanzel, Wolfgang .
INFORMATION PROCESSING & MANAGEMENT, 2009, 45 (06) :683-702
[15]   Citation structure of an emerging research area on the verge of application [J].
Small, Henry ;
Upham, Phineas .
SCIENTOMETRICS, 2009, 79 (02) :365-375
[16]  
Evolution of research activities and intellectual influences in information science 1996–2005: Introducing author bibliographic‐coupling analysis[J] . DangzhiZhao,AndreasStrotmann.J. Am. Soc. Inf. Sci. . 2008 (13)
[17]  
Document–document similarity approaches and science mapping: Experimental comparison of five approaches[J] . Per Ahlgren,Cristian Colliander.Journal of Informetrics . 2008 (1)
[18]  
Mapping research topics using word-reference co-occurrences: A method and an exploratory case study[J] . Peter van den Besselaar,Gaston Heimeriks.Scientometrics . 2006 (3)
[19]   Quantitative evaluation of large maps of science [J].
Klavans, Richard ;
Boyack, Kevin W. .
SCIENTOMETRICS, 2006, 68 (03) :475-499
[20]  
CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature[J] . ChaomeiChen.J. Am. Soc. Inf. Sci. . 2006 (3)