共 45 条
文本主题识别关键技术研究综述
被引:12
作者:
许海云
[1
,2
]
董坤
[2
,3
]
刘春江
[2
]
王超
[2
,3
]
王振蒙
[2
,3
]
机构:
[1] 中国科学技术信息研究所
[2] 中国科学院成都文献情报中心
[3] 中国科学院大学
来源:
关键词:
主题识别;
文本分析;
主题挖掘;
语义分析;
多元关系融合;
D O I:
10.13833/j.cnki.is.2017.01.029
中图分类号:
G254 [文献标引与编目];
学科分类号:
1205 ;
120501 ;
摘要:
【目的/意义】文本主题自动识别是多种情报分析,如文献分类、检索以及领域前沿识别的基础,因此对文本主题自动识别方法的研究意义显著。【方法/过程】系统调研了当前文本主题识别的关键技术,包括主题词获取方法、知识单元的关联强度计算以及面向多元关系融合的主题分析方法及实践。【结果/结论】在总结当前文本主题识别方法的不足之处的基础上,本文提出综合全面的主题词获取方法,并在抽取范围以及语法、语义层面结合运用;在主题词关联计算中,充分利用已有语义词典和领域本体,将基于语义词典相似度和知识单元共现分析结合,并考虑主题关联的多元关系融合。
引用
收藏
页码:153 / 160
页数:8
相关论文