共 18 条
基于LDA的科技创新主题语义识别研究
被引:19
作者:
祝娜
王效岳
杨京
白如江
机构:
[1] 山东理工大学科技信息研究所
来源:
关键词:
语义角色标注;
科技创新主题;
LDA模型;
3D打印;
D O I:
10.13266/j.issn.0252-3116.2015.14.018
中图分类号:
TP391.1 [文字信息处理];
G254 [文献标引与编目];
学科分类号:
摘要:
[目的 /意义]由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法 /过程]提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果 /结论]通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。
引用
收藏
页码:126 / 134
页数:9
相关论文