共 16 条
基于题录摘要语义建模的学术共同体识别——以国内图情领域学者为例
被引:6
作者:
陈红伶
杨佳颖
许鑫
机构:
[1] 华东师范大学经济与管理学部
来源:
关键词:
学术共同体;
LDA主题模型;
二模网;
学者—主题网络;
语义建模;
D O I:
10.16353/j.cnki.1000-7490.2020.05.028
中图分类号:
G353.1 [情报资料的分析和研究];
学科分类号:
摘要:
[目的/意义]现有基于合作或引证建立的学术共同体展现了更显性的学术关联,但不能直观地揭示出学术共同体所共有的特征,同时不可避免增加了人情因素带来的偏私倾向。[方法/过程]以知网文献摘要数据为研究对象,文章利用LDA和Word2vec混合模型挖掘得到每篇文献的主题,主题包含主题词及其扩展词。并以此作为主题与文献作者关系的依据,构建学者—主题二模网络,通过对二模网络以及映射的一模学者网络进行可视化,直观地反映了领域内学者就研究方向的聚集情况。[结果/结论]LDA和Word2vec混合模型能够深入挖掘文献主题,而利用二模能够展现二元的主体,通过上述方法,能够找到在现实中或许没有发生合作、但具有潜在重合研究主题倾向的学者群体。以国内图情领域为例,识别其核心学术共同体。"学者—主题"的二模网络中纳入了学者隶属群体的信息,不仅从全局视域归纳出领域内由词语元素构成的具体主题,而且利用向量距离计算得到的各个主题的扩展词语集,能进一步解释学者共同体所隶属群体的深化特征,能够有效降低人情因素,为同行评议提供支持。
引用
收藏
页码:170 / 176
页数:7
相关论文