文本分析的新工具:以主题模型的可视化为例

被引:5
作者
王涛
机构
[1] 南京大学
关键词
主题模型; 可视化; 数字人文;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
主题模型是帮助我们理解文献集的重要手段。但LDA的原版算法需要用统计语言学的知识进行解读,不合适人文学者使用。借助py LDAvis、TOM等软件包进行可视化处理,为主题模型的结果解释提供了便利。从本质上看,任何可视化的方法都需要结合研究项目的具体需求,而不能为了绚丽的可视化结果而毫无目的地使用可视化的方法,否则就有本末倒置的嫌疑。
引用
收藏
页码:75 / 79
页数:5
相关论文
共 3 条
[1]   18世纪德语历史文献的数据挖掘:以主题模型为例 [J].
王涛 .
学海, 2017, (01) :206-216
[2]  
NLP汉语自然语言处理原理与实践.[M].郑捷.电子工业出版社.2017,
[3]  
主教的书信空间.[M].王涛; 著.南京大学出版社.2011,