非结构化文本分析软件比较研究——以KH Coder和Wordstat为例

被引:26
作者
程慧荣 [1 ]
黄国彬 [2 ]
郑琳 [2 ]
机构
[1] 鲁东大学图书馆
[2] 北京师范大学政府管理学院
基金
中央高校基本科研业务费专项资金资助;
关键词
非结构文本; 可视化; 软件; 比较研究;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; G254 [文献标引与编目];
学科分类号
081203 ; 0835 ; 1205 ; 120501 ;
摘要
文章给出了非结构化文本分析软件的定义,并将其划分为三种主要的类型:基于词典的非结构化文本分析软件、基于开发环境的非结构化文本分析软件以及基于注释的非结构化文本分析软件。之后,文章选择了两款非结构化文本分析软件(KH Coder,Wordstat),从内部特征和外部特征两个角度对其进行了比较分析。其中,外部特征包括:两款非结构化文本分析软件的费用、更新速度、运行环境、语言种类、客户端方式以及用户指南等6个方面;内部特征包括两款非结构化文本分析软件的主要功能、工作流程、数据格式、可视化功能的展现方式以及关系揭示等5个角度开展。分别指出两款非结构化文本分析软件的优势与劣势、非结构化文本分析软件的未来发展,以帮助用户根据自身的需求选择合适的非结构化文本分析软件。
引用
收藏
页码:110 / 117+122 +122
页数:9
相关论文
共 7 条
[1]  
基于文本挖掘技术的蛋白质相互作用预测方法研究.[D].黄娟.中南大学.2009, 04
[2]   ON RELEVANCE, PROBABILISTIC INDEXING AND INFORMATION RETRIEVAL [J].
MARON, ME ;
KUHNS, JL .
JOURNAL OF THE ACM, 1960, 7 (03) :216-244
[3]   面向非结构化文本的开放式实体属性抽取 [J].
曾道建 ;
来斯惟 ;
张元哲 ;
刘康 ;
赵军 .
江西师范大学学报(自然科学版), 2013, 37 (03) :279-283+305
[4]   面向外文科技文献信息的知识组织体系建设思路 [J].
孙坦 ;
刘峥 .
图书与情报, 2013, (01) :2-7
[5]   文本挖掘在网络舆情信息分析中的应用 [J].
黄晓斌 ;
赵超 .
情报科学, 2009, 27 (01) :94-99
[6]   文档聚类中k-means算法的一种改进算法 [J].
万小军 ;
杨建武 ;
陈晓鸥 .
计算机工程, 2003, (02) :102-103+157
[7]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101