非结构化文本分析软件比较研究——以KH Coder和Wordstat为例

被引：26

作者：

程慧荣 ^{[1
]}

黄国彬 ^{[2
]}

郑琳 ^{[2
]}

机构：

[1] 鲁东大学图书馆

[2] 北京师范大学政府管理学院

来源：

图书与情报 | 2015年 / 04期

基金：

中央高校基本科研业务费专项资金资助;

关键词：

非结构文本; 可视化; 软件; 比较研究;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理]; G254 [文献标引与编目];

学科分类号：

081203 ; 0835 ; 1205 ; 120501 ;

摘要：

文章给出了非结构化文本分析软件的定义,并将其划分为三种主要的类型:基于词典的非结构化文本分析软件、基于开发环境的非结构化文本分析软件以及基于注释的非结构化文本分析软件。之后,文章选择了两款非结构化文本分析软件(KH Coder,Wordstat),从内部特征和外部特征两个角度对其进行了比较分析。其中,外部特征包括:两款非结构化文本分析软件的费用、更新速度、运行环境、语言种类、客户端方式以及用户指南等6个方面;内部特征包括两款非结构化文本分析软件的主要功能、工作流程、数据格式、可视化功能的展现方式以及关系揭示等5个角度开展。分别指出两款非结构化文本分析软件的优势与劣势、非结构化文本分析软件的未来发展,以帮助用户根据自身的需求选择合适的非结构化文本分析软件。

引用

页码：110 / 117+122 +122

页数：9

共 7 条

[1]

基于文本挖掘技术的蛋白质相互作用预测方法研究.[D].黄娟.中南大学.2009, 04

[2] ON RELEVANCE, PROBABILISTIC INDEXING AND INFORMATION RETRIEVAL [J].