基于主题聚类的主题数字图书馆构建

被引:4
作者
章成志 [1 ]
张庆国 [2 ]
师庆辉 [2 ]
机构
[1] 南京理工大学信息管理系中国科技信息研究所
[2] 中国学术期刊(光盘版)电子杂志社
关键词
数字图书馆; 主题聚类; 主题抽取; 文本聚类;
D O I
10.13530/j.cnki.jlis.2008.06.016
中图分类号
G250.76 [电子图书馆、数字图书馆];
学科分类号
1205 ; 120501 ;
摘要
基于主题聚类的主题数字图书馆是针对某一个特定的主题,获取与该主题相关的数字资源集合(本文以文本资源为研究对象),然后再依据主题聚类算法,对该主题的信息资源集合进行聚类,生成可供用户浏览的多层次结构导航,结合全文检索实现基于主题聚类的主题数字图书馆系统。主题数字图书馆系统主要包括主题采集模块、主题聚类模块和数据集成模块,构建过程中主要涉及主题提取、主题聚类以及聚类结果描述等三类关键技术。表2。图1。参考文献20。
引用
收藏
页码:64 / 69
页数:6
相关论文
共 7 条
[1]   一种基于主题的文本聚类方法 [J].
赵世奇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (02) :58-62
[2]   基于控制词集的中文信息动态自动聚类研究 [J].
马张华 ;
陈文广 ;
金海燕 ;
朱剑俊 ;
崔会娟 ;
刘贞君 .
大学图书馆学报, 2006, (06) :54-60
[3]   基于主题的Web文档聚类研究 [J].
孙学刚 ;
陈群秀 ;
马亮 .
中文信息学报, 2003, (03) :21-26
[4]   中文全文标引的主题词标引和主题概念标引方法 [J].
韩客松 ;
王永成 .
情报学报, 2001, (02) :212-216
[5]  
海量数据集上基于特征组合的关键词自动抽取[J]. 张庆国,薛德军,张振海,张君玉.情报学报. 2006 (05)
[6]  
基于样本加权的文本聚类算法研究[J]. 章成志,师庆辉,薛德军.情报学报. 2008 (01)
[7]   An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90