基于控制词集的中文信息动态自动聚类研究

被引:4
作者
马张华
陈文广
金海燕
朱剑俊
崔会娟
刘贞君
机构
[1] 北京大学信息管理系
关键词
动态自动聚类; 中文自动分类; 专用切分词典; 词汇控制;
D O I
暂无
中图分类号
G354 [情报检索];
学科分类号
1205 ;
摘要
以专用词典为切分工具,建立以概念为基础的、具有主题分类特点的类目结构是中文信息动态自动聚类的一种适用方式。该文探索了基于控制词集的中文信息动态自动聚类技术,包括专用控制词集的构建,动态有限环境下的自动聚类程序、聚类算法,以及结合控制词集对聚类结果进行优化控制等,最后对实验结果给出了概要评价。
引用
收藏
页码:54 / 60
页数:7
相关论文
共 2 条
[1]   基于主题的Web文档聚类研究 [J].
孙学刚 ;
陈群秀 ;
马亮 .
中文信息学报, 2003, (03) :21-26
[2]   PCCS部分聚类分类:一种快速的Web文档聚类方法 [J].
王爱华 ;
张铭 ;
杨冬青 ;
唐世渭 ;
不详 .
计算机研究与发展 , 2001, (04) :415-421