基于文本分类中特征提取的领域词语聚类

被引:21
作者
刘华
机构
[1] 暨南大学华文学院
关键词
特征提取; 领域词语; 聚类;
D O I
10.16499/j.cnki.1003-5397.2007.01.021
中图分类号
H08 [应用语言学];
学科分类号
050211 ;
摘要
本文以领域特征明显的词和短语作为聚类对象,在分类系统的大规模语料库中,利用文本分类的特征提取方法进行词语的领域聚类,从而获得大规模的领域知识,用于文本分类和主题分析。
引用
收藏
页码:139 / 144
页数:6
相关论文
共 7 条
[1]  
中文文本分类特征表示及分类方法比较研究.[A].周雪忠;方青;吴朝晖;.20th International Conference on Computer Processing of Oriental Languages.2003,
[2]  
基于大规模真实文本的平衡语料分析与文本分类方法.[A].陈克利;宗成庆;王霞;.全国第七届计算语言学联合学术会议.2003,
[3]   基于分类和关键词组抽取的信息检索算法 [J].
钟敏娟 ;
林亚平 ;
陈治平 .
系统仿真学报, 2004, (05) :1009-1012+1016
[4]   一种基于大规模标注语料库的词语聚类方法 [J].
康铁钢 ;
戴汝为 .
系统仿真学报, 2003, (10) :1439-1442
[5]   一种基于聚类的汉语词语知识的获取方法 [J].
李盛 ;
杨尔弘 .
计算机工程与应用, 2003, (15) :95-98
[6]   数据挖掘中聚类方法比较研究 [J].
牟廉明 .
内江师范学院学报, 2003, (02) :16-20
[7]   文本分类系统SECTCS中若干技术问题的探讨 [J].
唐焕玲 ;
付克明 ;
鲁明羽 ;
不详 .
计算机工程与应用 , 2003, (11) :80-83