中文文本的关键词自动抽取和模糊分类

被引:48
作者
何新贵
彭甫阳
机构
[1] 北京系统工程研究所
关键词
文本,分类,模糊方法,模糊分类网络,语义距离;
D O I
暂无
中图分类号
G202 [信息处理技术];
学科分类号
摘要
本文提出了中文文本分类的两种模糊方法,一种基于模糊集间的语义距离[2],一种基于本文中提出的‘模糊分类网络’。两者都必须首先从文本中抽取关键词集合,本文给出了一种主要采用统计方法结合受限自然语言理解技术的模糊关键词集合提取方法,它与模糊分类方法结合,可望达到文本信息的自动分类。所提出的方法同样适合于模式识别之类问题的解决。
引用
收藏
页码:10 / 16
页数:7
相关论文
empty
未找到相关数据