文本挖掘与中文文本挖掘模型研究

被引:50
作者
谌志群
张国煊
机构
[1] 杭州电子科技大学计算机应用技术研究所
基金
浙江省自然科学基金;
关键词
文本挖掘; 数据挖掘; 中文文本挖掘模型; 中文信息处理;
D O I
暂无
中图分类号
G354 [情报检索];
学科分类号
摘要
文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCT-MF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。
引用
收藏
页码:1046 / 1051
页数:6
相关论文
共 13 条