文本挖掘与中文文本挖掘模型研究

被引：50

作者：

谌志群

张国煊

机构：

[1] 杭州电子科技大学计算机应用技术研究所

来源：

情报科学 | 2007年 / 07期

基金：

浙江省自然科学基金;

关键词：

文本挖掘; 数据挖掘; 中文文本挖掘模型; 中文信息处理;

D O I：

暂无

中图分类号：

G354 [情报检索];

学科分类号：

摘要：

文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCT-MF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。

引用

页码：1046 / 1051

页数：6

共 13 条

[1] 基于潜在语义空间维度特性的多层文档聚类
刘云峰
齐欢
代建民
[J]. 清华大学学报(自然科学版), 2005, (S1) : 1783 - 1786
[2] 用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法
袁毓林
[J]. 中文信息学报, 2005, (05) : 37 - 43
[3] 基于粗糙集的文本分类方法研究
卢娇丽
郑家恒
[J]. 中文信息学报, 2005, (02) : 66 - 70
[4] 文本挖掘研究进展
谌志群
张国煊
[J]. 模式识别与人工智能, 2005, 18 (01) : 65 - 74
[5] 中文文本分类中的特征选择研究
周茜
赵明生
扈旻
[J]. 中文信息学报, 2004, (03) : 17 - 23
[6] 基于潜在语义分析的BBS文档Bayes鉴别器
刘昌钰
唐常杰
于中华
杜永萍
郭颖
[J]. 计算机学报, 2004, (04) : 566 - 572
[7] 基于商品分类信息的关联规则聚类
阮备军
朱扬勇
[J]. 计算机研究与发展, 2004, (02) : 352 - 360
[8] Web日志中有趣关联规则的发现
李颖基
彭宏
郑启伦
曾炜
[J]. 计算机研究与发展, 2003, (03) : 435 - 439
[9] 基于关联规则的Web文档聚类算法
宋擒豹
沈钧毅
[J]. 软件学报, 2002, (03) : 417 - 423
[10] 中文文本挖掘的特征导航机制
林鸿飞
战学刚
姚天顺
[J]. 东北大学学报, 2000, (03) : 240 - 243

← 1 2 →