基于复杂类型数据的发现特征子空间模型(DFSSM)的研究

被引:9
作者
杨炳儒
唐菁
机构
[1] 北京科技大学信息工程学院
关键词
复杂类型数据; 数据挖掘; 文本挖掘;
D O I
暂无
中图分类号
TP393.03 [];
学科分类号
摘要
探讨围绕知识发现领域中较为宏观、较为重大的问题。首先 ,根据复杂类型数据 (包括Web数据、多媒体数据、空间数据、时间序列数据等 )所具有的非线性动力学性质和特征 ,采用模式 (定义为Hilbert空间中的矢量 )来定量地表征复杂类型数据的多变性及具有的不确定状态和行为 ,并用模式的变化来刻画其整体知识发现过程的发展和演变规律 ;其次 ,以知识发现系统内在机理的研究为基础 ,构造了复杂类型数据知识发现系统的总体结构模型———发现特征子空间模型DFSSM ;最后 ,用基于Web的文本挖掘系统和基于图像信息 (气象云图 )的知识发现系统作为实例进行了验证 ,结果表明DFSSM方法对于非结构化的文本数据及图像数据类型的知识发现过程具有指导性作用。因此 ,该结构模型具有较好的实用性与普适性 ,有望拓展到其他复杂类型数据的知识发现过程中
引用
收藏
页码:56 / 61+68 +68
页数:7
相关论文
共 3 条
[1]   基于Web的文本挖掘 [J].
唐菁 ;
张前 ;
陈泓婕 ;
刘宁 ;
杨炳儒 .
计算机工程与应用, 2002, (21) :198-201
[2]   KDD中双库协同机制的研究(Ⅱ) [J].
杨炳儒 ;
王建新 ;
孙海洪 .
中国工程科学, 2002, (05) :34-43+78
[3]   KDD中双库协同机制的研究(Ⅰ) [J].
杨炳儒 ;
王建新 .
中国工程科学, 2002, (04) :41-51+57