AIS—基于文本挖掘的增强型Web信息处理技术

被引:3
作者
张文 [1 ,2 ]
唐锡晋 [3 ]
吉田武稔 [2 ]
机构
[1] 中国科学院软件研究所互联网实验室
[2] 北陆先端科学技术大学院大学
[3] 中国科学院数学与系统科学研究院
关键词
Web文本挖掘; 知识发现; AIS; 综合集成研讨厅; 香山科学会议;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
回顾了中文和英文语言环境下的Web文本挖掘现状,阐明了其现阶段的特点和技术瓶颈.之后提出了一种基于Web文本挖掘的网页内容挖掘技术:AIS(Augmented information support),介绍了相关实现所涉及的基础技术和功能.最后将AIS技术应用于香山科学会议网站,开发了AIS4XSSC文本挖掘系统并展示了现阶段其主要功能.实践表明AIS技术能够从大量的Web文本中有效提炼信息,提高用户检索效率并向用户推送有价值的信息.
引用
收藏
页码:96 / 104
页数:9
相关论文
共 12 条
  • [1] 综合集成研讨厅的几个示例
    唐锡晋
    [J]. 系统科学与数学, 2009, 29 (11) : 1507 - 1516
  • [2] 基于Web内容挖掘的信息支持工具AIS-GAE
    张文
    唐锡晋
    [J]. 管理评论, 2006, (09) : 21 - 26+63
  • [3] Web ME——一个大型网络挖掘环境系统
    鲁明羽
    张红
    付克明
    陆玉昌
    [J]. 哈尔滨工业大学学报, 2004, (09) : 1164 - 1167+1172
  • [4] 网页分类技术
    孙建涛
    沈抖
    陆玉昌
    石纯一
    [J]. 清华大学学报(自然科学版), 2004, (01) : 65 - 68
  • [5] Web使用挖掘的应用研究
    刘丽珍
    宋瀚涛
    陆玉昌
    [J]. 计算机科学, 2003, (09) : 46 - 48
  • [6] Web文本挖掘技术研究
    王继成
    潘金贵
    张福炎
    [J]. 计算机研究与发展, 2000, (05) : 513 - 520
  • [7] 可视化中文文本挖掘模型
    林鸿飞
    贡大跃
    张跃
    姚天顺
    [J]. 计算机科学, 2000, (04) : 37 - 41
  • [8] Internet上的文本数据挖掘
    王伟强
    高文
    段立娟
    [J]. 计算机科学, 2000, (04) : 32 - 36
  • [9] 综合集成方法体系与系统学研究[M]. 科学出版社 , 顾基发, 2007
  • [10] A text mining approach for automatic construction of hypertexts
    Yang, HC
    Lee, CH
    [J]. EXPERT SYSTEMS WITH APPLICATIONS, 2005, 29 (04) : 723 - 734