中文文本的信息自动抽取和相似检索机制

被引:2
作者
林鸿飞
杨志豪
赵晶
机构
[1] 大连理工大学计算机系
关键词
信息抽取语义模板概念扩充模糊语义;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
目前信息抽取成为提供高质量信息服务的重要手段,提出面向中文文本信息的自动抽取和相似检索机制,其基本思想是将用户兴趣表示为语义模板,对关键字进行概念扩充,通过搜索引擎获得初步的候选文本集合,在概念触发机制和部分分析技术基础上,利用语义关系到模板槽的映射机制,填充文本语义模板,形成结构化文本数据库.基于文本数据表述的模糊性,给出用户查询与文本语义模板的相似关系,实现了相似检索,可以更加全面地满足用户的信息需求.
引用
收藏
页码:2074 / 2079
页数:6
相关论文
共 5 条
[1]   基于Web资源的信息抽取技术 [J].
郭志红 .
情报科学, 2002, (12) :1282-1284
[2]   基于多知识的Web网页信息抽取方法 [J].
朱明 ;
黄云 ;
蔡庆生 .
小型微型计算机系统, 2001, (09) :1058-1061
[3]   基于概念的文本结构分析方法 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
计算机研究与发展, 2000, (03) :324-328
[4]   基于概念扩充的中文文本过滤模型 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
计算机科学, 2000, (02) :88-90+82
[5]  
自然语言理解[M]. 清华大学出版社 , 姚天顺等编著, 2002