中文文本的信息自动抽取和相似检索机制

被引：2

作者：

林鸿飞

杨志豪

赵晶

机构：

[1] 大连理工大学计算机系

来源：

小型微型计算机系统 | 2007年 / 11期

关键词：

信息抽取语义模板概念扩充模糊语义;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

目前信息抽取成为提供高质量信息服务的重要手段,提出面向中文文本信息的自动抽取和相似检索机制,其基本思想是将用户兴趣表示为语义模板,对关键字进行概念扩充,通过搜索引擎获得初步的候选文本集合,在概念触发机制和部分分析技术基础上,利用语义关系到模板槽的映射机制,填充文本语义模板,形成结构化文本数据库.基于文本数据表述的模糊性,给出用户查询与文本语义模板的相似关系,实现了相似检索,可以更加全面地满足用户的信息需求.

引用

页码：2074 / 2079

页数：6

共 5 条

[1] 基于Web资源的信息抽取技术 [J].