基于语义标注的信息抽取

被引:11
作者
李向阳
张亚非
机构
[1] 解放军理工大学通信工程学院
[2] 解放军理工大学训练部
关键词
信息抽取; 语义标注; 有限状态自动机; 军事标图;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
词性标注是引起语义缺失的根本原因 ,提出了以语义标注作为构建信息抽取规则的基础。基于语义标注的信息抽取可消除词性标注引起的 3个负面影响 ,用统一的方法来指导信息抽取过程。这种方法避开语法分析 ,具有较细的处理粒度 ,对语义规则性强的领域有一定的普遍适用性。设计了基于语义标注的 MIE(军用信息抽取 )系统 ,并对标图文本试行信息抽取。抽取结果表明 ,基于语义标注的信息抽取方式有一定的可行性和适用性。
引用
收藏
页码:39 / 43
页数:5
相关论文
共 1 条
[1]   一种Hash高速分词算法 [J].
李向阳 ;
张亚非 .
解放军理工大学学报(自然科学版), 2004, (02) :40-44