基于Internet的军事演习信息抽取系统

被引:6
作者
李跃进
赵晶
林鸿飞
机构
[1] 大连理工大学计算机系
关键词
信息抽取; 最大熵模型; 组块分析; 模式匹配;
D O I
暂无
中图分类号
TP319 [专用应用软件];
学科分类号
081202 ; 0835 ;
摘要
论文论述了Web文档的信息抽取的基本方法,设计并实现了一个基于Internet上的军事演习信息抽取系统—SBIES。在系统中引入了分装器的机器学习算法来获取网页抽取规则,采用基于最大熵模型的组块分析方法进行部分语法分析,利用模式匹配的方法实现信息的自动抽取,以数据库与XML相结合的方式组织信息库,并实现信息的Web表示和查询。系统测试结果表明,它具有较高的抽取召回率和抽准确率。
引用
收藏
页码:214 / 218
页数:5
相关论文
共 4 条
[1]  
计算语言学.[M].刘颖编著;.清华大学出版社.2002,
[2]   基于最大熵模型的组块分析 [J].
李素建 ;
刘群 ;
杨志峰 .
计算机学报, 2003, (12) :1722-1727
[3]   信息抽取研究综述 [J].
李保利 ;
陈玉忠 ;
俞士汶 .
计算机工程与应用, 2003, (10) :1-5+66
[4]   中文信息自动抽取 [J].
朱靖波 ;
姚天顺 .
东北大学学报, 1998, (01) :55-57