学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于Internet的军事演习信息抽取系统
被引:6
作者
:
李跃进
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
李跃进
赵晶
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
赵晶
论文数:
引用数:
h-index:
机构:
林鸿飞
机构
:
[1]
大连理工大学计算机系
来源
:
计算机工程与应用
|
2006年
/ 14期
关键词
:
信息抽取;
最大熵模型;
组块分析;
模式匹配;
D O I
:
暂无
中图分类号
:
TP319 [专用应用软件];
学科分类号
:
081202 ;
0835 ;
摘要
:
论文论述了Web文档的信息抽取的基本方法,设计并实现了一个基于Internet上的军事演习信息抽取系统—SBIES。在系统中引入了分装器的机器学习算法来获取网页抽取规则,采用基于最大熵模型的组块分析方法进行部分语法分析,利用模式匹配的方法实现信息的自动抽取,以数据库与XML相结合的方式组织信息库,并实现信息的Web表示和查询。系统测试结果表明,它具有较高的抽取召回率和抽准确率。
引用
收藏
页码:214 / 218
页数:5
相关论文
共 4 条
[1]
计算语言学.[M].刘颖编著;.清华大学出版社.2002,
[2]
基于最大熵模型的组块分析
[J].
李素建
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所北京,北京,北京
李素建
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所北京,北京,北京
刘群
;
杨志峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所北京,北京,北京
杨志峰
.
计算机学报,
2003,
(12)
:1722
-1727
[3]
信息抽取研究综述
[J].
李保利
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
李保利
;
陈玉忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
陈玉忠
;
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
俞士汶
.
计算机工程与应用,
2003,
(10)
:1
-5+66
[4]
中文信息自动抽取
[J].
朱靖波
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学信息科学与工程学院
朱靖波
;
姚天顺
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学信息科学与工程学院
姚天顺
.
东北大学学报,
1998,
(01)
:55
-57
←
1
→
共 4 条
[1]
计算语言学.[M].刘颖编著;.清华大学出版社.2002,
[2]
基于最大熵模型的组块分析
[J].
李素建
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所北京,北京,北京
李素建
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所北京,北京,北京
刘群
;
杨志峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所北京,北京,北京
杨志峰
.
计算机学报,
2003,
(12)
:1722
-1727
[3]
信息抽取研究综述
[J].
李保利
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
李保利
;
陈玉忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
陈玉忠
;
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
俞士汶
.
计算机工程与应用,
2003,
(10)
:1
-5+66
[4]
中文信息自动抽取
[J].
朱靖波
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学信息科学与工程学院
朱靖波
;
姚天顺
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学信息科学与工程学院
姚天顺
.
东北大学学报,
1998,
(01)
:55
-57
←
1
→