英文句子边界自动识别

被引:5
作者
黄成哲
张晓光
李向宏
王丁
机构
[1] 黑龙江工程学院计算机系
[2] 黑龙江工程学院计算机系 哈尔滨
[3] 哈尔滨
关键词
语句边界检测; 决策树; 错误驱动; 规则;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
英语句子边界的识别是英文文本分析的基本问题 ,是进一步进行英汉机器翻译的基础。本文采用了统计决策树与错误驱动相结合的方法进行英语句子边界的识别 ,首先通过决策树学习训练语句中的句子划分规则 ,之后用错误驱动的方法对所获得的结果进一步修正 ,对 Penn Tree-Bank语句进行测试 ,正确率达到 98.6 %。
引用
收藏
页码:30 / 34
页数:5
相关论文
共 2 条
[1]  
Some Application of Tree - Modeling to Speech and Language Indexing. Riley,M. D. In Proceedings of the DARPA Speech and Natural Language Workshop . 1989
[2]  
Period Disambiguation Using a Neural Network. Humphrey,T. and Zhou,F. In IJCNN: International Joint Conference on Neural Networks . 1989