汉语组块识别

被引:6
作者
李珩
谭咏梅
朱靖波
姚天顺
机构
[1] 东北大学信息科学与工程学院
[2] 东北大学信息科学与工程学院 辽宁沈阳
[3] 辽宁沈阳
关键词
汉语组块; 识别; 隐马尔科夫模型; 增益的隐马尔科夫模型; 模型训练; 转换函数;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出一种基于增益的隐马尔科夫模型(transductiveHMM)的方法,用于汉语组块(ChineseChunk)识别的研究·该方法借助几个转换函数,导入各种上下文信息用于HMM的训练,避免对HMM训练和标注过程修改的同时,构造了更为准确的模型,并在此基础上,将其中两个较好的模型融合为一个更好的模型·实验结果显示,该方法在汉语组块识别方面是有效的,在哈尔滨工业大学树库语料测试的结果是F=82 38%·
引用
收藏
页码:114 / 117
页数:4
相关论文
共 7 条
[1]  
Text chunking using transformationBased learning. Ramshaw L,Marcus M. Proceedings of Third Workshop on Very Large Corpora[C] . 1995
[2]  
Memory-based shallow parsing. Daelemans W,Buchholz S,Veenstra J. Proceedings of CoNLL . 1999
[3]  
Improving chunking by means of lexical-contextual information in statistical language models. Pla Ferran,Molina Antonio,Prieto Natividad. Proceedings of CoNLL-2000 and LLL-2000 . 2000
[4]  
Chunking with maximum entropy models. Koeling Rob. Proceedings of CoNLL-2000 and LLL-2000 . 2000
[5]  
Use of support vector learning for chunk identification. Kudoh Taku,Matsumoto Yuji. Proceedings of CoNLL-2000 and LLL-2000 . 2000
[6]  
Hybrid text chunking. Zhou G D,Su J,Tey Tongguan. Proceedings of CoNLL-2000 and LLL-2000 . 2000
[7]  
A stochastic parts program and noun phrase parser for unrestricted text. Church K W. Proceedings of the 1 st Conference on Applied Natural Language Processing[C] . 1988