规则与统计相结合的日语时间表达式识别

被引:3
作者
赵紫玉
徐金安
张玉洁
刘江鸣
机构
[1] 北京交通大学计算机与信息技术学院
基金
中央高校基本科研业务费专项资金资助;
关键词
知识库; 规则集; 统计模型;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
该文提出了一种基于自定义知识库强化获取规则集,以及规则与统计模型相结合的日语时间表达式识别方法。在按照Timex2标准对时间表达进行细化分类的基础上,我们结合日语时间词的特点,渐进地扩展重构日语时间表达式知识库,实现基于知识库获取的规则集的优化更新,旨在不断提高时间表达式的识别精准度。同时,融合CRF统计模型提高日语时间表达式识别的泛化能力。实验结果显示开放测试F1值达0.898 7。
引用
收藏
页码:192 / 200
页数:9
相关论文
共 16 条
[1]  
A Rule Based Approach to Temporal Expression Tagging. PawelMaqur,Robert Dale. Proceeding of the International Multiconference on Computer Science and Information Technology . 2007
[2]  
A Chinese Temporal Parser for Extracting and Normalizing Temporal Information. Mingli Wu,Wenjie Li,Qin Lu,et al. Proceeding of International Joint Conference on Natural Language Processing(IJCNLP) . 2005
[3]  
Towards Task -Based Temporal Extraction and Recognition. David Ahn,SisayFissahaAdafre,Maarten De Rijke. Proceedings Dagstuhl Workshop on Annotating,Extracting,and Reasoning about Time and Events . 2005
[4]  
ACE(Automatic Content Extraction)Chinese Annotation Gubdelines for TIMEX2 (Summary). . 2005
[5]  
Biological Entity Recognition with ConditionalRandom Fields. He Y,Kayaal P M. Proceedings ofAMIA Annual Symposium . 2008
[6]  
Transformation-based error-driven learning and natural language processing: a case study in part of speech tagging. Brill E. Computational Linguistics . 1995
[7]  
Conditional random fields: probabilistic models for segmenting and labeling sequence data. Lafferty J,McCallum A,Pereira F. Proceedings of the Eighteenth International Conference on Machine Learning . 2001
[8]   日汉时间词对比分析及相关问题 [J].
辛永芬 .
河南大学学报(社会科学版), 2005, (03) :96-99
[9]   基于依存分析和错误驱动的中文时间表达式识别 [J].
贺瑞芳 ;
秦兵 ;
刘挺 ;
潘越群 ;
李生 .
中文信息学报, 2007, (05) :36-40
[10]   知识库系统的原理及其在智能搜索引擎中的应用 [J].
刘成亮 ;
韩海伟 .
电脑知识与技术, 2008, (08) :1512-1514