基于规则的中文文本时间表达式识别和规范化方法

被引:8
作者
马雷雷 [1 ,2 ,3 ]
李宏伟 [1 ]
魏勇 [1 ,2 ]
梁汝鹏 [1 ]
龚竞 [2 ]
机构
[1] 信息工程大学
[2] 四川省应急测绘与防灾减灾工程技术研究中心
[3] 部队
关键词
时间表达式; 中文文本; 规则; 正则表达式; 识别; 规范化; 推理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
时间信息是事件的基本要素之一,时间信息识别在信息处理中处于基础地位。提出了一种基于规则的时间表达式识别和规范化方法。首先对中文文本时间表达式进行分类,基于正则表达式制定规则,利用模式匹配方法识别时间表达式;然后介绍了基准时间的确定方法,基于推理思想详细分析了时间表达式的规范化过程;最后通过实验进行了测试与分析,结果表明文章的方法具有较高的准确率、召回率和F值。
引用
收藏
页码:560 / 565
页数:6
相关论文
共 8 条