共 8 条
基于规则的中文文本时间表达式识别和规范化方法
被引:8
作者:
马雷雷
[1
,2
,3
]
李宏伟
[1
]
魏勇
[1
,2
]
梁汝鹏
[1
]
龚竞
[2
]
机构:
[1] 信息工程大学
[2] 四川省应急测绘与防灾减灾工程技术研究中心
[3] 部队
来源:
关键词:
时间表达式;
中文文本;
规则;
正则表达式;
识别;
规范化;
推理;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
时间信息是事件的基本要素之一,时间信息识别在信息处理中处于基础地位。提出了一种基于规则的时间表达式识别和规范化方法。首先对中文文本时间表达式进行分类,基于正则表达式制定规则,利用模式匹配方法识别时间表达式;然后介绍了基准时间的确定方法,基于推理思想详细分析了时间表达式的规范化过程;最后通过实验进行了测试与分析,结果表明文章的方法具有较高的准确率、召回率和F值。
引用
收藏
页码:560 / 565
页数:6
相关论文