基于条件随机场与时间词库的中文时间表达式识别

被引:11
作者
吴琼
黄德根
机构
[1] 大连理工大学计算机科学与技术学院
关键词
CRF; 规则; 时间触发词; 时间缀词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文提出一种统计与规则相结合的时间表达式识别方法。首先,通过分析中文文本中时间表达式的词形、词性和上下文信息,采用条件随机场识别时间单元而非时间表达式整体,避免了中文时间表达式边界定位不准确的问题;然后,从训练语料中自动获取候选触发词,并依据评价函数对候选触发词打分,筛选出正确的触发词完善触发词库;最后,根据时间触发词库与时间缀词库,制定规则对时间表达式边界进行定位。实验结果显示开式测试F1值达到98.31%。
引用
收藏
页码:169 / 174+189 +189
页数:7
相关论文
共 8 条
[1]   规则与统计相结合的日语时间表达式识别 [J].
赵紫玉 ;
徐金安 ;
张玉洁 ;
刘江鸣 .
中文信息学报, 2013, (06) :192-200
[2]   中文时间表达式及类型识别 [J].
李君婵 ;
谭红叶 ;
王风娥 .
计算机科学, 2012, 39(S3) (S3) :191-194+211
[3]   基于条件随机场的中文时间短语识别 [J].
朱莎莎 ;
刘宗田 ;
付剑锋 ;
朱芳 .
计算机工程, 2011, 37 (15) :164-167
[4]   基于语义角色的中文时间表达式识别 [J].
刘莉 ;
何中市 ;
邢欣来 ;
毛小丽 .
计算机应用研究, 2011, 28 (07) :2543-2545
[5]   自动构建时间基元规则库的中文时间表达式识别 [J].
邬桐 ;
周雅倩 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2010, (04) :3-10
[6]   中文时间信息的TIMEX2自动标注 [J].
林静 ;
曹德芳 ;
苑春法 .
清华大学学报(自然科学版), 2008, (01) :117-120
[7]   基于依存分析和错误驱动的中文时间表达式识别 [J].
贺瑞芳 ;
秦兵 ;
刘挺 ;
潘越群 ;
李生 .
中文信息学报, 2007, (05) :36-40
[8]   基于规则的中文时间词和数词的自动识别算法 [J].
高霄云 ;
杨建林 .
现代图书情报技术, 2007, (03) :46-50