基于细粒度特征的话题句识别方法

被引:6
作者
蒋玉茹 [1 ,2 ]
宋柔 [1 ,3 ]
机构
[1] 北京工业大学计算机学院
[2] 北京信息科技大学计算机学院
[3] 北京语言大学信息科学学院
关键词
话题句; 编辑距离; 语法特征; 可邻接性;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
话题句(TC)识别中采用穷举方法生成标点句的候选话题句(CTC)影响系统的执行效率和话题句识别的准确率。提出一种新的候选话题句生成方法,利用标点句在篇章中的位置特征、话题的语法特征以及话题串与说明的邻接性特征,指导候选话题句的生成过程。实验结果表明,该方法减少了候选话题句的个数,提高了系统效率。而且,通过与基于穷举式候选话题句生成策略的话题句识别工作进行对比,该方法使单个标点句话题句识别的准确率提高了0.96个百分点,使标点句序列话题句识别的准确率提高了1.31个百分点。
引用
收藏
页码:1345 / 1349
页数:5
相关论文
共 4 条
[1]
话题句识别中候选话题句评估函数的优化 [J].
蒋玉茹 ;
宋柔 .
北京工业大学学报, 2014, 40 (01) :43-48
[2]
基于广义话题理论的话题句识别 [J].
蒋玉茹 ;
宋柔 .
中文信息学报, 2012, 26 (05) :114-119+128
[3]
现代汉语跨标点句句法关系的性质研究 [J].
宋柔 .
世界汉语教学, 2008, (02) :26-44+2
[4]
现代汉语书面语中跨标点句句法关系约束条件的研究 [D]. 
张瑞朋 .
北京语言大学,
2007