基于最大熵模型的汉语标点句缺失话题自动识别初探

被引:7
作者
卢达威 [1 ]
宋柔 [2 ]
机构
[1] 北京大学中国语言文学系
[2] 北京语言大学语言信息处理研究所
关键词
广义话题结构; 新支话题; 自动识别; 最大熵模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
本文的任务是判别标点句缺失话题是上句的主语还是宾语,将该任务作为标点句缺失话题自动识别研究的切入点。首先归纳了判别这一任务的一系列字面特征和语义特征,然后结合规则和最大熵模型,进行自动判别实验。结果显示,对特定类别动词的实验F值达到82%。对实验结果的分析说明,动词特征和语义特征对判别该任务的作用最大,规则方法和统计方法在判别任务中不能偏废,精细化的知识对判别的性能有重要影响。
引用
收藏
页码:2282 / 2293
页数:12
相关论文
共 10 条
[1]
从广义话题结构考察汉语篇章话题认知复杂度 [J].
卢达威 ;
宋柔 ;
尚英 .
中文信息学报, 2014, 28 (05) :112-124
[2]
动词引出新支话题的语用功能研究 [J].
季翠 ;
卢达威 ;
宋柔 .
中文信息学报, 2014, 28 (03) :22-27
[3]
基于细粒度特征的话题句识别方法 [J].
蒋玉茹 ;
宋柔 .
计算机应用, 2014, 34 (05) :1345-1349
[4]
话题句识别中候选话题句评估函数的优化 [J].
蒋玉茹 ;
宋柔 .
北京工业大学学报, 2014, 40 (01) :43-48
[5]
汉语篇章广义话题结构的流水模型 [J].
宋柔 .
中国语文, 2013, (06) :483-494+575
[6]
基于广义话题理论的话题句识别 [J].
蒋玉茹 ;
宋柔 .
中文信息学报, 2012, 26 (05) :114-119+128
[7]
现代汉语跨标点句句法关系的性质研究 [J].
宋柔 .
世界汉语教学, 2008, (02) :26-44+2
[8]
汉语叙述文中的小句前部省略现象初析 [J].
宋柔 .
中文信息学报, 1992, (03) :62-68
[9]
现代汉语书面语中跨标点句句法关系约束条件的研究.[M].张瑞朋; 著.中国社会科学出版社.2013,
[10]
现代汉语描写语法.[M].张斌; 主编.商务印书馆.2010,