统计和规则相结合的汉语组块分析

被引:19
作者
李素建
刘群
白硕
机构
[1] 中国科学院计算技术研究所
[2] 中国科学院计算技术研究所  北京 
[3]  北京 
关键词
组块分析; 部分分析; 语料库;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
从文本中获得的组块对机器翻译、信息检索等很多领域都非常有用.介绍了规则和统计进行组块分析的处理策略,提出了规则与统计相结合的处理方法.并且结合组块分析的实际情况改进了一般评价系统性能的指标,通过封闭测试和开放测试验证,与单纯规则组块划分相比较,组块识别的精确率和召回率都得到了提高,组块划分错误率降低了7%.
引用
收藏
页码:385 / 391
页数:7
相关论文
共 3 条
[1]   汉语最长名词短语的自动识别 [J].
周强 ;
孙茂松 ;
黄昌宁 .
软件学报, 2000, (02) :195-201
[2]   基于转换的汉语基本名词短语识别模型 [J].
赵军 ;
黄昌宁 .
中文信息学报, 1999, (02) :2-8+40
[3]   规则和统计相结合的汉语词类标注方法 [J].
周强 .
中文信息学报, 1995, (03) :1-10