汉语最长名词短语的自动识别

被引:37
作者
周强
孙茂松
黄昌宁
机构
[1] 智能技术与系统国家重点实验室!北京
[2] 清华大学计算机科学与技术系!北京
基金
中国博士后科学基金;
关键词
最长名词短语; 边界识别; 句法分析;
D O I
10.13328/j.cnki.jos.2000.02.006
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
通过对包含 5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分析 ,提出了两种有效的汉语最长名词短语自动识别算法 :基于边界分布概率的识别算法和基于内部结构组合的识别算法 .实验结果显示 ,后者的识别正确率和召回率分别达到了 85.4 %和 82 .3% ,取得了较好的自动识别效果 .关键词 最长名词短语 ,边界识别 ,句法分析 .
引用
收藏
页码:195 / 201
页数:7
相关论文
共 3 条
[1]  
语言工程[M]. - 清华大学出版社 , 陈力为, 1997
[2]  
陆俭明自选集[M]. - 河南教育出版社 , 陆俭明著, 1993
[3]  
一个汉语短语自动界定模型 .2 周强. 软件学报 . 1996