学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
汉语基本名词短语结构分析模型
被引:26
作者
:
赵军
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
赵军
论文数:
引用数:
h-index:
机构:
黄昌宁
机构
:
[1]
清华大学计算机科学与技术系
[2]
清华大学智能技术与系统国家重点实验室
来源
:
计算机学报
|
1999年
/ 02期
关键词
:
自然语言处理;
语料库;
基本名词短语;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
本文提出了用词语潜在依存关系分析汉语baseNP结构的模型,它有以下的特点:①将依存语法知识融入概率模型中,使得baseNP结构分析在依存语法知识的指导下进行,其性能优于纯粹的概率模型——相邻模型;②词语潜在依存强度的获取算法是基于MDL原则的,在模型建造时既考虑数据拟合性,又考虑模型归纳性,其性能优于基于极大似然原则的词语潜在依存强度获取算法;③词语潜在依存强度获取算法在复杂特征集上进行,可以有效地解决参数估计中的数据稀疏问题.实验结果显示,这个模型对于汉语baseNP结构分析是有效的.
引用
收藏
页码:30 / 35
页数:6
相关论文
未找到相关数据
未找到相关数据