基于最大熵方法汉语基本短语分析

被引:2
作者
朱冲 [1 ]
王大为 [2 ,3 ]
张向利 [1 ]
机构
[1] 桂林电子科技大学信息与通信学院
[2] 中国科学技术大学自动化系
[3] 中国科学院合肥智能机械研究所
关键词
短语分析; 潜层句法; 最大熵原理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出了一个汉语基本短语分析模型,将汉语短语的边界划分和短语标识分开,假定这两个过程相互独立,采用最大熵方法分别建立模型解决。最大熵模型的关键是如何选取有效的特征,文中给出了两个步骤相关的特征空间以及特征选择过程和算法。实验表明,模型的短语定界精确率达到95.27%,标注精确率达到96.2%。
引用
收藏
页码:137 / 139
页数:3
相关论文
共 4 条
[1]   基于最大熵模型的组块分析 [J].
李素建 ;
刘群 ;
杨志峰 .
计算机学报, 2003, (12) :1722-1727
[2]   汉语基本短语的自动识别 [J].
张昱琪 ;
周强 .
中文信息学报, 2002, (06) :1-8
[3]   GENERALIZED ITERATIVE SCALING FOR LOG-LINEAR MODELS [J].
DARROCH, JN ;
RATCLIFF, D .
ANNALS OF MATHEMATICAL STATISTICS, 1972, 43 (05) :1470-&
[4]  
一个汉语短语自动界定模型. 周强. 软件学报 . 1996