基于最大熵方法汉语基本短语分析

被引：2

作者：

朱冲 ^{[1
]}

王大为 ^{[2
,3
]}

张向利 ^{[1
]}

机构：

[1] 桂林电子科技大学信息与通信学院

[2] 中国科学技术大学自动化系

[3] 中国科学院合肥智能机械研究所

来源：

计算机工程与应用 | 2008年 / 32期

关键词：

短语分析; 潜层句法; 最大熵原理;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

提出了一个汉语基本短语分析模型,将汉语短语的边界划分和短语标识分开,假定这两个过程相互独立,采用最大熵方法分别建立模型解决。最大熵模型的关键是如何选取有效的特征,文中给出了两个步骤相关的特征空间以及特征选择过程和算法。实验表明,模型的短语定界精确率达到95.27%,标注精确率达到96.2%。

引用

收藏

页码：137 / 139

页数：3

相关论文

共 4 条

[1] 基于最大熵模型的组块分析 [J].

李素建 ;

刘群 ;

杨志峰 .

计算机学报, 2003, (12) :1722-1727

[2] 汉语基本短语的自动识别 [J].

张昱琪 ;

周强 .

中文信息学报, 2002, (06) :1-8

[3] GENERALIZED ITERATIVE SCALING FOR LOG-LINEAR MODELS [J].

DARROCH, JN ;

RATCLIFF, D .

ANNALS OF MATHEMATICAL STATISTICS, 1972, 43 (05) :1470-&

[4]

一个汉语短语自动界定模型. 周强. 软件学报 . 1996