基于最大熵模型的组块分析

被引：184

作者：

李素建

刘群

杨志峰

机构：

[1] 北京大学计算语言学研究所

[2] 北京大学计算语言学研究所北京

来源：

计算机学报 | 2003年 / 12期

关键词：

组块分析; 语法分析; 最大熵原理; 浅层分析;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

采用最大熵模型实现中文组块分析的任务 .首先明确了中文组块的定义 ,并且列出了模型中所有的组块类型和组块标注符号 .组块划分和识别的过程可以转化为对于每一个词语赋予一个组块标注符号的过程 ,我们可以把它作为一个分类问题根据最大熵模型来解决 .最大熵模型的关键是如何选取有效的特征 ,文中给出了相关的特征选择过程和算法 .最后给出了系统实现和实验结果 .

引用

页码：1722 / 1727

页数：6