基于最大熵模型的组块分析

被引:184
作者
李素建
刘群
杨志峰
机构
[1] 北京大学计算语言学研究所
[2] 北京大学计算语言学研究所 北京
关键词
组块分析; 语法分析; 最大熵原理; 浅层分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
采用最大熵模型实现中文组块分析的任务 .首先明确了中文组块的定义 ,并且列出了模型中所有的组块类型和组块标注符号 .组块划分和识别的过程可以转化为对于每一个词语赋予一个组块标注符号的过程 ,我们可以把它作为一个分类问题根据最大熵模型来解决 .最大熵模型的关键是如何选取有效的特征 ,文中给出了相关的特征选择过程和算法 .最后给出了系统实现和实验结果 .
引用
收藏
页码:1722 / 1727
页数:6
相关论文
共 3 条
[1]
汉语最长名词短语的自动识别 [J].
周强 ;
孙茂松 ;
黄昌宁 .
软件学报, 2000, (02) :195-201
[2]
基于转换的汉语基本名词短语识别模型 [J].
赵军 ;
黄昌宁 .
中文信息学报, 1999, (02)
[3]
规则和统计相结合的汉语词类标注方法[J] 周强 中文信息学报 1995, 03