学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
语言信息处理技术中的最大熵模型方法
被引:10
作者
:
论文数:
引用数:
h-index:
机构:
李素建
论文数:
引用数:
h-index:
机构:
刘群
张志勇
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
张志勇
论文数:
引用数:
h-index:
机构:
程学旗
机构
:
[1]
中国科学院计算技术研究所
来源
:
计算机科学
|
2002年
/ 07期
关键词
:
Natural language processing;
Maxium entropy model;
GIS algorithm.Statistical method;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
<正> 1 引言进行汉语处理时经常遇到的问题有:分词、词性标注、语法和语义分析等等。这些自然语言中的问题都可以形式化为分类问题,估计某一类y在上下文x中发生的概率,即p(y,x)。在汉语中上下文x的内容可以包括汉字、词、词性等,对于不同的任务上下文的内容也不同。这类问题可以采用统计建模的方法去处理。首先是采集大量样本进行训练,样本代表了该任务的知识和信息,选取样本的好坏确定了知识完整性的程度。然后建立一个统计模型,并把样本知识结合到模型中,来预测随机过程将来的行为。
引用
收藏
页码:108 / 110
页数:3
相关论文
未找到相关数据
未找到相关数据