汉语词性标注方法的研究

被引:8
作者
魏欧
孙玉芳
机构
[1] 中国科学院软件研究所
[2] 中国科学院软件研究所 北京
[3] 北京
关键词
Corpus; Part-of-speech tagging; Speech ambiguity phenomena; N-gram; Chinese;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
<正> 1 引言自然语言中,表达意义的符号(词)往往在各个层面上有歧义。在句法层面上,一个词可以兼好几种词性;在语义层面上,一个词可能有多个义项。词性歧义是由语言中的兼类词,即具有不止一个词性特征的词所引起的,只有在一定的上下文语境关系中,词所表现
引用
收藏
页码:71 / 75
页数:5
相关论文
empty
未找到相关数据