学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
词性标注中生词处理算法研究
被引:13
作者
:
论文数:
引用数:
h-index:
机构:
张孝飞
论文数:
引用数:
h-index:
机构:
陈肇雄
论文数:
引用数:
h-index:
机构:
黄河燕
蔡智
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学计算机系
蔡智
机构
:
[1]
中国科技大学计算机系
[2]
中国科学院计算机语言信息工程研究中心
[3]
中国科技大学计算机系 合肥
[4]
北京
[5]
合肥
来源
:
中文信息学报
|
2003年
/ 05期
关键词
:
计算机应用;
中文信息处理;
自然语言理解;
词性兼类;
隐马尔科夫模型;
语料库;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
词性兼类是自然语言理解必须解决的一类非常重要的歧义现象,尤其是对生词的词性歧义处理有很大的难度。文章基于隐马尔科夫模型(HMM),通过将生词的词性标注问题转化为求词汇发射概率,在词性标注中提出了一种生词处理的新方法。该方法除了用到一个标注好的单语语料库外,没使用任何其他资源(比如语法词典、语法规则等),封闭测试正确率达97%左右,开放测试正确率也达95%左右,基本上达到了实用的程度。同时还给出了与其他同样基于HMM的词性标注方法的测试比较结果,结果表明本文方法的标注正确率有较大的提高。
引用
收藏
页码:1 / 5
页数:5
相关论文
共 3 条
[1]
语料库语言学.[M].黄昌宁;李涓子著;.商务印书馆.2002,
[2]
机器翻译原理.[M].赵铁军等编著;.哈尔滨工业大学出版社.2000,
[3]
通用的自然语言词法分析机制
[J].
陈志忠
论文数:
0
引用数:
0
h-index:
0
机构:
漳州师范学院
陈志忠
;
陈肇雄
论文数:
0
引用数:
0
h-index:
0
机构:
漳州师范学院
陈肇雄
;
高庆狮
论文数:
0
引用数:
0
h-index:
0
机构:
漳州师范学院
高庆狮
.
计算机学报,
1991,
(02)
:93
-99
←
1
→
共 3 条
[1]
语料库语言学.[M].黄昌宁;李涓子著;.商务印书馆.2002,
[2]
机器翻译原理.[M].赵铁军等编著;.哈尔滨工业大学出版社.2000,
[3]
通用的自然语言词法分析机制
[J].
陈志忠
论文数:
0
引用数:
0
h-index:
0
机构:
漳州师范学院
陈志忠
;
陈肇雄
论文数:
0
引用数:
0
h-index:
0
机构:
漳州师范学院
陈肇雄
;
高庆狮
论文数:
0
引用数:
0
h-index:
0
机构:
漳州师范学院
高庆狮
.
计算机学报,
1991,
(02)
:93
-99
←
1
→