学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
中文分词与词性标注研究
被引:46
作者
:
论文数:
引用数:
h-index:
机构:
梁喜涛
顾磊
论文数:
0
引用数:
0
h-index:
0
机构:
南京邮电大学计算机学院
顾磊
机构
:
[1]
南京邮电大学计算机学院
来源
:
计算机技术与发展
|
2015年
/ 25卷
/ 02期
关键词
:
中文分词;
主动学习;
词性标注;
自然语言处理;
一体化模型;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
分词和词性标注是中文语言处理的重要技术,广泛应用于语义理解、机器翻译、信息检索等领域。在搜集整理当前分词和词性标注研究与应用成果的基础上,对中文分词和词性标注的基本方法进行了分类和探讨。首先在分词方面,对基于词典的和基于统计的方法进行了详细介绍,并且列了三届分词竞赛的结果;其次在词性标注方面,分别对基于规则的方法和基于统计的方法进行了阐述;接下来介绍了中文分词和词性标注一体化模型相关方法。此外还分析了各种分词和词性标注方法的优点和不足,在此基础上,为中文分词和词性标注的进一步发展提供了建议。
引用
收藏
页码:175 / 180
页数:6
相关论文
未找到相关数据
未找到相关数据