利用遗传算法实现词类标记集的优化

被引:1
作者
孙宏林
陆勤
俞士汶
机构
[1] 北京大学计算语言学研究所!北京北京语言文化大学语言信息处理研究所北京
[2] 香港理工大学电子计算学系!香港红勘
[3] 北京大学计算语言学研究所!北京
关键词
词性标注; 词类; 标记集; 遗传算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
过去词类标记集的选择主要基于专家的经验知识 ,缺乏自动或半自动的方法来辅助这一过程。本文提出了一种利用遗传算法来搜索优化的标记集的新方法。这种方法可以在一个候选标记集集合中自动搜索一个最优或较优的标记集 ,并可根据应用的需求调整参数以适应特定任务的需求。实验表明 :遗传算法为标记集的选择提供了一种系统的有效的辅助手段
引用
收藏
页码:19 / 27
页数:9
相关论文
共 1 条
[1]  
计算机时代的汉语和汉字研究.[M].罗振声;袁毓林主编;.清华大学出版社.1996,