一种基于免疫遗传算法的网络新词识别方法

被引:11
作者
丁建立 [1 ,2 ]
慈祥 [1 ,2 ]
黄剑雄 [3 ]
机构
[1] 中国民航大学计算机科学与技术学院
[2] 中国民航信息技术科研基地
[3] 中国国际航空股份有限公司信息管理部
关键词
免疫遗传算法; 汉语词群; 词位; 抗体; 网络新词识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
随着互联网的发展,网络新词不断涌现,但是目前的分词方法很难及时、准确地对其做出识别。对此提出一种应用免疫遗传算法的网络新词识别方法。在分析网络新词特点的基础上,利用汉语词群现象和词位的概念提取出示范抗体,在遗传算法进行的过程中有针对性地注入该抗体。实验表明,该方法对于分词碎片中符合词群现象的新词有着极高的识别率,对于一般网络新词的识别率也基本令人满意。
引用
收藏
页码:240 / 245
页数:6
相关论文
共 6 条
[1]   基于遗传算法的汉语未登录词识别 [J].
闫蓉 ;
张蕾 .
计算机应用与软件, 2008, (07) :88-90
[2]   基于大规模语料库的新词检测 [J].
崔世起 ;
刘群 ;
孟遥 ;
于浩 ;
西野文人 .
计算机研究与发展 , 2006, (05) :927-932
[3]   面向Internet的中文新词语检测 [J].
邹纲 ;
刘洋 ;
刘群 ;
孟遥 ;
于浩 ;
西野文人 ;
亢世勇 .
中文信息学报, 2004, (06) :1-9
[4]   基于WWW的未登录词识别研究 [J].
韩洁 ;
周勇 ;
刘少辉 ;
史忠植 .
计算机科学, 2002, (12) :155-156
[5]   基于构词法的网络新词自动识别初探 [J].
郑家恒 ;
李文花 .
山西大学学报(自然科学版), 2002, (02) :115-119
[6]  
汉语新词语词群现象研究.[D].刘吉艳.上海外国语大学.2008, 04