基于词内部模式的新词识别

被引:17
作者
林自芳
蒋秀凤
机构
[1] 福州大学数学与计算机科学学院
关键词
词内部模式; 新词语识别; 改进位置成词概率; 首尾单字成词概率;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出一种基于词内部模式的新词识别算法,该算法在重复串查找的基础上,结合词内部模式的特征提出改进位置成词概率和首尾单字成词概率的加权,依次判断互信息、邻接类别等统计量,对新词进行识别。通过不同的实验对比发现,该算法在一定程度上能有效提取新词。
引用
收藏
页码:162 / 164+167 +167
页数:4
相关论文
共 5 条
[1]   一种基于大规模语料的新词识别方法 [J].
贺敏 ;
龚才春 ;
张华平 ;
程学旗 .
计算机工程与应用, 2007, (21) :157-159
[2]   基于构词法的网络新词自动识别初探 [J].
郑家恒 ;
李文花 .
山西大学学报(自然科学版), 2002, (02) :115-119
[3]  
短文本语言计算的关键技术研究[D]. 龚才春.中国科学院研究生院(计算技术研究所). 2008
[4]  
基于频繁模式的消息文本聚类研究[D]. 胡吉祥.中国科学院研究生院(计算技术研究所). 2006
[5]  
中文新词检测与分析[D]. 崔世起.中国科学院研究生院(计算技术研究所). 2006