基于统计信息的未登录词的扩展识别方法

被引:55
作者
韩艳
林煜熙
姚建民
机构
[1] 苏州大学江苏省计算机信息处理重点实验室
关键词
计算机应用; 中文信息处理; 未登录词识别; 左右邻信息; 最频繁左邻比; 最频繁右邻比; 候选OOV扩展;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
该文提出一种基于网络资源的未登录词的扩展识别方法。该方法以左右邻信息判断未登录词边界为基础对已识别出的二元候选未登录词种子进行扩展,从而得到不限长度的语义更完整的未登录词。实验证明该文方法可行有效。
引用
收藏
页码:24 / 30+50 +50
页数:8
相关论文
共 13 条
[1]
基于字单元分析的中文辅助阅读系统 [J].
方高林 ;
于浩 ;
孟遥 ;
邹纲 .
中文信息学报, 2008, (02) :92-98
[2]
针对特定领域的新词发现和新技术发现 [J].
王文荣 ;
乔晓东 ;
朱礼军 .
现代图书情报技术, 2008, (02) :35-40
[3]
一种基于大规模语料的新词识别方法 [J].
贺敏 ;
龚才春 ;
张华平 ;
程学旗 .
计算机工程与应用 , 2007, (21) :157-159
[4]
基于统计和规则的未登录词识别方法研究 [J].
周蕾 ;
朱巧明 .
计算机工程, 2007, (08) :196-198
[5]
基于数据挖掘的新词发现 [J].
王立希 ;
王建东 ;
汪静 .
计算机应用研究, 2006, (12) :195-197
[6]
一种快速获取领域新词语的新方法 [J].
刘华 .
中文信息学报, 2006, (05) :17-23
[7]
基于概率统计技术和规则方法的新词发现 [J].
贾自艳 ;
史忠植 .
计算机工程, 2004, (20) :19-21+83
[8]
基于语料库和网络的新词自动识别 [J].
刘建舟 ;
何婷婷 ;
骆昌日 .
计算机应用, 2004, (07) :132-134
[9]
基于构词法的网络新词自动识别初探 [J].
郑家恒 ;
李文花 .
山西大学学报(自然科学版), 2002, (02) :115-119
[10]
汉语自动分词研究评述 [J].
孙茂松 ;
邹嘉彦 .
当代语言学, 2001, (01) :22-32+77