基于词内部结合度和边界自由度的新词发现

被引:79
作者
李文坤
张仰森
陈若愚
机构
[1] 北京信息科技大学智能信息处理研究所
关键词
新词发现; 内部结合度; 边界自由度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
新词发现作为自然语言处理领域的一项基础研究,一直受到学术界和企业界的广泛关注。将新词发现问题转换为确定词语边界问题。首先对语料进行中文分词,然后统计"散串",最后提出一种基于词内部结合度和边界自由度的新词发现方法。通过在大规模语料上进行新词发现实验,验证了该方法的有效性。今后的研究重点将放在如何有效地识别低频新词上,以提高系统的整体性能。
引用
收藏
页码:2302 / 2304+2342 +2342
页数:4
相关论文
共 9 条
[1]
基于条件随机场方法的开放领域新词发现 [J].
陈飞 ;
刘奕群 ;
魏超 ;
张云亮 ;
张敏 ;
马少平 .
软件学报, 2013, 24 (05) :1051-1060
[2]
博客语料的新词发现方法 [J].
黄轩 ;
李熔烽 .
现代电子技术, 2013, 36 (02) :144-146+149
[3]
基于SVM和词间特征的新词识别研究 [J].
徐远方 ;
李成城 .
计算机技术与发展, 2012, 22 (05) :134-136+140
[4]
基于二元背景模型的新词发现 [J].
吴悦 ;
燕鹏举 ;
翟鲁峰 .
清华大学学报(自然科学版), 2011, 51 (09) :1317-1320
[5]
基于词内部模式的新词识别 [J].
林自芳 ;
蒋秀凤 .
计算机与现代化, 2010, (11) :162-164+167
[6]
词激活力模型在中文词发现中的应用研究 [D]. 
张永田 .
北京邮电大学,
2013
[7]
针对特定领域的中文新词发现技术研究 [D]. 
李明 .
南京航空航天大学,
2012
[8]
面向WI输入法的新词发现技术研究与实现 [D]. 
周春波 .
哈尔滨工业大学,
2011
[9]
中文新词检测与分析 [D]. 
崔世起 .
中国科学院研究生院(计算技术研究所),
2006