学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于词内部结合度和边界自由度的新词发现
被引:79
作者
:
论文数:
引用数:
h-index:
机构:
李文坤
论文数:
引用数:
h-index:
机构:
张仰森
论文数:
引用数:
h-index:
机构:
陈若愚
机构
:
[1]
北京信息科技大学智能信息处理研究所
来源
:
计算机应用研究
|
2015年
/ 32卷
/ 08期
关键词
:
新词发现;
内部结合度;
边界自由度;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
新词发现作为自然语言处理领域的一项基础研究,一直受到学术界和企业界的广泛关注。将新词发现问题转换为确定词语边界问题。首先对语料进行中文分词,然后统计"散串",最后提出一种基于词内部结合度和边界自由度的新词发现方法。通过在大规模语料上进行新词发现实验,验证了该方法的有效性。今后的研究重点将放在如何有效地识别低频新词上,以提高系统的整体性能。
引用
收藏
页码:2302 / 2304+2342 +2342
页数:4
相关论文
共 9 条
[1]
基于条件随机场方法的开放领域新词发现
[J].
论文数:
引用数:
h-index:
机构:
陈飞
;
论文数:
引用数:
h-index:
机构:
刘奕群
;
论文数:
引用数:
h-index:
机构:
魏超
;
张云亮
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
智能技术与系统国家重点实验室(清华大学)
张云亮
;
论文数:
引用数:
h-index:
机构:
张敏
;
论文数:
引用数:
h-index:
机构:
马少平
.
软件学报,
2013,
24
(05)
:1051
-1060
[2]
博客语料的新词发现方法
[J].
论文数:
引用数:
h-index:
机构:
黄轩
;
李熔烽
论文数:
0
引用数:
0
h-index:
0
机构:
漳州职业技术学院经济管理系
厦门大学智能科学与技术系
李熔烽
.
现代电子技术,
2013,
36
(02)
:144
-146+149
[3]
基于SVM和词间特征的新词识别研究
[J].
论文数:
引用数:
h-index:
机构:
徐远方
;
论文数:
引用数:
h-index:
机构:
李成城
.
计算机技术与发展,
2012,
22
(05)
:134
-136+140
[4]
基于二元背景模型的新词发现
[J].
论文数:
引用数:
h-index:
机构:
吴悦
;
燕鹏举
论文数:
0
引用数:
0
h-index:
0
机构:
盛大语音创新院
复旦大学数学科学学院
燕鹏举
;
翟鲁峰
论文数:
0
引用数:
0
h-index:
0
机构:
盛大语音创新院
复旦大学数学科学学院
翟鲁峰
.
清华大学学报(自然科学版),
2011,
51
(09)
:1317
-1320
[5]
基于词内部模式的新词识别
[J].
论文数:
引用数:
h-index:
机构:
林自芳
;
论文数:
引用数:
h-index:
机构:
蒋秀凤
.
计算机与现代化,
2010,
(11)
:162
-164+167
[6]
词激活力模型在中文词发现中的应用研究
[D].
论文数:
引用数:
h-index:
机构:
张永田
.
北京邮电大学,
2013
[7]
针对特定领域的中文新词发现技术研究
[D].
论文数:
引用数:
h-index:
机构:
李明
.
南京航空航天大学,
2012
[8]
面向WI输入法的新词发现技术研究与实现
[D].
论文数:
引用数:
h-index:
机构:
周春波
.
哈尔滨工业大学,
2011
[9]
中文新词检测与分析
[D].
崔世起
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院(计算技术研究所)
中国科学院研究生院(计算技术研究所)
崔世起
.
中国科学院研究生院(计算技术研究所),
2006
←
1
→
共 9 条
[1]
基于条件随机场方法的开放领域新词发现
[J].
论文数:
引用数:
h-index:
机构:
陈飞
;
论文数:
引用数:
h-index:
机构:
刘奕群
;
论文数:
引用数:
h-index:
机构:
魏超
;
张云亮
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
智能技术与系统国家重点实验室(清华大学)
张云亮
;
论文数:
引用数:
h-index:
机构:
张敏
;
论文数:
引用数:
h-index:
机构:
马少平
.
软件学报,
2013,
24
(05)
:1051
-1060
[2]
博客语料的新词发现方法
[J].
论文数:
引用数:
h-index:
机构:
黄轩
;
李熔烽
论文数:
0
引用数:
0
h-index:
0
机构:
漳州职业技术学院经济管理系
厦门大学智能科学与技术系
李熔烽
.
现代电子技术,
2013,
36
(02)
:144
-146+149
[3]
基于SVM和词间特征的新词识别研究
[J].
论文数:
引用数:
h-index:
机构:
徐远方
;
论文数:
引用数:
h-index:
机构:
李成城
.
计算机技术与发展,
2012,
22
(05)
:134
-136+140
[4]
基于二元背景模型的新词发现
[J].
论文数:
引用数:
h-index:
机构:
吴悦
;
燕鹏举
论文数:
0
引用数:
0
h-index:
0
机构:
盛大语音创新院
复旦大学数学科学学院
燕鹏举
;
翟鲁峰
论文数:
0
引用数:
0
h-index:
0
机构:
盛大语音创新院
复旦大学数学科学学院
翟鲁峰
.
清华大学学报(自然科学版),
2011,
51
(09)
:1317
-1320
[5]
基于词内部模式的新词识别
[J].
论文数:
引用数:
h-index:
机构:
林自芳
;
论文数:
引用数:
h-index:
机构:
蒋秀凤
.
计算机与现代化,
2010,
(11)
:162
-164+167
[6]
词激活力模型在中文词发现中的应用研究
[D].
论文数:
引用数:
h-index:
机构:
张永田
.
北京邮电大学,
2013
[7]
针对特定领域的中文新词发现技术研究
[D].
论文数:
引用数:
h-index:
机构:
李明
.
南京航空航天大学,
2012
[8]
面向WI输入法的新词发现技术研究与实现
[D].
论文数:
引用数:
h-index:
机构:
周春波
.
哈尔滨工业大学,
2011
[9]
中文新词检测与分析
[D].
崔世起
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院(计算技术研究所)
中国科学院研究生院(计算技术研究所)
崔世起
.
中国科学院研究生院(计算技术研究所),
2006
←
1
→