学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于统计信息的未登录词的扩展识别方法
被引:55
作者
:
韩艳
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学江苏省计算机信息处理重点实验室
韩艳
林煜熙
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学江苏省计算机信息处理重点实验室
林煜熙
论文数:
引用数:
h-index:
机构:
姚建民
机构
:
[1]
苏州大学江苏省计算机信息处理重点实验室
来源
:
中文信息学报
|
2009年
/ 03期
关键词
:
计算机应用;
中文信息处理;
未登录词识别;
左右邻信息;
最频繁左邻比;
最频繁右邻比;
候选OOV扩展;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
该文提出一种基于网络资源的未登录词的扩展识别方法。该方法以左右邻信息判断未登录词边界为基础对已识别出的二元候选未登录词种子进行扩展,从而得到不限长度的语义更完整的未登录词。实验证明该文方法可行有效。
引用
收藏
页码:24 / 30+50 +50
页数:8
相关论文
共 13 条
[1]
基于字单元分析的中文辅助阅读系统
[J].
方高林
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
方高林
;
于浩
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
于浩
;
孟遥
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
孟遥
;
邹纲
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
邹纲
.
中文信息学报,
2008,
(02)
:92
-98
[2]
针对特定领域的新词发现和新技术发现
[J].
王文荣
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术信息研究所
王文荣
;
论文数:
引用数:
h-index:
机构:
乔晓东
;
论文数:
引用数:
h-index:
机构:
朱礼军
.
现代图书情报技术,
2008,
(02)
:35
-40
[3]
一种基于大规模语料的新词识别方法
[J].
论文数:
引用数:
h-index:
机构:
贺敏
;
论文数:
引用数:
h-index:
机构:
龚才春
;
论文数:
引用数:
h-index:
机构:
张华平
;
论文数:
引用数:
h-index:
机构:
程学旗
.
计算机工程与应用 ,
2007,
(21)
:157
-159
[4]
基于统计和规则的未登录词识别方法研究
[J].
论文数:
引用数:
h-index:
机构:
周蕾
;
论文数:
引用数:
h-index:
机构:
朱巧明
.
计算机工程,
2007,
(08)
:196
-198
[5]
基于数据挖掘的新词发现
[J].
王立希
论文数:
0
引用数:
0
h-index:
0
机构:
南京航空航天大学
王立希
;
论文数:
引用数:
h-index:
机构:
王建东
;
汪静
论文数:
0
引用数:
0
h-index:
0
机构:
南京航空航天大学
汪静
.
计算机应用研究,
2006,
(12)
:195
-197
[6]
一种快速获取领域新词语的新方法
[J].
论文数:
引用数:
h-index:
机构:
刘华
.
中文信息学报,
2006,
(05)
:17
-23
[7]
基于概率统计技术和规则方法的新词发现
[J].
论文数:
引用数:
h-index:
机构:
贾自艳
;
论文数:
引用数:
h-index:
机构:
史忠植
.
计算机工程,
2004,
(20)
:19
-21+83
[8]
基于语料库和网络的新词自动识别
[J].
刘建舟
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系,华中师范大学计算机科学系,华中师范大学计算机科学系湖北武汉湖北工业大学信息工程学院,湖北武汉,湖北武汉,湖北武汉
刘建舟
;
论文数:
引用数:
h-index:
机构:
何婷婷
;
骆昌日
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系,华中师范大学计算机科学系,华中师范大学计算机科学系湖北武汉湖北工业大学信息工程学院,湖北武汉,湖北武汉,湖北武汉
骆昌日
.
计算机应用,
2004,
(07)
:132
-134
[9]
基于构词法的网络新词自动识别初探
[J].
郑家恒
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系
郑家恒
;
李文花
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系
李文花
.
山西大学学报(自然科学版),
2002,
(02)
:115
-119
[10]
汉语自动分词研究评述
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学,香港城市大学
邹嘉彦
.
当代语言学,
2001,
(01)
:22
-32+77
←
1
2
→
共 13 条
[1]
基于字单元分析的中文辅助阅读系统
[J].
方高林
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
方高林
;
于浩
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
于浩
;
孟遥
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
孟遥
;
邹纲
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
邹纲
.
中文信息学报,
2008,
(02)
:92
-98
[2]
针对特定领域的新词发现和新技术发现
[J].
王文荣
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术信息研究所
王文荣
;
论文数:
引用数:
h-index:
机构:
乔晓东
;
论文数:
引用数:
h-index:
机构:
朱礼军
.
现代图书情报技术,
2008,
(02)
:35
-40
[3]
一种基于大规模语料的新词识别方法
[J].
论文数:
引用数:
h-index:
机构:
贺敏
;
论文数:
引用数:
h-index:
机构:
龚才春
;
论文数:
引用数:
h-index:
机构:
张华平
;
论文数:
引用数:
h-index:
机构:
程学旗
.
计算机工程与应用 ,
2007,
(21)
:157
-159
[4]
基于统计和规则的未登录词识别方法研究
[J].
论文数:
引用数:
h-index:
机构:
周蕾
;
论文数:
引用数:
h-index:
机构:
朱巧明
.
计算机工程,
2007,
(08)
:196
-198
[5]
基于数据挖掘的新词发现
[J].
王立希
论文数:
0
引用数:
0
h-index:
0
机构:
南京航空航天大学
王立希
;
论文数:
引用数:
h-index:
机构:
王建东
;
汪静
论文数:
0
引用数:
0
h-index:
0
机构:
南京航空航天大学
汪静
.
计算机应用研究,
2006,
(12)
:195
-197
[6]
一种快速获取领域新词语的新方法
[J].
论文数:
引用数:
h-index:
机构:
刘华
.
中文信息学报,
2006,
(05)
:17
-23
[7]
基于概率统计技术和规则方法的新词发现
[J].
论文数:
引用数:
h-index:
机构:
贾自艳
;
论文数:
引用数:
h-index:
机构:
史忠植
.
计算机工程,
2004,
(20)
:19
-21+83
[8]
基于语料库和网络的新词自动识别
[J].
刘建舟
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系,华中师范大学计算机科学系,华中师范大学计算机科学系湖北武汉湖北工业大学信息工程学院,湖北武汉,湖北武汉,湖北武汉
刘建舟
;
论文数:
引用数:
h-index:
机构:
何婷婷
;
骆昌日
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系,华中师范大学计算机科学系,华中师范大学计算机科学系湖北武汉湖北工业大学信息工程学院,湖北武汉,湖北武汉,湖北武汉
骆昌日
.
计算机应用,
2004,
(07)
:132
-134
[9]
基于构词法的网络新词自动识别初探
[J].
郑家恒
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系
郑家恒
;
李文花
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系
李文花
.
山西大学学报(自然科学版),
2002,
(02)
:115
-119
[10]
汉语自动分词研究评述
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学,香港城市大学
邹嘉彦
.
当代语言学,
2001,
(01)
:22
-32+77
←
1
2
→