学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种引入动态词库更新的中文分词架构
被引:6
作者
:
论文数:
引用数:
h-index:
机构:
刘芳芳
论文数:
引用数:
h-index:
机构:
王晶
论文数:
引用数:
h-index:
机构:
沈奇威
机构
:
[1]
北京邮电大学 网络与交换技术国家重点实验室
[2]
东信北邮信息技术有限公司
来源
:
计算机系统应用
|
2013年
/ 22卷
/ 03期
关键词
:
中文分词;
最大词长;
歧义处理;
互信息;
未登录词;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
针对互联网环境下新词出现和更新频率高的特点,将机械分词与基于规则分词相结合,提出一种动态更新词库的中文分词架构.本架构给出了新的词典设计结构及歧义处理规则,并将统计学中的互信息概念运用到新词判定环节.实验表明本文提出的中文分词架构具有较高的准确率和良好的适应性.
引用
收藏
页码:100 / 103+50 +50
页数:5
相关论文
共 8 条
[1]
分词技术在信息处理中的研究综述
[J].
梁晓弘
论文数:
0
引用数:
0
h-index:
0
机构:
徐州建筑职业技术学院电子信息工程系
梁晓弘
;
论文数:
引用数:
h-index:
机构:
杨文安
.
电脑知识与技术(学术交流),
2007,
(22)
:1100
-1102+1117
[2]
汉语自动分词的研究现状与困难
[J].
论文数:
引用数:
h-index:
机构:
张春霞
;
郝天永
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所北京中国科学院研究生院,北京,北京
郝天永
.
系统仿真学报,
2005,
(01)
:138
-143+147
[3]
汉语自动分词研究展望
[J].
文庭孝
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学中国科学评价研究中心,武汉大学中国科学评价研究中心,武汉大学中国科学评价研究中心武汉,武汉,武汉
文庭孝
;
论文数:
引用数:
h-index:
机构:
邱均平
;
论文数:
引用数:
h-index:
机构:
侯经川
.
现代图书情报技术,
2004,
(07)
:6
-10
[4]
分词中的歧义处理
[J].
谭琼
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学管理学院
谭琼
;
论文数:
引用数:
h-index:
机构:
史忠植
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学管理学院
不详
.
计算机工程与应用 ,
2002,
(11)
:125
-127+236
[5]
一种改进的MM分词方法的算法设计
[J].
论文数:
引用数:
h-index:
机构:
骆正清
;
论文数:
引用数:
h-index:
机构:
陈增武
;
论文数:
引用数:
h-index:
机构:
胡上序
.
中文信息学报,
1996,
(03)
:30
-36
[6]
书面汉语自动分词专家系统设计原理
[J].
何克抗
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学现代教育技术研究所
何克抗
;
论文数:
引用数:
h-index:
机构:
徐辉
;
论文数:
引用数:
h-index:
机构:
孙波
.
中文信息学报,
1991,
(02)
:1
-14+28
[7]
汉语计算机自动分词知识
[J].
论文数:
引用数:
h-index:
机构:
梁南元
.
中文信息学报,
1990,
(02)
:29
-33
[8]
基于规则的汉语自动分词系统
[J].
姚天顺
论文数:
0
引用数:
0
h-index:
0
机构:
东北工学院
姚天顺
;
张桂平
论文数:
0
引用数:
0
h-index:
0
机构:
东北工学院
张桂平
;
吴映明
论文数:
0
引用数:
0
h-index:
0
机构:
东北工学院
吴映明
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
东北工学院
不详
.
中文信息学报 ,
1990,
(01)
:37
-43
←
1
→
共 8 条
[1]
分词技术在信息处理中的研究综述
[J].
梁晓弘
论文数:
0
引用数:
0
h-index:
0
机构:
徐州建筑职业技术学院电子信息工程系
梁晓弘
;
论文数:
引用数:
h-index:
机构:
杨文安
.
电脑知识与技术(学术交流),
2007,
(22)
:1100
-1102+1117
[2]
汉语自动分词的研究现状与困难
[J].
论文数:
引用数:
h-index:
机构:
张春霞
;
郝天永
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所,中国科学院计算技术研究所北京中国科学院研究生院,北京,北京
郝天永
.
系统仿真学报,
2005,
(01)
:138
-143+147
[3]
汉语自动分词研究展望
[J].
文庭孝
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学中国科学评价研究中心,武汉大学中国科学评价研究中心,武汉大学中国科学评价研究中心武汉,武汉,武汉
文庭孝
;
论文数:
引用数:
h-index:
机构:
邱均平
;
论文数:
引用数:
h-index:
机构:
侯经川
.
现代图书情报技术,
2004,
(07)
:6
-10
[4]
分词中的歧义处理
[J].
谭琼
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学管理学院
谭琼
;
论文数:
引用数:
h-index:
机构:
史忠植
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学管理学院
不详
.
计算机工程与应用 ,
2002,
(11)
:125
-127+236
[5]
一种改进的MM分词方法的算法设计
[J].
论文数:
引用数:
h-index:
机构:
骆正清
;
论文数:
引用数:
h-index:
机构:
陈增武
;
论文数:
引用数:
h-index:
机构:
胡上序
.
中文信息学报,
1996,
(03)
:30
-36
[6]
书面汉语自动分词专家系统设计原理
[J].
何克抗
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学现代教育技术研究所
何克抗
;
论文数:
引用数:
h-index:
机构:
徐辉
;
论文数:
引用数:
h-index:
机构:
孙波
.
中文信息学报,
1991,
(02)
:1
-14+28
[7]
汉语计算机自动分词知识
[J].
论文数:
引用数:
h-index:
机构:
梁南元
.
中文信息学报,
1990,
(02)
:29
-33
[8]
基于规则的汉语自动分词系统
[J].
姚天顺
论文数:
0
引用数:
0
h-index:
0
机构:
东北工学院
姚天顺
;
张桂平
论文数:
0
引用数:
0
h-index:
0
机构:
东北工学院
张桂平
;
吴映明
论文数:
0
引用数:
0
h-index:
0
机构:
东北工学院
吴映明
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
东北工学院
不详
.
中文信息学报 ,
1990,
(01)
:37
-43
←
1
→