学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种基于多元信息库的自适应汉语歧义切分方法
被引:5
作者
:
论文数:
引用数:
h-index:
机构:
朱巧明
温滔
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学计算机科学与技术学院
温滔
李培蜂
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学计算机科学与技术学院
李培蜂
论文数:
引用数:
h-index:
机构:
钱培德
机构
:
[1]
苏州大学计算机科学与技术学院
来源
:
小型微型计算机系统
|
2006年
/ 08期
关键词
:
多元信息库;
歧义切分;
自适应;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
在分析目前分词方法的基础上提出了一种通过建立多元信息库、采用改进型的粗分算法以找出所有可能存在歧义的句子、借助于人工干预建立错误切分歧异词库等,实现汉语歧异切分的方法,通过修改、插入多元信息库中的信息量,进一步设计了一个具有自适应能力的歧义切分方法,并通过实验证明该方法能够有效改进汉语分词中错误歧义切分的结果.
引用
收藏
页码:1597 / 1600
页数:4
相关论文
共 9 条
[1]
一种快速汉语分词算法
[J].
温滔
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学计算机科学与技术学院,苏州大学计算机科学与技术学院,苏州大学计算机科学与技术学院苏州,苏州,苏州
温滔
;
论文数:
引用数:
h-index:
机构:
朱巧明
;
论文数:
引用数:
h-index:
机构:
吕强
.
计算机工程,
2004,
(19)
:119
-120+182
[2]
利用覆盖歧义检测法和统计语言模型进行汉语自动分词
[J].
论文数:
引用数:
h-index:
机构:
王显芳
;
论文数:
引用数:
h-index:
机构:
杜利民
.
电子与信息学报,
2003,
(09)
:1168
-1173
[3]
基于N-最短路径方法的中文词语粗分模型
[J].
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
张华平
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
刘群
.
中文信息学报,
2002,
(05)
:1
-7
[4]
汉语自动分词研究评述
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学,香港城市大学
邹嘉彦
.
当代语言学,
2001,
(01)
:22
-32+77
[5]
一种高效的中文电子词表数据结构
[J].
陈桂林
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海
陈桂林
;
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海
王永成
;
论文数:
引用数:
h-index:
机构:
韩客松
;
论文数:
引用数:
h-index:
机构:
王刚
.
计算机研究与发展,
2000,
(01)
:109
-116
[6]
高频最大交集型歧义切分字段在汉语自动分词中的作用
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
论文数:
引用数:
h-index:
机构:
左正平
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室,香港城市大学语言资讯科学研究中心
邹嘉彦
.
中文信息学报,
1999,
(01)
[7]
基于两字词簇的汉语快速自动分词算法
[J].
郭祥昊
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
郭祥昊
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
钟义信
;
杨丽
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
杨丽
.
情报学报,
1998,
(05)
[8]
一种改进的MM分词方法的算法设计
[J].
论文数:
引用数:
h-index:
机构:
骆正清
;
论文数:
引用数:
h-index:
机构:
陈增武
;
论文数:
引用数:
h-index:
机构:
胡上序
.
中文信息学报,
1996,
(03)
:30
-36
[9]
基于神经网络的分词方法
[J].
论文数:
引用数:
h-index:
机构:
徐秉铮
;
论文数:
引用数:
h-index:
机构:
詹剑
;
论文数:
引用数:
h-index:
机构:
贺前华
.
中文信息学报,
1993,
(02)
:36
-44
←
1
→
共 9 条
[1]
一种快速汉语分词算法
[J].
温滔
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学计算机科学与技术学院,苏州大学计算机科学与技术学院,苏州大学计算机科学与技术学院苏州,苏州,苏州
温滔
;
论文数:
引用数:
h-index:
机构:
朱巧明
;
论文数:
引用数:
h-index:
机构:
吕强
.
计算机工程,
2004,
(19)
:119
-120+182
[2]
利用覆盖歧义检测法和统计语言模型进行汉语自动分词
[J].
论文数:
引用数:
h-index:
机构:
王显芳
;
论文数:
引用数:
h-index:
机构:
杜利民
.
电子与信息学报,
2003,
(09)
:1168
-1173
[3]
基于N-最短路径方法的中文词语粗分模型
[J].
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
张华平
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
刘群
.
中文信息学报,
2002,
(05)
:1
-7
[4]
汉语自动分词研究评述
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学,香港城市大学
邹嘉彦
.
当代语言学,
2001,
(01)
:22
-32+77
[5]
一种高效的中文电子词表数据结构
[J].
陈桂林
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海
陈桂林
;
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海
王永成
;
论文数:
引用数:
h-index:
机构:
韩客松
;
论文数:
引用数:
h-index:
机构:
王刚
.
计算机研究与发展,
2000,
(01)
:109
-116
[6]
高频最大交集型歧义切分字段在汉语自动分词中的作用
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
论文数:
引用数:
h-index:
机构:
左正平
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室,香港城市大学语言资讯科学研究中心
邹嘉彦
.
中文信息学报,
1999,
(01)
[7]
基于两字词簇的汉语快速自动分词算法
[J].
郭祥昊
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
郭祥昊
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
钟义信
;
杨丽
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
杨丽
.
情报学报,
1998,
(05)
[8]
一种改进的MM分词方法的算法设计
[J].
论文数:
引用数:
h-index:
机构:
骆正清
;
论文数:
引用数:
h-index:
机构:
陈增武
;
论文数:
引用数:
h-index:
机构:
胡上序
.
中文信息学报,
1996,
(03)
:30
-36
[9]
基于神经网络的分词方法
[J].
论文数:
引用数:
h-index:
机构:
徐秉铮
;
论文数:
引用数:
h-index:
机构:
詹剑
;
论文数:
引用数:
h-index:
机构:
贺前华
.
中文信息学报,
1993,
(02)
:36
-44
←
1
→