学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于上下文相关的最大概率汉语自动分词算法
被引:7
作者
:
金瑜
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学理学院
金瑜
陆启明
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学理学院
陆启明
高峰
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学理学院
高峰
机构
:
[1]
合肥工业大学理学院
[2]
中国科学技术大学近代物理系
[3]
合肥工业大学理学院 合肥
[4]
合肥
[5]
合肥
来源
:
计算机工程
|
2004年
/ 16期
关键词
:
上下文相关;
汉语自动分词;
分词统计模型;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
提出了一种新的汉语自动分词算法,其主要思想是通过前后两次对文章的扫描来解决分词过程中出现的交叉歧义问题,介绍了一种新的有效的字段切分算法,它能够排除类似穷举算法中冗余的单字词的切分可能。
引用
收藏
页码:146 / 148
页数:3
相关论文
共 8 条
[1]
基于PATRICIA tree的汉语自动分词词典机制
[J].
杨文峰
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系!北京
杨文峰
;
论文数:
引用数:
h-index:
机构:
陈光英
;
李星
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系!北京
李星
.
中文信息学报,
2001,
(03)
:44
-49
[2]
基于歧义二叉树的汉语分词方法
[J].
陈其晖
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机系人工智能实验室!上海,200092
陈其晖
;
应志伟
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机系人工智能实验室!上海,200092
应志伟
;
柴佩琪
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机系人工智能实验室!上海,200092
柴佩琪
.
计算机辅助工程,
1999,
(04)
:12
-17
[3]
最大概率分词问题及其解法
[J].
论文数:
引用数:
h-index:
机构:
刘挺
;
吴岩
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!
吴岩
;
王开铸
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!
王开铸
.
哈尔滨工业大学学报,
1998,
(06)
:37
-41
[4]
基于两字词簇的汉语快速自动分词算法
[J].
郭祥昊
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室
郭祥昊
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室
钟义信
;
杨丽
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室
杨丽
.
情报学报,
1998,
(05)
:34
-39
[5]
汉语自动分词研究综述
[J].
骆正清
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学计算与信息中心
骆正清
;
论文数:
引用数:
h-index:
机构:
陈增武
;
论文数:
引用数:
h-index:
机构:
王泽兵
;
胡上序
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学计算与信息中心
胡上序
.
浙江大学学报(自然科学版),
1997,
(03)
:31
-37
[6]
汉语自动分词研究中的苦干理论问题
[J].
孙茂松,邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系,香港城市大学
孙茂松,邹嘉彦
.
语言文字应用,
1995,
(04)
:40
-46
[7]
汉语文献自动分词存在的问题及趋向
[J].
王玮,刘丹
论文数:
0
引用数:
0
h-index:
0
机构:
中山大学
王玮,刘丹
.
情报理论与实践,
1994,
(06)
:28
-30
[8]
数据结构[M]. 清华大学出版社 , 严蔚敏, 1987
←
1
→
共 8 条
[1]
基于PATRICIA tree的汉语自动分词词典机制
[J].
杨文峰
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系!北京
杨文峰
;
论文数:
引用数:
h-index:
机构:
陈光英
;
李星
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系!北京
李星
.
中文信息学报,
2001,
(03)
:44
-49
[2]
基于歧义二叉树的汉语分词方法
[J].
陈其晖
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机系人工智能实验室!上海,200092
陈其晖
;
应志伟
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机系人工智能实验室!上海,200092
应志伟
;
柴佩琪
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机系人工智能实验室!上海,200092
柴佩琪
.
计算机辅助工程,
1999,
(04)
:12
-17
[3]
最大概率分词问题及其解法
[J].
论文数:
引用数:
h-index:
机构:
刘挺
;
吴岩
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!
吴岩
;
王开铸
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!
王开铸
.
哈尔滨工业大学学报,
1998,
(06)
:37
-41
[4]
基于两字词簇的汉语快速自动分词算法
[J].
郭祥昊
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室
郭祥昊
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室
钟义信
;
杨丽
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室
杨丽
.
情报学报,
1998,
(05)
:34
-39
[5]
汉语自动分词研究综述
[J].
骆正清
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学计算与信息中心
骆正清
;
论文数:
引用数:
h-index:
机构:
陈增武
;
论文数:
引用数:
h-index:
机构:
王泽兵
;
胡上序
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学计算与信息中心
胡上序
.
浙江大学学报(自然科学版),
1997,
(03)
:31
-37
[6]
汉语自动分词研究中的苦干理论问题
[J].
孙茂松,邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系,香港城市大学
孙茂松,邹嘉彦
.
语言文字应用,
1995,
(04)
:40
-46
[7]
汉语文献自动分词存在的问题及趋向
[J].
王玮,刘丹
论文数:
0
引用数:
0
h-index:
0
机构:
中山大学
王玮,刘丹
.
情报理论与实践,
1994,
(06)
:28
-30
[8]
数据结构[M]. 清华大学出版社 , 严蔚敏, 1987
←
1
→