学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
中文分词中歧义切分处理策略
被引:46
作者
:
论文数:
引用数:
h-index:
机构:
郑家恒
张剑锋
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机与信息技术学院计算智能与中文信息处理省部共建教育部重点实验室
张剑锋
论文数:
引用数:
h-index:
机构:
谭红叶
机构
:
[1]
山西大学计算机与信息技术学院计算智能与中文信息处理省部共建教育部重点实验室
来源
:
山西大学学报(自然科学版)
|
2007年
/ 02期
关键词
:
自动分词;
伪歧义;
真歧义;
概率模型;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
文章试图从歧义字段本身的特点,即从伪歧义与真歧义这两个角度,以规则库为辅助手段,构建相应概率统计模型来解决歧义字段切分的问题.概率模型中特征的选取考虑了相邻词语和相邻词语的语义信息.实验表明该模型在解决歧义切分问题上是有效的.
引用
收藏
页码:163 / 167
页数:5
相关论文
共 4 条
[1]
现代汉语通用分词系统中歧义切分的实用技术
[J].
论文数:
引用数:
h-index:
机构:
罗智勇
;
论文数:
引用数:
h-index:
机构:
宋柔
.
计算机研究与发展,
2006,
(06)
:1122
-1128
[2]
基于汉语二字应成词的歧义字段切分方法
[J].
论文数:
引用数:
h-index:
机构:
郑德权
;
于凤
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院,哈尔滨商业大学计算中心,哈尔滨工业大学计算机科学与技术学院哈尔滨,哈尔滨,哈尔滨
于凤
;
王开涛
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院,哈尔滨商业大学计算中心,哈尔滨工业大学计算机科学与技术学院哈尔滨,哈尔滨,哈尔滨
王开涛
;
论文数:
引用数:
h-index:
机构:
赵铁军
.
计算机工程与应用,
2003,
(01)
:17
-18+26
[3]
利用上下文信息解决汉语自动分词中的组合型歧义
[J].
肖云
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室,清华大学智能技术与系统国家重点实验室,香港城市大学语言资讯科学研究中心北京,北京
肖云
;
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室,清华大学智能技术与系统国家重点实验室,香港城市大学语言资讯科学研究中心北京,北京
邹嘉彦
.
计算机工程与应用,
2001,
(19)
:87
-89+106
[4]
高频最大交集型歧义切分字段在汉语自动分词中的作用
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
论文数:
引用数:
h-index:
机构:
左正平
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室,香港城市大学语言资讯科学研究中心
邹嘉彦
.
中文信息学报,
1999,
(01)
←
1
→
共 4 条
[1]
现代汉语通用分词系统中歧义切分的实用技术
[J].
论文数:
引用数:
h-index:
机构:
罗智勇
;
论文数:
引用数:
h-index:
机构:
宋柔
.
计算机研究与发展,
2006,
(06)
:1122
-1128
[2]
基于汉语二字应成词的歧义字段切分方法
[J].
论文数:
引用数:
h-index:
机构:
郑德权
;
于凤
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院,哈尔滨商业大学计算中心,哈尔滨工业大学计算机科学与技术学院哈尔滨,哈尔滨,哈尔滨
于凤
;
王开涛
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院,哈尔滨商业大学计算中心,哈尔滨工业大学计算机科学与技术学院哈尔滨,哈尔滨,哈尔滨
王开涛
;
论文数:
引用数:
h-index:
机构:
赵铁军
.
计算机工程与应用,
2003,
(01)
:17
-18+26
[3]
利用上下文信息解决汉语自动分词中的组合型歧义
[J].
肖云
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室,清华大学智能技术与系统国家重点实验室,香港城市大学语言资讯科学研究中心北京,北京
肖云
;
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室,清华大学智能技术与系统国家重点实验室,香港城市大学语言资讯科学研究中心北京,北京
邹嘉彦
.
计算机工程与应用,
2001,
(19)
:87
-89+106
[4]
高频最大交集型歧义切分字段在汉语自动分词中的作用
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
论文数:
引用数:
h-index:
机构:
左正平
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室,香港城市大学语言资讯科学研究中心
邹嘉彦
.
中文信息学报,
1999,
(01)
←
1
→