学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种有效解决汉语歧义切分的方法
被引:9
作者
:
朱鉴
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院合肥智能机械研究所
朱鉴
张建
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院合肥智能机械研究所
张建
李淼
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院合肥智能机械研究所
李淼
机构
:
[1]
中国科学院合肥智能机械研究所
来源
:
计算机工程与应用
|
2007年
/ 11期
关键词
:
有向图;
统计模型;
规则库;
歧义字段;
汉字切分;
D O I
:
暂无
中图分类号
:
TP391.4 [模式识别与装置];
学科分类号
:
081102
[检测技术与自动化装置]
;
摘要
:
提出了一种通过有向图和统计加规则的多层过滤方法来有效解决汉语分词过程中的交集型歧义切分问题,该方法大大提高了切分的正确率。经过65000字的开放语料测试,统计了其对交集型歧义字段的切分结果,发现该方法对交集型歧义字段的切分正确率为98.43%,以上数据表明该方法在解决汉语交集型歧义字段的问题时是行之有效的。
引用
收藏
页码:175 / 177
页数:3
相关论文
共 1 条
[1]
基于N-最短路径方法的中文词语粗分模型
[J].
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
张华平
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
刘群
.
中文信息学报,
2002,
(05)
:1
-7
←
1
→
共 1 条
[1]
基于N-最短路径方法的中文词语粗分模型
[J].
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
张华平
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
刘群
.
中文信息学报,
2002,
(05)
:1
-7
←
1
→