学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
交集型歧义字段切分方法研究
被引:22
作者
:
闫引堂
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学!太原
闫引堂
周晓强
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学!太原
周晓强
机构
:
[1]
山西大学!太原
来源
:
情报学报
|
2000年
/ 06期
关键词
:
汉语;
自动分词;
汉字切分;
交集型;
歧义;
独立成词能力频次;
D O I
:
暂无
中图分类号
:
G254 [文献标引与编目];
学科分类号
:
摘要
:
本文通过动态建立独立成词能力频次库的方法以及基于词语 /词性搭配的规则库 ,对交集型歧义字段进行处理 ,大大提高了切分正确率。在 4万语料的开放测试中 ,交集型歧义字段的切分正确率可达 98%以上。
引用
收藏
页码:637 / 643
页数:7
相关论文
共 2 条
[1]
高频最大交集型歧义切分字段在汉语自动分词中的作用
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室
孙茂松
左正平
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室
左正平
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室
邹嘉彦
[J].
中文信息学报,
1999,
(01)
: 28
-
35
[2]
中文文本自动分词和标注[M]. - 商务印书馆 , 刘开瑛著, 2000
←
1
→
共 2 条
[1]
高频最大交集型歧义切分字段在汉语自动分词中的作用
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室
孙茂松
左正平
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室
左正平
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学智能技术与系统国家重点实验室
邹嘉彦
[J].
中文信息学报,
1999,
(01)
: 28
-
35
[2]
中文文本自动分词和标注[M]. - 商务印书馆 , 刘开瑛著, 2000
←
1
→