学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
自组织中文语义映射网络的优化特征编码方法
被引:2
作者
:
张敏
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室
张敏
马青
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室
马青
马少平
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室
马少平
机构
:
[1]
清华大学计算机科学与技术系智能技术与系统国家重点实验室
[2]
Communications Research Laboratory
来源
:
中文信息学报
|
2003年
/ 03期
关键词
:
计算机应用;
中文信息处理;
中文语义映射;
自组织映射;
特征编码;
相似度计算;
Kohonen网络;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
本文介绍自组织中文语义映射网络 ,并分别基于集合论、代数理论和概率论研究和提出六种不同的特征编码方法 ,这对自组织语义映射效果有很重要的影响。通过性能评价得出如下结论 :使用TFIDF修正的频率密度编码能得到最佳效果 ,其语义映射的精确度和召回率分别为 94 .4 %和 90 .7% ,而基于向量模型的方法则都不适用于中文自组织语义映射。文中给出结果分析。另外比较实验结果表明文中的最好方法其系统性能好于目前广泛采用的分层聚类技术 ,并远好于多元统计分析技术 ,例如主成分分析的特征降维编码。
引用
收藏
页码:27 / 33
页数:7
相关论文
未找到相关数据
未找到相关数据