自组织中文语义映射网络的优化特征编码方法

被引:2
作者
张敏
马青
马少平
机构
[1] 清华大学计算机科学与技术系智能技术与系统国家重点实验室
[2] Communications Research Laboratory
关键词
计算机应用; 中文信息处理; 中文语义映射; 自组织映射; 特征编码; 相似度计算; Kohonen网络;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文介绍自组织中文语义映射网络 ,并分别基于集合论、代数理论和概率论研究和提出六种不同的特征编码方法 ,这对自组织语义映射效果有很重要的影响。通过性能评价得出如下结论 :使用TFIDF修正的频率密度编码能得到最佳效果 ,其语义映射的精确度和召回率分别为 94 .4 %和 90 .7% ,而基于向量模型的方法则都不适用于中文自组织语义映射。文中给出结果分析。另外比较实验结果表明文中的最好方法其系统性能好于目前广泛采用的分层聚类技术 ,并远好于多元统计分析技术 ,例如主成分分析的特征降维编码。
引用
收藏
页码:27 / 33
页数:7
相关论文
empty
未找到相关数据