VSM中用语片为特征项计算文本相似度

被引:2
作者
潘国清
机构
[1] 东南大学计算机科学与工程学院
关键词
空间向量模型; 相关度; 骨架语片; 互信息; 相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
定义了骨架语片的概念。用互信息量作为衡量两个词语间相关程度的参考值,借助依存关系、基本语法将满足相关度阈值的两个词组合成骨架语片。用骨架语片做特征项,用空间向量模型表示文本语义,用语片的出现频度做语片权重,用余弦法计算文本间语义相似度。应用于试卷主观题自动评分,实验证实这种方法结果具有令人满意的正确度。
引用
收藏
页码:24 / 25+34+186 +34
页数:5
相关论文
共 3 条
[1]   语句相似度计算在主观题自动批改技术中的初步应用 [J].
高思丹 ;
袁春风 ;
不详 .
计算机工程与应用 , 2004, (14) :132-135
[2]   基于最大熵模型的组块分析 [J].
李素建 ;
刘群 ;
杨志峰 .
计算机学报, 2003, (12) :1722-1727
[3]  
朱德熙文集[M]. 商务印书馆 , [朱德熙著], 1999