基于HNC的汉语句子相似度算法的研究

被引:0
作者
史燕
机构
[1] 江苏大学
关键词
HNC; 词语相似度; 句子相似度; 主观题批阅;
D O I
暂无
年度学位
2009
学位类型
硕士
导师
摘要
本文在词语相似度计算的基础上重点研究了中文信息处理中的句子相似度。首先,比较了词语相似度计算的不同方法,实现了目前效果较好的基于HNC的词语相似度计算方法;其次,提出了基于HNC判断同义词和反义词的方法,简化了词语相似度计算,并用计算机实现;然后,在词语相似度计算的基础上,针对目前句子相似度计算方法中存在的没有考虑句子结构,词语在句子中出现的重要程度,词语在句子中所起的作用等方面的不足,提出了基于HNC语义块的句子相似度计算方法。最后,结合主观题自动批阅,给出了句子相似度计算方法的应用实例,应用实践表明本文所提出方法在逻辑错误判断,语义理解方面比目前现有的句子相似度的方法更接近人为判断结果,更易实现,操作更简单。具体来讲:本文在句子相似度计算的研究过程中,所做的主要工作及取得的主要成果如下: (1)比较分析了词语相似度计算的各种方法,实现了基于HNC的词语相似度计算方法,为下一步句子相似度的计算打下基础。 (2)提出了一种基于HNC同义词和反义词判别方法。通过词对出现的规则来判断是否是同义词反义词,由于引入了语义,简化了词语相似度的计算。 (3)在词语相似度的基础上,提出了基于HNC语义块的句子相似度计算方法。该方法充分考虑了语句中各个词语在语句中所处的位置以及所起的作用。 (4)把基于HNC语义块的句子相似度的计算方法用于成语解释的自动批阅中,通过老师人工批阅和计算机批阅的学生得分情况对比表明本文所提出的句子相似度计算方法的实用性和有效性。
引用
收藏
页数:68
共 29 条
[1]
自然语言处理中词相关性知识无导获取和均衡分类器构建 [D]. 
鲁松 .
中国科学院研究生院(计算技术研究所),
2001
[2]
汉英双语语料库自动对齐研究 [D]. 
王斌 .
中国科学院研究生院(计算技术研究所),
1999
[3]
Similarity-Based Models of Word Cooccurrence Probabilities.[J].Ido Dagan;Lillian Lee;Fernando C. N. Pereira.Machine Learning.1999, 1
[4]
基于语句相似度计算的主观题自动评分技术研究 [D]. 
南铉国 .
延边大学,
2007
[5]
基于《知网》的句子相似度计算的研究 [D]. 
张玉娟 .
中国地质大学(北京),
2006
[6]
基于HNC理论的主观题自动批改算法设计与系统实现 [D]. 
肖雪莲 .
华东师范大学,
2006
[7]
汉语句子相似度计算方法及其应用的研究 [D]. 
周舫 .
河南大学,
2005
[8]
智能搜索引擎中的同义词识别算法研究 [D]. 
朱毅华 .
南京农业大学,
2001
[9]
经济新闻自动标引系统的研究 [D]. 
查贵庭 .
南京农业大学,
2000
[10]
同义与反义现象的分解语义学阐释 [J].
曲家丹 .
辽宁行政学院学报, 2006, (05) :185-186