基于限定领域的问句相似度

被引:0
作者
刘伟
机构
[1] 天津师范大学
关键词
问答系统; 问题集; 台球领域; 自动分词; 问句相似度计算;
D O I
暂无
年度学位
2008
学位类型
硕士
导师
摘要
问答系统为人们提供了自然语言的人机交互方式,相对于传统的关键词方式搜索引擎来说,其具有显著的优势。在受限领域,基于问题库的问答系统在对问题答案的定位上,有更准确,快捷和高效的特点,在日常生活的各个领域,有着非常重要的应用前景,是当前研究的热点问题。本文围绕台球领域自动问答系统实现过程中的领域知识库构建、问题库的的收集和组织、相似问句的查找及答案提取等关键核心技术进行了一系列的研究和探讨,实质性工作和取得的主要成就如下: 1、对现有的自动分词方法进行分析,并根据限定领域的特点,选择适当的分词算法并进行适当的设计。 2、对词语间的语义相关度的计算方法和中文的句法进行了比较详细的研究,对本系统的进一步发展打下了比较坚实的基础。 3、对中文语句的相似度计算进行了深入的研究,对比了现有比较成熟的问句相似度算法的优缺点,并针对限定领域的特点,提出了一种针对台球领域的问句相似度计算方法,并将它应用到面向台球领域的自动问答系统中。 4、设计并实现了面向台球领域的自动问答系统。构建了领域知识库和领域问题库,采用本文所提出的基于关键词的倒排索引的问句相似度计算方法,进行问句相似度的计算,实现系统的自动问答。面向台球领域的自动问答系统的测试结果表明了此方法可行,有比较好的实用效果。
引用
收藏
页数:70
共 15 条
[1]
计算语言学概论.[M].俞士汶主编;.商务印书馆.2003,
[2]
自然语言理解.[M].姚天顺等编著;.清华大学出版社.2002,
[3]
基于词类串的汉语句子结构相似度计算方法 [J].
王荣波 ;
池哲儒 .
中文信息学报, 2005, (01) :21-29
[4]
基于自然语言理解的自动应答系统 [J].
郭庆琳 ;
樊孝忠 .
计算机工程, 2004, (13) :11-12+20
[5]
基于网络的中文问答系统及信息抽取算法研究 [J].
崔桓 ;
蔡东风 ;
苗雪雷 .
中文信息学报, 2004, (03) :24-31
[6]
RDAQAS中问句相似度计算方法研究 [J].
余正涛 ;
高盛祥 ;
纪鹏程 .
昆明理工大学学报(理工版), 2004, (02) :40-44+71
[7]
基于语义依存的汉语句子相似度计算 [J].
李彬 ;
刘挺 ;
秦兵 ;
李生 .
计算机应用研究, 2003, (12) :15-17
[8]
基于常问问题集的中文问答系统研究 [J].
秦兵 ;
刘挺 ;
王洋 ;
郑实福 ;
李生 .
哈尔滨工业大学学报, 2003, (10) :1179-1182
[9]
自然语言句法分析研究现状和发展趋势 [J].
李向宏 ;
王丁 ;
黄成哲 ;
雷国华 .
微处理机, 2003, (02) :4-7+12
[10]
基于统计的无词典分词方法 [J].
傅赛香 ;
袁鼎荣 ;
黄柏雄 ;
钟智 .
广西科学院学报, 2002, (04) :252-255+264