中草药问答系统的设计与实现

被引:0
作者
申晨
机构
[1] 浙江大学
关键词
交互式问答系统; 众包; 标签; 中草药问答系统;
D O I
暂无
年度学位
2014
学位类型
硕士
导师
摘要
随着互联网的迅速发展和Web2.0概念的普及,人们获得信息和知识的交流途径越来越多样化,基于网络的用户交互式问答系统便是其中之一。用户交互式问答系统最大的优点就是提供一个自由的空间,集大众智慧快速地直接解答问题。人们可以自由地在网上进行提问和回答,在一问一答的过程中,知识得以积累和升华。这一过程就是近年来研究热点“众包”思想的具体体现。用户交互式问答系统中问题的回答内容是用户的经验知识与专业知识的反映,是非常宝贵的知识源泉。如何激励用户参与给出质量较高的答案,如何分析挖掘、组织利用问答数据中蕴含的“知识”提供更多的服务,则成为开发用户交互式问答系统新的制高点。 本论文以实际工程项目作为研究背景,开发了一个中草药问答系统。论文主要工作包括:1)为了有效利用问答数据,提升系统的智能程度和分析挖掘的深度,重点研究关键字抽取方法、单词相似度计算方法以及聚类算法,并调研了众包技术;2)针对项目的实际需求,进行系统分析,提出了系统总体架构;3)重点给出系统中数据分析挖掘技术所应用的核心模块,包括预处理、标签自动生成、问题归纳和知识网络等模块的详细设计方案与核心算法,特别是提出基于TextRank的问题标签生成算法和基于聚类分析的用户标签生成算法。4)最后,完成整个系统的实现,并上线运行。
引用
收藏
页数:75
共 5 条
[1]
试析中医术语的特点及德译技巧 [J].
黄玉云 .
湖北中医杂志, 2005, (10) :53-54
[2]
The anatomy of a large-scale hypertextual Web search engine.[J].Sergey Brin;Lawrence Page.Computer Networks and ISDN Systems.1998, 1
[3]
An introduction to latent semantic analysis [J].
Landauer, TK ;
Foltz, PW ;
Laham, D .
DISCOURSE PROCESSES, 1998, 25 (2-3) :259-284
[4]
Error bounds for convolutional codes and an asymptotically optimum decoding algorithm..Viterbi; A;.Information Theory; IEEE Transactions on.1967, 02
[5]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,