基于语用信息的中文专利检索系统

被引:0
作者
武丽平
机构
[1] 北京邮电大学
关键词
语用信息; 信息抽取; 自然语言处理; 专利检索;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
专利信息是人类智慧的结晶,它几乎囊括了一切应用领域中的技术成果,涉及经济发展、科技创新和战略决策等最重要的信息资源。在当今国际市场竞争极为激烈的形势下,专利信息是各国发展经济不可或缺的重要资源。 本文将语用信息和专利信息检索相结合,在基于传统关键字检索的基础上给专利检索赋予语用含义,以提高检索的查准率和查全率。 本文主要工作包括如下几点: (1)根据国际专利分类法(IPC)分类规则,手动下载专利文献并构建了包含有语用信息的专利语料库,为后续的研究打好基础; (2)对语用信息进行大量研究之后,提出了专利语料中语用信息的概念以及抽取规则与抽取方法,将抽取出来的语用信息添加到专利语料库中用于专利检索以提高检索的查全率与查准率; (3)以上述技术为基础,以问答系统为平台,构建了一个基于语用信息的中文专利检索系统,实现了对专利信息的有效查询,通过对加入语用信息前后实验结果的对比,表明语用信息的加入使得专利检索查准率与查全率在一定程度上得到提高。 论文最后是结论和对未来进一步工作的展望。
引用
收藏
页数:63
共 26 条
[1]
Lucene全文检索技术在专利服务平台中的研究与应用 [D]. 
陈祥荣 .
苏州大学,
2010
[2]
面向产品创新设计的语义关键词专利检索方法 [D]. 
杜昂 .
大连理工大学,
2009
[3]
不确定语义检索在专利智能服务平台中的应用 [D]. 
储振华 .
苏州大学,
2009
[4]
专利信息检索系统中本体半自动构建的研究与应用 [D]. 
伊雯雯 .
苏州大学,
2008
[5]
基于词汇语义色彩分析的文本倾向识别 [D]. 
吴云 .
北京邮电大学,
2008
[6]
中文语义倾向识别的关键算法研究 [D]. 
张锦明 .
北京邮电大学,
2008
[7]
融合本体和用户兴趣的专利信息检索系统的研究与实现 [D]. 
缪涵琴 .
苏州大学,
2007
[8]
产品外观设计专利检索与分析系统的研究和实现 [D]. 
洪李栋 .
浙江大学,
2006
[9]
中文自动问答系统CQAS..张晓季;.西北大学.2007,
[10]
专利信息采集与分析.[M].陈燕;黄迎燕;方建国等编著;.清华大学出版社.2006,