专利信息是人类智慧的结晶,它几乎囊括了一切应用领域中的技术成果,涉及经济发展、科技创新和战略决策等最重要的信息资源。在当今国际市场竞争极为激烈的形势下,专利信息是各国发展经济不可或缺的重要资源。
本文将语用信息和专利信息检索相结合,在基于传统关键字检索的基础上给专利检索赋予语用含义,以提高检索的查准率和查全率。
本文主要工作包括如下几点:
(1)根据国际专利分类法(IPC)分类规则,手动下载专利文献并构建了包含有语用信息的专利语料库,为后续的研究打好基础;
(2)对语用信息进行大量研究之后,提出了专利语料中语用信息的概念以及抽取规则与抽取方法,将抽取出来的语用信息添加到专利语料库中用于专利检索以提高检索的查全率与查准率;
(3)以上述技术为基础,以问答系统为平台,构建了一个基于语用信息的中文专利检索系统,实现了对专利信息的有效查询,通过对加入语用信息前后实验结果的对比,表明语用信息的加入使得专利检索查准率与查全率在一定程度上得到提高。
论文最后是结论和对未来进一步工作的展望。