智能搜索引擎关键技术及应用研究

被引:7
作者
刘耀 [1 ]
郑德举 [2 ]
潘希阳 [1 ]
黄毅 [1 ]
机构
[1] 中国科学技术信息研究所
[2] 北京大学语言信息工程系
关键词
语义标注; 自然语言处理; 文本内容理解; 搜索引擎;
D O I
10.13266/j.issn.0252-3116.2015.05.018
中图分类号
G254 [文献标引与编目];
学科分类号
1205 ; 120501 ;
摘要
[目的 /意义]技术创新服务平台的建设中需要智能搜索引擎技术,智能搜索引擎技术的内涵或者说重点在于自动语义标注。技术创新服务平台上对搜索引擎的要求,与大众的搜索引擎的需求还是不同的,处理的对象主要是专业领域的文本,通过语义标注技术,能快速对企业文档进行语义化和结构化组织,从而为企业提供精准的知识服务。[方法 /过程]针对专业领域语义标注的相关问题,在进行深入研究与探讨的基础上,将语义标注理解为是对一组文档资源进行组织语义化的过程,提出利用结构化语义概念资源或集合对数字化文本进行自动标引的方法,并根据概念实体出现频次、位置和关系等因素,自动抽取相关语义概念集合,实现相关文本的语义内容的自动标注。[结果 /结论]评价语义标注相关实验的效果,展示语义标注的具体应用场景。同时,体现领域本体与语义标注语料不断更新、进化、形成互动的过程,旨在为专业领域的语义自动标注及智能搜索引擎的构建提供有益的参考。
引用
收藏
页码:113 / 118
页数:6
相关论文
共 2 条
[1]   Tag-TextRank:一种基于Tag的网页关键词抽取方法 [J].
李鹏 ;
王斌 ;
石志伟 ;
崔雅超 ;
李恒训 .
计算机研究与发展, 2012, 49 (11) :2344-2351
[2]  
Using a web-based categorization approach to generate thematic metadata from texts[J] . Chien-Chung Huang,Shui-Lung Chuang,Lee-Feng Chien. ACM Transactions on Asian Language Information Processing (TALIP) . 2004 (3)