基于语义的中文网页检索

被引:4
作者
余一骄 [1 ]
刘芹 [2 ]
机构
[1] 华中师范大学语言学系
[2] 武汉大学计算机学院
关键词
语义检索; 中文网页; 本体; 分类; 聚类; 信息抽取;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
用户期望搜索引擎能提供基于语义的网页信息检索。基于本体、基于自然语言理解、基于文本统计分析的方法是实现中文网页语义检索的主要途径。分析了它们的实现方法、技术挑战和优、缺点;建议中文网页语义检索系统的开发应选择与普通用户联系紧密的应用领域,并以汉语词汇为索引单元,适量地采用中文信息处理技术。基于语义的中文网页检索应在以下方面加强研究:语义相关性评价方法、本体构建和实体抽取算法、基于语义的索引、大规模语义标注样本集开发等。
引用
收藏
页码:79 / 87
页数:9
相关论文
共 14 条
[1]   一种核心子集选择训练的大规模中文网页分类方法 [J].
傅向华 ;
刘国 ;
陈冬剑 .
小型微型计算机系统, 2011, 32 (08) :1608-1612
[2]   一种基于LDA的潜在语义区划分及Web文档聚类算法 [J].
刘振鹿 ;
王大玲 ;
冯时 ;
张一飞 ;
方东昊 .
中文信息学报, 2011, 25 (01) :60-65+70
[3]   词义·词长·词频——《现代汉语词典》(第5版)多义词计量分析 [J].
王惠 .
中国语文, 2009, (02) :120-130+191
[4]   中文网页语义标注:由句子到RDF表示 [J].
荆涛 ;
左万利 ;
孙吉贵 ;
车海燕 .
计算机研究与发展, 2008, (07) :1221-1231
[5]   基于Labeled-LDA模型的文本分类新算法 [J].
李文波 ;
孙乐 ;
张大鲲 .
计算机学报, 2008, (04) :620-627
[6]   中文网页信息检索测试集的构建、分析及应用 [J].
李静静 ;
闫宏飞 .
中文信息学报, 2008, (01) :30-36
[7]   中文文本的信息自动抽取和相似检索机制 [J].
林鸿飞 ;
杨志豪 ;
赵晶 .
小型微型计算机系统, 2007, (11) :2074-2079
[8]   语义搜索引擎Smartch的设计与实现(英文) [J].
文坤梅 ;
卢正鼎 ;
李瑞轩 ;
孙小林 .
Journal of Southeast University(English Edition), 2007, (03) :317-321
[9]   中文网页分类研究与系统实现 [J].
段军峰 ;
黄维通 ;
陆玉昌 .
计算机科学, 2007, (06) :210-213
[10]   中文分词十年回顾 [J].
黄昌宁 ;
赵海 .
中文信息学报, 2007, (03) :8-19