共 14 条
基于语义的中文网页检索
被引:4
作者:
余一骄
[1
]
刘芹
[2
]
机构:
[1] 华中师范大学语言学系
[2] 武汉大学计算机学院
来源:
关键词:
语义检索;
中文网页;
本体;
分类;
聚类;
信息抽取;
D O I:
暂无
中图分类号:
TP391.3 [检索机];
学科分类号:
081203 ;
0835 ;
摘要:
用户期望搜索引擎能提供基于语义的网页信息检索。基于本体、基于自然语言理解、基于文本统计分析的方法是实现中文网页语义检索的主要途径。分析了它们的实现方法、技术挑战和优、缺点;建议中文网页语义检索系统的开发应选择与普通用户联系紧密的应用领域,并以汉语词汇为索引单元,适量地采用中文信息处理技术。基于语义的中文网页检索应在以下方面加强研究:语义相关性评价方法、本体构建和实体抽取算法、基于语义的索引、大规模语义标注样本集开发等。
引用
收藏
页码:79 / 87
页数:9
相关论文