基于HowNet的微博文本语义检索研究

被引:11
作者
王李冬 [1 ,2 ]
张慧熙 [1 ]
机构
[1] 杭州师范大学钱江学院
[2] 浙江大学数字图书馆工程研究中心
基金
浙江省自然科学基金;
关键词
微博; HowNet; 语义检索;
D O I
10.13833/j.cnki.is.2016.09.027
中图分类号
G252.7 [文献检索];
学科分类号
1205 ; 120501 ;
摘要
随着新浪等微博用户的不断增长,微博网站已经成为人们获取信息和创造信息的主要平台。现有微博平台的检索功能只能靠关键词匹配返回检索结果,使得检索结果无法满足用户需求。为了解决该问题,提出一种基于HowNet知识库系统的微博语义检索方法。利用HowNet知识库系统分别将中文待检索主题词和微博文本词汇进行语义相关度匹配,返回和待检索词汇语义相关度较高的微博文本,最后针对新浪微博数据集进行语义检索实验。实验结果表明,利用HowNet系统能够从语义层面上获得较高的查准率,为用户提供更满意的检索效果。
引用
收藏
页码:134 / 137
页数:4
相关论文
共 5 条
[1]   基于语义查询扩展的微博检索 [J].
唐晓波 ;
房小可 .
情报资料工作, 2014, (02) :34-38
[2]   微博短文本预处理及学习研究综述 [J].
王连喜 .
图书情报工作, 2013, 57 (11) :125-131
[3]   基于LDA的微博文本主题建模方法研究述评 [J].
张培晶 ;
宋蕾 .
图书情报工作, 2012, 56 (24) :120-126
[4]   微博信息挖掘技术研究综述 [J].
蒋盛益 ;
麦智凯 ;
庞观松 ;
吴美玲 ;
王连喜 .
图书情报工作, 2012, (17) :136-142
[5]   基于语义分析的微博搜索 [J].
刘晓华 ;
韦福如 ;
段亚娟 ;
周明 .
山东大学学报(理学版), 2012, 47 (05) :38-42