学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于文本聚类与LDA相融合的微博主题检索模型研究
被引:110
作者
:
论文数:
引用数:
h-index:
机构:
唐晓波
房小可
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学信息资源研究中心
房小可
机构
:
[1]
武汉大学信息资源研究中心
来源
:
情报理论与实践
|
2013年
/ 36卷
/ 08期
关键词
:
文本聚类;
主题检索;
微博;
D O I
:
暂无
中图分类号
:
TP391.3 [检索机];
学科分类号
:
080201
[机械制造及其自动化]
;
摘要
:
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段。其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素。文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型。实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题。
引用
收藏
页码:85 / 90
页数:6
相关论文
共 4 条
[1]
文本聚类综述
[J].
吴启明
论文数:
0
引用数:
0
h-index:
0
机构:
河池学院计算机与信息科学系
吴启明
;
论文数:
引用数:
h-index:
机构:
易云飞
.
河池学院学报,
2008,
(02)
:86
-91
[2]
海量短语信息文本聚类技术研究
[J].
王永恒
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
王永恒
;
论文数:
引用数:
h-index:
机构:
贾焰
;
杨树强
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
杨树强
.
计算机工程,
2007,
(14)
:38
-40
[3]
基于频繁词集聚类的海量短文分类方法
[J].
王永恒
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
王永恒
;
论文数:
引用数:
h-index:
机构:
贾焰
;
杨树强
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
杨树强
.
计算机工程与设计,
2007,
(08)
:1744
-1746+1780
[4]
信息检索.[M].黄如花; 主编.武汉大学出版社.2010,
←
1
→
共 4 条
[1]
文本聚类综述
[J].
吴启明
论文数:
0
引用数:
0
h-index:
0
机构:
河池学院计算机与信息科学系
吴启明
;
论文数:
引用数:
h-index:
机构:
易云飞
.
河池学院学报,
2008,
(02)
:86
-91
[2]
海量短语信息文本聚类技术研究
[J].
王永恒
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
王永恒
;
论文数:
引用数:
h-index:
机构:
贾焰
;
杨树强
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
杨树强
.
计算机工程,
2007,
(14)
:38
-40
[3]
基于频繁词集聚类的海量短文分类方法
[J].
王永恒
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
王永恒
;
论文数:
引用数:
h-index:
机构:
贾焰
;
杨树强
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
杨树强
.
计算机工程与设计,
2007,
(08)
:1744
-1746+1780
[4]
信息检索.[M].黄如花; 主编.武汉大学出版社.2010,
←
1
→