共 13 条
一种新的网络热点话题提取方法
被引:6
作者:

蒙祖强
论文数: 0 引用数: 0
h-index: 0
机构: 广西大学计算机与电子信息学院

论文数: 引用数:
h-index:
机构:
机构:
[1] 广西大学计算机与电子信息学院
来源:
关键词:
热点话题;
极大相容块;
词共现网络;
词聚类;
文本聚类;
D O I:
暂无
中图分类号:
TP393.09 [];
学科分类号:
080402 ;
摘要:
网络热点话题提取是网络舆情分析的重要手段,已成为信息检索领域研究的热点内容之一.传统聚类方法因其聚类结果不允许相交等因素,暴露了其在基于(主题)词聚类进行话题发现中的诸多缺点.本文基于小世界理论建立词的共现网络模型并去除大量冗余词,然后运用极大相容块技术并基于过滤后的词共现网络实现对相交话题的提取,获取网络热点话题.本文方法与传统聚类方法有本质区别,基于(主题)词聚类进行话题发现具有独特的优势,较好克服了已有方法的缺点.实验说明了本文方法对提取网络热点话题是有效和可行的,比同类算法具有更好的性能,且具有较好的可伸缩性.
引用
收藏
页码:743 / 748
页数:6
相关论文
共 13 条
[1]
基于流信息距离的多文本流热点挖掘
[J].
杨宁
;
唐常杰
;
王悦
;
陈瑜
;
郑皎凌
;
李红军
.
软件学报,
2011, 22 (08)
:1761-1770

论文数: 引用数:
h-index:
机构:

唐常杰
论文数: 0 引用数: 0
h-index: 0
机构: 四川大学计算机学院

王悦
论文数: 0 引用数: 0
h-index: 0
机构: 四川大学计算机学院

论文数: 引用数:
h-index:
机构:

郑皎凌
论文数: 0 引用数: 0
h-index: 0
机构: 四川大学计算机学院

论文数: 引用数:
h-index:
机构:
[2]
基于概念和语义网络的近似网页检测算法
[J].
曹玉娟
;
牛振东
;
赵堃
;
彭学平
.
软件学报,
2011, 22 (08)
:1816-1826

论文数: 引用数:
h-index:
机构:

牛振东
论文数: 0 引用数: 0
h-index: 0
机构:
北京理工大学计算机科学技术学院 北京理工大学计算机科学技术学院

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[3]
基于词聚类的热点话题检测算法
[J].
龙志祎
;
程葳
.
计算机工程与设计,
2011, 32 (06)
:2214-2217

龙志祎
论文数: 0 引用数: 0
h-index: 0
机构: 北京城市学院人工智能研究所

程葳
论文数: 0 引用数: 0
h-index: 0
机构: 北京城市学院人工智能研究所
[4]
基于多中心模型的网络热点话题发现算法
[J].
王巍
;
杨武
;
齐海凤
.
南京理工大学学报(自然科学版),
2009, 33 (04)
:422-426+431

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[5]
基于语义域语言模型的中文话题关联检测
[J].
洪宇
;
张宇
;
范基礼
;
刘挺
;
李生
.
软件学报,
2008, (09)
:2265-2275

论文数: 引用数:
h-index:
机构:

张宇
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机科学与技术学院信息检索研究室

范基礼
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机科学与技术学院信息检索研究室

刘挺
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机科学与技术学院信息检索研究室

李生
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机科学与技术学院信息检索研究室
[6]
网络文本主题词的提取与组织研究
[J].
曾依灵
;
许洪波
;
白硕
.
中文信息学报,
2008, (03)
:64-70+80

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

白硕
论文数: 0 引用数: 0
h-index: 0
机构: 中国科学院计算技术研究所智能软件部
[7]
网络热点信息发现研究
[J].
曾依灵
;
许洪波
.
通信学报,
2007, (12)
:141-146

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[8]
基于主题子空间的文本模糊C均值聚类方法
[J].
吉翔华
;
陈超
;
邵正荣
;
俞能海
.
小型微型计算机系统,
2007, (12)
:2225-2228

论文数: 引用数:
h-index:
机构:

陈超
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学技术大学图书馆 中国科学技术大学电子工程与信息科学系多媒体计算与通信教育部-微软重点实验室

论文数: 引用数:
h-index:
机构:

俞能海
论文数: 0 引用数: 0
h-index: 0
机构:
中国科学技术大学电子工程与信息科学系多媒体计算与通信教育部-微软重点实验室 中国科学技术大学电子工程与信息科学系多媒体计算与通信教育部-微软重点实验室
[9]
话题检测与跟踪的评测及研究综述
[J].
洪宇
;
张宇
;
刘挺
;
李生
.
中文信息学报,
2007, (06)
:71-87

论文数: 引用数:
h-index:
机构:

张宇
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机科学与技术学院信息检索研究室

刘挺
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机科学与技术学院信息检索研究室

李生
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机科学与技术学院信息检索研究室
[10]
流量内容词语相关度的网络热点话题提取
[J].
周亚东
;
孙钦东
;
管晓宏
;
李卫
;
陶敬
.
西安交通大学学报,
2007, (10)
:1142-1145+1150

周亚东
论文数: 0 引用数: 0
h-index: 0
机构: 西安交通大学智能网络与网络安全教育部重点实验室

孙钦东
论文数: 0 引用数: 0
h-index: 0
机构: 西安交通大学智能网络与网络安全教育部重点实验室

管晓宏
论文数: 0 引用数: 0
h-index: 0
机构: 西安交通大学智能网络与网络安全教育部重点实验室

李卫
论文数: 0 引用数: 0
h-index: 0
机构: 西安交通大学智能网络与网络安全教育部重点实验室

论文数: 引用数:
h-index:
机构: