学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于LDA模型的文本分割
被引:52
作者
:
论文数:
引用数:
h-index:
机构:
石晶
[
1
]
论文数:
引用数:
h-index:
机构:
胡明
[
1
]
论文数:
引用数:
h-index:
机构:
石鑫
[
2
]
戴国忠
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所人机交互技术与智能信息处理实验室
长春工业大学计算机科学与工程学院
戴国忠
[
3
]
机构
:
[1]
长春工业大学计算机科学与工程学院
[2]
辽宁师范大学功能材料化学研究所
[3]
中国科学院软件研究所人机交互技术与智能信息处理实验室
来源
:
计算机学报
|
2008年
/ 10期
关键词
:
文本分割;
LDA模型;
相似性度量;
边界识别;
D O I
:
暂无
中图分类号
:
TP301 [理论、方法];
学科分类号
:
081202 ;
摘要
:
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用.基于LDA模型的文本分割以LDA为语料库及文本建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,获取词汇的概率分布,使隐藏于片段内的不同主题与文本表面的字词建立联系.实验以汉语的整句作为基本块,尝试多种相似性度量手段及边界估计策略,其最佳结果表明二者的恰当结合可以使片段边界的识别错误率远远低于其它同类算法.
引用
收藏
页码:1865 / 1873
页数:9
相关论文
共 6 条
[1]
基于多元判别分析的文本分割模型
[J].
朱靖波
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机软件研究所
朱靖波
;
叶娜
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机软件研究所
叶娜
;
罗海涛
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机软件研究所
罗海涛
.
软件学报,
2007,
(03)
:555
-564
[2]
基于PLSA模型的文本分割
[J].
论文数:
引用数:
h-index:
机构:
石晶
;
戴国忠
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所人机交互技术与智能信息处理实验室
戴国忠
.
计算机研究与发展,
2007,
(02)
:242
-248
[3]
Text segmentation by product partition models and dynamic programming[J] . A. Kehagias.Mathematical and Computer Modelling . 2004 (2)
[4]
A critique and improvement of an evaluation metric for text segmentation
[J].
Pevzner, L
论文数:
0
引用数:
0
h-index:
0
机构:
Harvard Univ, Cambridge, MA 02138 USA
Pevzner, L
;
Hearst, MA
论文数:
0
引用数:
0
h-index:
0
机构:
Harvard Univ, Cambridge, MA 02138 USA
Hearst, MA
.
COMPUTATIONAL LINGUISTICS,
2002,
28
(01)
:19
-36
[5]
Integrating prosodic and lexical cues for automatic topic segmentation
[J].
Tür, G
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06533 Ankara, Turkey
Tür, G
;
Hakkani-Tür, D
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06533 Ankara, Turkey
Hakkani-Tür, D
;
Stolcke, A
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06533 Ankara, Turkey
Stolcke, A
;
Shriberg, E
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06533 Ankara, Turkey
Shriberg, E
.
COMPUTATIONAL LINGUISTICS,
2001,
27
(01)
:31
-57
[6]
Statistical Models for Text Segmentation
[J].
Doug Beeferman
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon University,School of Computer Science
Doug Beeferman
;
Adam Berger
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon University,School of Computer Science
Adam Berger
;
John Lafferty
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon University,School of Computer Science
John Lafferty
.
Machine Learning,
1999,
34
:177
-210
←
1
→
共 6 条
[1]
基于多元判别分析的文本分割模型
[J].
朱靖波
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机软件研究所
朱靖波
;
叶娜
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机软件研究所
叶娜
;
罗海涛
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机软件研究所
罗海涛
.
软件学报,
2007,
(03)
:555
-564
[2]
基于PLSA模型的文本分割
[J].
论文数:
引用数:
h-index:
机构:
石晶
;
戴国忠
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所人机交互技术与智能信息处理实验室
戴国忠
.
计算机研究与发展,
2007,
(02)
:242
-248
[3]
Text segmentation by product partition models and dynamic programming[J] . A. Kehagias.Mathematical and Computer Modelling . 2004 (2)
[4]
A critique and improvement of an evaluation metric for text segmentation
[J].
Pevzner, L
论文数:
0
引用数:
0
h-index:
0
机构:
Harvard Univ, Cambridge, MA 02138 USA
Pevzner, L
;
Hearst, MA
论文数:
0
引用数:
0
h-index:
0
机构:
Harvard Univ, Cambridge, MA 02138 USA
Hearst, MA
.
COMPUTATIONAL LINGUISTICS,
2002,
28
(01)
:19
-36
[5]
Integrating prosodic and lexical cues for automatic topic segmentation
[J].
Tür, G
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06533 Ankara, Turkey
Tür, G
;
Hakkani-Tür, D
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06533 Ankara, Turkey
Hakkani-Tür, D
;
Stolcke, A
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06533 Ankara, Turkey
Stolcke, A
;
Shriberg, E
论文数:
0
引用数:
0
h-index:
0
机构:
Bilkent Univ, Dept Comp Engn, TR-06533 Ankara, Turkey
Shriberg, E
.
COMPUTATIONAL LINGUISTICS,
2001,
27
(01)
:31
-57
[6]
Statistical Models for Text Segmentation
[J].
Doug Beeferman
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon University,School of Computer Science
Doug Beeferman
;
Adam Berger
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon University,School of Computer Science
Adam Berger
;
John Lafferty
论文数:
0
引用数:
0
h-index:
0
机构:
Carnegie Mellon University,School of Computer Science
John Lafferty
.
Machine Learning,
1999,
34
:177
-210
←
1
→