基于多元判别分析的文本分割模型

被引:17
作者
朱靖波
叶娜
罗海涛
机构
[1] 东北大学计算机软件研究所
关键词
文本分割; 多元判别分析; 分割单元内距离; 分割单元间距离; 分割单元长度; 遗传算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出了一种独立于具体领域的文本线性分割统计模型,其中采用多元判别分析方法定义了4种全局评价函数,实现对文本分割模式的全局评价,寻找满足分割单元内距离最小化和分割单元间距离最大化条件的最好分割方式.该模型采用遗传算法来解决新模型的高计算复杂度问题.比较性实验结果显示,新模型比TextTiling和Dotplotting算法取得了更高的Pμ评价性能.
引用
收藏
页码:555 / 564
页数:10
相关论文
共 1 条
[1]   A dynamic programming algorithm for linear text segmentation [J].
Fragkou, P ;
Petridis, V ;
Kehagias, A .
JOURNAL OF INTELLIGENT INFORMATION SYSTEMS, 2004, 23 (02) :179-197