基于主题分割与PageRank算法的文本主题抽取

被引:9
作者
段晓丽
王宇
机构
[1] 大连理工大学管理学院
关键词
主题句抽取; 主题分割; 句子关系图; PageRank算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对主题句抽取时完整性差的问题,在对文本进行主题分割的基础上,为每个主题包构建句子关系图,并采用基于图的PageRank算法对关系图中的句子排序,选取权重大的句子作为每个主题包的主题句。实验表明,该算法抽取的主题句对全文有很好的覆盖率。
引用
收藏
页码:34 / 39
页数:6
相关论文
共 13 条
[1]
基于句子特征和语义距离的文本摘要技术 [J].
张培颖 .
微计算机应用, 2009, 30 (07) :14-18
[2]
基于句子关系图的网页文本主题句抽取 [J].
何维 ;
王宇 .
现代图书情报技术, 2009, (03) :57-61
[3]
以关键词抽取为核心的文摘句选择策略 [J].
马亮 ;
何婷婷 ;
李芳 ;
陈劲光 ;
邵伟 .
中文信息学报, 2008, 22 (06) :50-54
[4]
文本线性分割方法的研究 [J].
刘娜 ;
唐焕玲 ;
鲁明羽 .
计算机工程与应用, 2008, (21) :212-216
[5]
一种基于文本关系图的多文档自动摘要技术 [J].
马慧芳 ;
祁云平 ;
杨小东 .
情报杂志 , 2007, (03) :67-69
[6]
基于综合方法的文本主题句的自动抽取 [J].
张云涛 ;
龚玲 ;
王永成 .
上海交通大学学报, 2006, (05) :771-774+782
[7]
基于连续段落相似度的主题划分算法 [J].
傅间莲 ;
陈群秀 .
计算机应用, 2005, (09) :2022-2024
[8]
文本的图表示初探 [J].
周昭涛 ;
卜东波 ;
程学旗 .
中文信息学报, 2005, (02) :36-43
[9]
一种基于字同现频率的汉语文本主题抽取方法 [J].
马颖华 ;
王永成 ;
苏贵洋 ;
张宇萌 .
计算机研究与发展, 2003, (06) :874-878
[10]
一种篇章结构指导的中文Web文档自动摘要方法 [J].
王继成 ;
武港山 ;
周源远 ;
张福炎 .
计算机研究与发展, 2003, (03) :398-405