基于本体论的文本特征提取

被引：10

作者：

唐晓文

机构：

[1] 中南大学信息科学与工程学院长沙

来源：

电脑与信息技术 | 2005年 / 01期

关键词：

本体论; 文本特征; 文本结构; 统领长度;

D O I：

10.19414/j.cnki.1005-1228.2005.01.011

中图分类号：

TP399 [在其他方面的应用];

学科分类号：

081203 ; 0835 ;

摘要：

文章提出了一种基于本体论的文本特征提取方法。通过构建文本结构树来充分利用文本结构分析得到的信息 ,利用本体对领域知识的描述信息来分析特征词之间的关系 ,而且在特征权值的计算中提出了特征词统领长度的概念和计算方法。实验数据表明该方法提高了文本特征提取的准确性。

引用

页码：36 / 38+62 +62

页数：4

共 6 条

[1] 基于本体的网络资源表示研究 [J].

耿方萍 ;

朱祥华 .

计算机应用, 2003, (04) :4-6+9

[2] 汉语文本特征词的抽取方法 [J].

薛翠芳 ;

郭炳炎 .

情报学报, 2000, (03) :242-247

[3] 中文文本挖掘的特征导航机制 [J].

林鸿飞 ;

战学刚 ;

姚天顺 .

东北大学学报, 2000, (03) :240-243

[4] 文本结构分析与基于示例的文本过滤 [J].

林鸿飞 ;

战学刚 ;

姚天顺 .

小型微型计算机系统, 2000, (04) :422-425

[5] 基于Web的组态技术研究 [J].

熊良才 .

计算机应用研究, 2000, (02) :58-59

[6] 中文文本中抽取特征信息的区域与技术 [J].

刘开瑛 ;

薛翠芳 ;

郑家恒 ;

周晓强 ;

不详 .

中文信息学报 , 1998, (02) :2-8

← 1 →