基于本体论的文本特征提取

被引:10
作者
唐晓文
机构
[1] 中南大学信息科学与工程学院长沙
关键词
本体论; 文本特征; 文本结构; 统领长度;
D O I
10.19414/j.cnki.1005-1228.2005.01.011
中图分类号
TP399 [在其他方面的应用];
学科分类号
081203 ; 0835 ;
摘要
文章提出了一种基于本体论的文本特征提取方法。通过构建文本结构树来充分利用文本结构分析得到的信息 ,利用本体对领域知识的描述信息来分析特征词之间的关系 ,而且在特征权值的计算中提出了特征词统领长度的概念和计算方法。实验数据表明该方法提高了文本特征提取的准确性。
引用
收藏
页码:36 / 38+62 +62
页数:4
相关论文
共 6 条
[1]   基于本体的网络资源表示研究 [J].
耿方萍 ;
朱祥华 .
计算机应用, 2003, (04) :4-6+9
[2]   汉语文本特征词的抽取方法 [J].
薛翠芳 ;
郭炳炎 .
情报学报, 2000, (03) :242-247
[3]   中文文本挖掘的特征导航机制 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
东北大学学报, 2000, (03) :240-243
[4]   文本结构分析与基于示例的文本过滤 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
小型微型计算机系统, 2000, (04) :422-425
[5]   基于Web的组态技术研究 [J].
熊良才 .
计算机应用研究, 2000, (02) :58-59
[6]   中文文本中抽取特征信息的区域与技术 [J].
刘开瑛 ;
薛翠芳 ;
郑家恒 ;
周晓强 ;
不详 .
中文信息学报 , 1998, (02) :2-8