共 6 条
基于本体论的文本特征提取
被引:10
作者:
唐晓文
机构:
[1] 中南大学信息科学与工程学院长沙
来源:
关键词:
本体论;
文本特征;
文本结构;
统领长度;
D O I:
10.19414/j.cnki.1005-1228.2005.01.011
中图分类号:
TP399 [在其他方面的应用];
学科分类号:
081203 ;
0835 ;
摘要:
文章提出了一种基于本体论的文本特征提取方法。通过构建文本结构树来充分利用文本结构分析得到的信息 ,利用本体对领域知识的描述信息来分析特征词之间的关系 ,而且在特征权值的计算中提出了特征词统领长度的概念和计算方法。实验数据表明该方法提高了文本特征提取的准确性。
引用
收藏
页码:36 / 38+62
+62
页数:4
相关论文