基于动词依存集的领域概念聚类方法

被引:2
作者
刘里 [1 ,2 ]
肖迎元 [1 ,2 ]
机构
[1] 天津理工大学计算机视觉与系统省部共建教育部重点实验室
[2] 天津理工大学天津市智能计算及软件新技术重点实验室
关键词
聚类方法; 语料库; 动词依存集; 依存句法分析; 领域概念; 概念重合率;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
为了能在小规模特定领域语料库上进行有效的概念聚类,提出了一种基于动词依存集的领域概念聚类方法。根据同类领域概念与特定的领域动词共现这一特征,在领域专家的辅助下制定动词依存集,通过计算在主谓结构和动宾结构中与动词依存集共现的概念动词依存度,将依存度高于阈值的概念聚为一类。实验证明,该方法在小规模特定领域语料库上较为实用,聚类结果的概念重合率优于基于LSI和基于搜索引擎的概念聚类方法。
引用
收藏
页码:949 / 953
页数:5
相关论文
共 3 条