一种结构化数据关系特征抽取和表示模型

被引:10
作者
洪立印 [1 ]
徐蔚然 [2 ]
机构
[1] 北京邮电大学信息与通信工程学院
[2] 北京邮电大学模式识别实验室
关键词
自然语言处理; 实体特征抽取; 实体关系挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
WAF(词激活力)是一种基于统计的描述词与词关系的算法,WAF不单纯是考虑的词之间的关联,还考虑了词前后顺序,词与词之间的距离,包含了概率和语言规则两种信息量。本文提出一种实体结构化数据的关系特征抽取算法,并基于该特征实现实体聚类。首先提取出实体结构化数据的语义和语境特征,以此来文本建模,然后对每个属性基于WAF值进行相似度计算,最后进行实体聚类。
引用
收藏
页码:148 / 151
页数:4
相关论文
共 10 条
[1]  
A Flexibel Relation Extraction Framework. Iria J,,T-Rex. Proceeding of the 8th Annual Colloquium for the UK Special Interest Group for Computational Lisnguistics(CLUK’’05) . 2005
[2]  
Word Activation Foreces Map Word Networks. Guo J,Guo H L,Wang Z Y. Nautre . 2011
[3]  
Hyperclique pattern discovery. Xiong, Hui,Tan, Pang-Ning,Kumar, Vipin. Data Mining and Knowledge Discovery . 2006
[4]  
Personalized active learning for collaborative filtering. A. Harpale,Y. Yang. Proceedings of the 31st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval . 2008
[5]  
基于关联规则的数据挖掘算法研究[D]. 陈莉平.江南大学 2008
[6]  
推荐系统中协同过滤算法若干问题的研究[D]. 张亮.北京邮电大学 2009
[7]  
Eigenrank: a ranking-oriented approach to collaborative filtering. N. N. Liu,Q. Yang. SIGIR . 2008
[8]  
Using collaborative filtering to weave an information tapestry. David Goldberg,David Nichols,Oki Brian M,et al. Communications of the ACM . 1992
[9]  
Using collaborative filtering to weave an information tapestry. David Goldberg,David Nichols,Oki Brian M,et al. Communications of the ACM . 1992
[10]  
Mining frequent patterns without candidate generation. Jiawei Han,Jian Pei,Yiwen Yin. SIGMOD ’00: Proceedings of the 2000 ACM SIGMOD international conference on Management of data . 2000