依存信息在蛋白质关系抽取中的作用

被引:2
作者
刘兵
钱龙华
徐华
周国栋
机构
[1] 苏州大学计算机科学与技术学院
[2] 苏州大学自然语言处理实验室
关键词
蛋白质关系抽取; 支持向量机; 依存信息;
D O I
暂无
中图分类号
Q51 [蛋白质];
学科分类号
071010 ; 081704 ;
摘要
基于核函数的蛋白质关系(PPI)抽取可以捕获结构化信息,取得了较高的性能,但其计算复杂度过高。该文结合词汇、句法等信息,重点探讨了依存信息对基于特征向量的蛋白质关系(PPI)抽取的影响。在多个PPI语料库上的实验表明,依存信息和基本短语块信息可以有效提高基于特征向量的PPI抽取性能。特别要指出,在AIMed语料上的PPI抽取取得了54.7的F测度,是目前基于特征向量的PPI抽取系统的最好水平。
引用
收藏
页码:21 / 26
页数:6
相关论文
共 16 条
[1]  
http://mars.cs.utu.fi/PPICorpora/GraphKernel.ht ml .
[2]  
Extracting information on protein-protein interactions from biological literature based on machine learning approaches. K.Sugiyama,K.Hatano,M.Yoshikawa,S.Uemura. Journal of Genome Informatics . 2003
[3]  
Syntactic featuresfor protein-protein interaction extraction. R.S e tre,K.Sagae,J.Tsujii. Proceedings of LBM 07 . 2007
[4]  
Exploiting Shallow Linguistic Information for Relation Extraction from Biomedical Literature. Giuliano C,Lavelli A,Romano L. EACL’2006 .
[5]  
Task-oriented evaluation of syntactic parsersand their representations. Y.Miyao,R.S e tre,K.Sagae,T.Matsuzaki,J.Tsujii. Proceedings of ACL-.08.HLT .
[6]  
A Rich Feature Vector for Protein-Protein Interaction Extraction from Multiple Corpora. Miwa M,Stre R,Miyao Y,Tsujii J. EMNLP’2009 .
[7]  
All-paths graph kernel for protein-protein interaction extraction with evaluation of cross-corpus learning. Airola A,Pyysalo S,Bj rne J, et al. BMC Bioinformatics . 2008
[8]  
http://ilk.kub.nl/~sabine/chunklink .
[9]  
Exploring Various Knowledge in Relation Extraction. Zhou, G.D,Su, J,Zhang, J,Zhang, M. Proceedings of 43rd Annual Meeting of the Association for Computational Linguistics (ACL’05) . 2005
[10]  
Walk-weighted subsequence kernels for protein-protein interaction extraction. S.Kim,J.Yoon,J.Yang,S.Park. Journal of BMC Bioinformatics . 2010