基于最大熵模型的英文名词短语指代消解

被引:18
作者
钱伟
郭以昆
周雅倩
吴立德
机构
[1] 复旦大学计算机科学与工程系
[2] 复旦大学计算机科学与工程系 上海
[3] 上海
关键词
最大熵; 名词短语指代消解; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出了一种新颖的基于语料库的英文名词短语指代消解算法 该算法不仅能解决传统的代词和名词 /名词短语间的指代问题 ,还能解决名词短语间的指代问题 同时 ,利用最大熵模型 ,可以有效地综合各种互不相关的特征 算法在MUC 7公开测试语料上F值达到了 6 0 2 % ,极为接近文献记载的该语料库上F值的最优结果 6 1 8%
引用
收藏
页码:1337 / 1343
页数:7
相关论文
共 11 条
[1]  
Amodel theoreticcorefer encescoringscheme. MVilain,JBurger,JAberdeenetal. Procofthe6thMessageUnderstandingConf (MUC 6) . 1995
[2]  
Anaphora resolution: The state of the art. R Mitkov. . 1999
[3]  
A maximum entropy part-of-speech tagger. A Ratnaparkhi. . 1996
[4]  
Principle-based parsing without overgeneration. D Lin. . 1993
[5]  
Wordnet: A lexical database for English. G A Miller. Communications of the ACM . 1995
[6]  
A maximum entropy approach to natural language processing. A L Berger,S A Pietra,V J Pietra. Computational Linguistics . 1996
[7]  
Nounphrasecoreferenceasclustering. CCardie,KWagstaff. ProcoftheJointConfonEmpiricalMethodsinNLPandVeryLargeCorpora . 1999
[8]  
Amaximumentropyapproachtoi dentifyingsentenceboundaries. JCReynar,ARatnaparkhi. The5thConfonAppliedNat uralLanguageProcessing . 1997
[9]  
Corpus-based learning for noun phrase conference resolution. W M Soon,H T Ng,C Y Lim. Proc of the Joint Conf on Empirical Methods in NLP and Very Large Corpora . 1999
[10]  
OverviewofMUC 7/MET 2. NAChinichor. Procofthe7thMessageUnderstandingConf (MUC 7) . 1998