中文金融新闻中公司名的识别

被引:48
作者
王宁
葛瑞芳
苑春法
黄锦辉
李文捷
机构
[1] 清华大学计算机科学与技术系
[2] 香港中文大学系统工程与工程管理系
[3] 香港理工大学电子计算学系
关键词
公司名; 金融领域; 专名识别; 信息抽取;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
在金融领域信息抽取中 ,公司名扮演着非常重要的角色 ;因此如何正确识别文本中出现的公司名是一个非常重要的研究课题。在对金融新闻文本进行了深入地分析和研究的基础上 ,总结出了公司名的结构特征及其上下文信息 ,建立了六个用于识别公司名的知识库 ,并提出了一个基于两次扫描过程的识别策略。初步实验结果表明 ,在封闭测试中实验系统公司名识别的精确率可以达到 97 3% ,召回率可达 89 3% ;在开放测试中精确率可以达到 6 2 8% ,召回率可达 6 2 1%。
引用
收藏
页码:1 / 6
页数:6
相关论文
共 1 条