共 1 条
中文金融新闻中公司名的识别
被引:48
作者:
王宁
葛瑞芳
苑春法
黄锦辉
李文捷
机构:
[1] 清华大学计算机科学与技术系
[2] 香港中文大学系统工程与工程管理系
[3] 香港理工大学电子计算学系
来源:
关键词:
公司名;
金融领域;
专名识别;
信息抽取;
D O I:
暂无
中图分类号:
TP391.4 [模式识别与装置];
学科分类号:
0811 ;
081101 ;
081104 ;
1405 ;
摘要:
在金融领域信息抽取中 ,公司名扮演着非常重要的角色 ;因此如何正确识别文本中出现的公司名是一个非常重要的研究课题。在对金融新闻文本进行了深入地分析和研究的基础上 ,总结出了公司名的结构特征及其上下文信息 ,建立了六个用于识别公司名的知识库 ,并提出了一个基于两次扫描过程的识别策略。初步实验结果表明 ,在封闭测试中实验系统公司名识别的精确率可以达到 97 3% ,召回率可达 89 3% ;在开放测试中精确率可以达到 6 2 8% ,召回率可达 6 2 1%。
引用
收藏
页码:1 / 6
页数:6
相关论文