基于双层级联文本分类的简历信息抽取

被引:2
作者
于琨 [1 ]
管刚 [2 ]
周明 [2 ]
王煦法 [1 ]
蔡庆生 [1 ]
机构
[1] 中国科学技术大学计算机科学技术系
[2] 微软亚洲研究院
关键词
计算机应用; 中文信息处理; 信息抽取; 文本分类; 简历管理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文提出了一种基于双层级联文本分类的方法,用于简历信息的自动抽取。本方法将简历文本分解为文本块和文本串,并将简历中包含的信息分解为概要信息与详细信息。首先对简历文本中的文本块进行切分与分类,抽取出概要信息,然后选择可能包含详细信息的文本块,将其切分为文本串,再通过对文本串的分类抽取出详细信息。对1200份中文简历的实验结果表明,本方法适用于简历信息的自动抽取和管理。
引用
收藏
页码:59 / 66
页数:8
相关论文
共 1 条
[1]   一种基于向量空间模型的多层次文本分类方法 [J].
刘少辉 ;
董明楷 ;
张海俊 ;
李蓉 ;
史忠植 .
中文信息学报, 2002, (03) :8-14+26