基于改进SVM和HMM的文本信息抽取算法

被引:16
作者
孙师尧
妙全兴
机构
[1] 武警工程大学信息工程系
关键词
信息抽取; 支持向量机; 隐马尔可夫模型; 机器学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
传统的文本信息抽取算法通常基于词典、规则或其他模型实现,但由于词典建立困难、规则设定模糊或模型结构单一等原因,信息抽取的准确性通常较低。针对传统的文本信息抽取算法存在的多种不足,提出一种基于混合模型的文本信息抽取算法。该算法融合了多种信息抽取方法,引入支持向量机对信息进行分类,利用S型函数拟合调整模型参数,并采用数据平滑技术优化模型概率空间。实验结果表明,与传统的文本信息抽取算法相比,该算法信息抽取的精确度和召回率明显提高,具有较好的可行性。
引用
收藏
页码:281 / 284+292 +292
页数:5
相关论文
共 2 条
[1]
Dependency Pattern Models for Information Extraction.[J].Mark Stevenson;Mark A. Greenwood.Research on Language and Computation.2009, 1
[2]
Information extraction from biomedical text.[J].Jerry R. Hobbs.Journal of Biomedical Informatics.2003, 4