基于SVM和泛化模板协作的藏语人物属性抽取

被引:18
作者
朱臻 [1 ,2 ]
孙媛 [1 ,2 ]
机构
[1] 中央民族大学信息工程学院
[2] 中央民族大学国家语言资源监测与研究中心少数民族语言分中心
关键词
人物属性抽取; 藏语语言处理; SVM; 层次分类器;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
该文提出了一种基于SVM和泛化模板协作的藏语人物属性抽取方法。该方法首先构建了基于藏语语言规则的模板系统,收集了包括格助词、特殊动词等具有明显语义信息的特征建设模板并泛化。针对规则方法的局限性,该文在模板的基础上,采用SVM机器学习方法,设计了一种处理多分类问题的层次分类器结构,同时对多样化的特征选取给予说明。最后,实验结果表明,基于SVM和模板相结合的方式可以对人物属性抽取的性能有较大提高。
引用
收藏
页码:220 / 227
页数:8
相关论文
共 4 条
[1]
最大熵和条件随机场模型相融合的藏文人名识别 [J].
加羊吉 ;
李亚超 ;
宗成庆 ;
于洪志 .
中文信息学报, 2014, (01) :107-112
[2]
指代消解综述 [J].
孔芳 ;
周国栋 ;
朱巧明 ;
钱培德 .
计算机工程, 2010, 36 (08) :33-36
[3]
藏文自动分词系统中紧缩词的识别 [J].
才智杰 .
中文信息学报, 2009, 23 (01) :35-37+43
[4]
Linked Data - The Story So Far[J] Christian Bizer;Tom Heath;Tim Berners-Lee International Journal on Semantic Web and Information Systems (IJSWIS) 2009,