面向互联网的藏文实体关系模板获取技术研究

被引:1
作者
马宁
李亚超
于槐
加羊吉
机构
[1] 西北民族大学甘肃省民族语言智能处理重点实验室
基金
中央高校基本科研业务费专项资金资助;
关键词
藏文; 实体关系; 模板; 互联网;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
确定实体之间的关系有助于更好的理解文本内容,通过实体关系模板可以从海量无结构的文本中获取大量的实体关系,并予以结构化.本文针对互联网藏文文本的特点,通过对藏文实体进行模板表示,采用基于word2vec的无监督词义相似度计算方法,构建近义词资源,实现了藏文词义相似度计算系统,最终构建一种基于相似度计算的实体关系模板获取模型.通过网络爬虫抓取青海湖藏文网的语料进行试验,实验结果表明本文提出的藏文实体关系模板抽取方法较为有效,达到了较好的实验效果.
引用
收藏
页码:35 / 39
页数:5
相关论文
共 5 条
[1]
最大熵和条件随机场模型相融合的藏文人名识别 [J].
加羊吉 ;
李亚超 ;
宗成庆 ;
于洪志 .
中文信息学报, 2014, (01) :107-112
[2]
面向信息检索的藏文文本索引策略研究 [J].
万福成 ;
李冬晨 ;
何向真 ;
徐涛 .
计算机工程与应用 , 2014, (07) :208-211+270
[3]
基于条件随机场的藏语自动分词方法研究与实现 [J].
李亚超 ;
加羊吉 ;
宗成庆 ;
于洪志 .
中文信息学报, 2013, 27 (04) :52-58
[4]
基于DOM修剪的藏文Web信息提取 [J].
珠杰 ;
欧珠 ;
格桑多吉 .
计算机工程, 2008, 34 (24) :58-60
[5]
实体关系模板的获取技术 [J].
陈晓颖 ;
胡熠 ;
陆汝占 .
计算机工程, 2007, (21) :199-201