基于众包的维吾尔语事件标注研究

被引:3
作者
陈昊 [1 ,2 ]
吐尔根依布拉音 [1 ,2 ]
卡哈尔江阿比的热西提 [1 ,2 ]
艾山吾买尔 [1 ,2 ]
机构
[1] 新疆大学信息科学与工程学院
[2] 新疆大学自治区语言技术重点实验室
关键词
事件; 维吾尔语; 语料库; 众包;
D O I
10.13568/j.cnki.651094.2015.02.014
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
大规模标注语料库在自然语言处理的语义理解和算法研究等领域有重要作用.本文针对维吾尔语事件标注语料空白以及标注仅仅涉及简单的人类智能的事实,提出了一种基于众包的维吾尔语事件标注方法.在制定了维吾尔语事件标注规范之后,建立了三层架构的标注体系,并提出质量控制机制.维吾尔语事件标注语料库为维吾尔语事件的研究提供了重要的资源支持.
引用
收藏
页码:209 / 214+220 +220
页数:7
相关论文
共 9 条
[1]
维吾尔文机构名识别研究 [D]. 
米日姑·肉孜 .
新疆大学,
2013
[2]
突发事件信息的标注研究 [D]. 
邹红建 .
北京语言大学,
2008
[3]
Fine-grained Dutch named entity recognition [J].
Desmet, Bart ;
Hoste, Veronique .
LANGUAGE RESOURCES AND EVALUATION, 2014, 48 (02) :307-343
[4]
Perspectives on crowdsourcing annotations for natural language processing [J].
Wang, Aobo ;
Cong Duy Vu Hoang ;
Kan, Min-Yen .
LANGUAGE RESOURCES AND EVALUATION, 2013, 47 (01) :9-31
[5]
Designing games with a purpose [J].
von Ahn, Luis ;
Dabbish, Laura .
COMMUNICATIONS OF THE ACM, 2008, 51 (08) :58-67
[6]
基于词干提取的维吾尔语事件类时间短语识别 [J].
邹岳琳 ;
吐尔根依布拉音 ;
麦热哈巴艾力 ;
艾山吾买尔 ;
帕力旦吐尔逊 .
计算机工程与设计, 2014, 35 (02) :625-630
[7]
基于规则的维吾尔地名识别 [J].
木合塔尔·艾尔肯 ;
艾斯卡尔·艾木都拉 ;
地里木拉提·吐尔逊 .
通信技术, 2013, 46 (07) :103-105
[8]
基于条件随机场的维吾尔人名识别方法 [J].
艾斯卡尔肉孜 ;
宗成庆 ;
姑丽加玛丽麦麦提艾力 ;
热合木马合木提 ;
艾斯卡尔艾木都拉 .
清华大学学报(自然科学版), 2013, 53 (06) :873-877
[9]
众包社区用户持续参与行为实证研究 [J].
仲秋雁 ;
王彦杰 ;
裘江南 .
大连理工大学学报(社会科学版) , 2011, (01) :1-6