科技文献语篇元素自动标注模型研究综述

被引:7
作者
于改红 [1 ,2 ]
张智雄 [1 ,2 ,3 ]
马娜 [1 ,2 ]
机构
[1] 不详
[2] 中国科学院大学
[3] 不详
[4] 中国科学院文献情报中心
[5] 中国科学院武汉文献情报中心
[6] 不详
关键词
科技文献; 语篇元素; 标注模型; 自动标注;
D O I
10.13266/j.issn.0252-3116.2018.15.015
中图分类号
G254 [文献标引与编目];
学科分类号
摘要
[目的 /意义]为更好地提升科技文献的语义丰富化效果,对国内外科技文献语篇元素标注模型、技术和方法进行调研总结,为文本挖掘、科技论文知识抽取、语义分析系统研究者提供借鉴。[方法 /过程]利用学术网站搜索和相关数据库搜索引擎,对涉及科技论文标注、语篇元素、知识抽取、句子识别和自动文章分类等参考文献以及研究报告进行深入阅读和调研,对语篇元素自动标注模型以及相关工作进展进行研究总结。[结果/结论]科技文献语篇元素标注具有非常重要的实际应用价值,构建标注模型需充分考虑构建思想、标注领域和标注粒度以及标注技术手段等方面。
引用
收藏
页码:132 / 144
页数:13
相关论文
共 13 条
[11]  
Annotation of argument structure in Japanese legal documents .2 YAMADA H,TEUFEL S,TOKUNAGA T. Proceedings of the 4th workshop on argument mining . 2017
[12]  
Multi-label annotation in scientific articles-the multi-label cancer risk assessment corpus .2 RAVENSCROFT J,OELLRICH A,SAHA S.et al. Proceedings of the Tenth International Conference on Language Resources and Evaluation(LREC 2016) . 2016
[13]  
Applying core scientific concepts to context-based citation recommendation .2 DUMA D,LIAKATA M,CLARE A.et al. Proceedings of the Tenth International Conference on Language Resources and Evaluation(LREC 2016) . 2016