数据到文本生成研究综述

被引:11
作者
曹娟 [1 ]
龚隽鹏 [2 ]
张鹏洲 [2 ]
机构
[1] 中国传媒大学新媒体研究院
[2] 中国传媒大学理工学部
关键词
数据到文本生成; 机器新闻写作; 自然语言生成; 内容选择; 表层实现; 神经网络;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
机器新闻写作,作为人工智能在传媒业的一种应用,越来越受到学界和业界的关注,目前主要用于体育、财经、气象地质和健康等领域。机器新闻写作的核心是自然语言生成技术,而数据到文本生成是自然语言生成领域的典型技术,是实现机器新闻写作的关键技术之一。为了更好地研究数据到文本生成技术并将其应用于机器新闻写作领域,以内容选择和表层实现为重点,梳理了近年来数据到文本生成的发展脉络,并比较了基于规则和数据驱动两种研究方法,归纳了不同领域的可用数据集,总结了内在和外在两类评价方法,分析了数据到文本生成技术当前存在的问题,以及探讨了其未来可能的研究方向。
引用
收藏
页码:80 / 84+89 +89
页数:6
相关论文
共 11 条
[1]   从NLG到机器新闻写作——机器新闻的发展与反思 [J].
周佳玥 .
今传媒, 2017, 25 (10) :18-19
[2]   机器新闻发展的市场进路及反思——以Autamated Insights公司为例 [J].
李苏 .
新闻界, 2015, (18) :56-61
[3]   机器新闻写作:一场正在发生的革命 [J].
金兼斌 .
新闻与写作, 2014, (09) :30-35
[4]  
Atlas.txt: exploring linguistic grounding techniques for communicating spatial information to blind users[J] . Kavita E. Thomas,Somayajulu Sripada,Matthijs L. Noordzij. Universal Access in the Information Society . 2012 (1)
[5]  
Rhetorical Structure Theory: Toward a functional theory of text organization[J] . WILLIAM C. MANN,SANDRA A. THOMPSON. Text - Interdisciplinary Journal for the Study of Discourse . 2009 (3)
[6]  
From data to text in the Neonatal Intensive Care Unit: Using NLG technology for decision support and information management[J] . Albert Gatt,Fran?ois Portet,Ehud Reiter,Jim Hunter,Saad Mahamood,Wendy Moncur,Somayajulu Sripada. AI Communications . 2009 (3)
[7]  
Choosing words in computer-generated weather forecasts[J] . Ehud Reiter,Somayajulu Sripada,Jim Hunter,Jin Yu,Ian Davy. Artificial Intelligence . 2005 (1)
[8]  
Statistical natural language generation from tabular non-textual data .2 MAHAPATRA J,NASKAR S K,BANDYOPADHYAY S. Proceedings of the 9th international natural language generation conference . 2016
[9]  
Summarisation and visualisation of e-health data repositories .2 HALLETT C,POWER R,SCOTT D. Proceedings of the UK e-science all-hands meeting . 2006
[10]  
Expanding the scope of the ATIS task the ATIS-3 corpus .2 DAHL D A,BATES M,BROWN M,et al. Workshop on human language technology . 1994