学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种基于循环神经网络的古文断句方法
被引:30
作者
:
论文数:
引用数:
h-index:
机构:
王博立
[
1
]
论文数:
引用数:
h-index:
机构:
史晓东
[
1
,
2
,
3
]
论文数:
引用数:
h-index:
机构:
苏劲松
[
4
]
机构
:
[1]
厦门大学智能科学与技术系
[2]
厦门大学两岸关系和平发展协同创新中心
[3]
福建省类脑计算技术及应用重点实验室
[4]
厦门大学软件学院
来源
:
北京大学学报(自然科学版)
|
2017年
/ 53卷
/ 02期
关键词
:
古汉语;
断句;
循环神经网络;
D O I
:
10.13209/j.0479-8023.2017.032
中图分类号
:
TP391.1 [文字信息处理];
TP183 [人工神经网络与计算];
学科分类号
:
摘要
:
提出一种基于循环神经网络的古文自动断句方法。该方法采用基于GRU(gated recurrent unit)的双向循环神经网络进行古文断句。在解码过程中,该算法不仅利用神经网络输出的概率分布,还进一步引入状态转移概率和长度惩罚,以便提高断句准确率。在大规模古籍语料上的实验结果表明,所提方法能够取得比传统方法更高的断句F1值。
引用
收藏
页码:255 / 261
页数:7
相关论文
共 5 条
[1]
基于条件随机场的古汉语自动断句与标点方法
论文数:
引用数:
h-index:
机构:
张开旭
论文数:
引用数:
h-index:
机构:
夏云庆
论文数:
引用数:
h-index:
机构:
宇航
[J].
清华大学学报(自然科学版),
2009,
49
(10)
: 1733
-
1736
[2]
一种基于层叠CRF的古文断句与句读标记方法
张合
论文数:
0
引用数:
0
h-index:
0
机构:
河南师范大学计算机与信息技术学院
河南师范大学计算机与信息技术学院
张合
王晓东
论文数:
0
引用数:
0
h-index:
0
机构:
河南师范大学计算机与信息技术学院
河南师范大学计算机与信息技术学院
王晓东
杨建宇
论文数:
0
引用数:
0
h-index:
0
机构:
北京得意音通技术有限责任公司
河南师范大学计算机与信息技术学院
杨建宇
周卫东
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学信息所
河南师范大学计算机与信息技术学院
周卫东
[J].
计算机应用研究,
2009,
26
(09)
: 3326
-
3329
[3]
农业古籍断句标点模式研究
黄建年
论文数:
0
引用数:
0
h-index:
0
机构:
南京农业大学人文与社会科学学院
黄建年
侯汉清
论文数:
0
引用数:
0
h-index:
0
机构:
南京农业大学人文与社会科学学院
侯汉清
[J].
中文信息学报,
2008,
(04)
: 31
-
38
[4]
基于前后文n-gram模型的古汉语句子切分
陈天莹
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
陈天莹
论文数:
引用数:
h-index:
机构:
陈蓉
潘璐璐
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
潘璐璐
论文数:
引用数:
h-index:
机构:
李红军
于中华
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
于中华
[J].
计算机工程,
2007,
(03)
: 192
-
193+196
[5]
On early stopping in gradient descent learning
Yao, Yuan
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Berkeley, Dept Math, Berkeley, CA 94720 USA
Univ Calif Berkeley, Dept Math, Berkeley, CA 94720 USA
Yao, Yuan
Rosasco, Lorenzo
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Berkeley, Dept Math, Berkeley, CA 94720 USA
Rosasco, Lorenzo
Caponnetto, Andrea
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Berkeley, Dept Math, Berkeley, CA 94720 USA
Caponnetto, Andrea
[J].
CONSTRUCTIVE APPROXIMATION,
2007,
26
(02)
: 289
-
315
←
1
→
共 5 条
[1]
基于条件随机场的古汉语自动断句与标点方法
论文数:
引用数:
h-index:
机构:
张开旭
论文数:
引用数:
h-index:
机构:
夏云庆
论文数:
引用数:
h-index:
机构:
宇航
[J].
清华大学学报(自然科学版),
2009,
49
(10)
: 1733
-
1736
[2]
一种基于层叠CRF的古文断句与句读标记方法
张合
论文数:
0
引用数:
0
h-index:
0
机构:
河南师范大学计算机与信息技术学院
河南师范大学计算机与信息技术学院
张合
王晓东
论文数:
0
引用数:
0
h-index:
0
机构:
河南师范大学计算机与信息技术学院
河南师范大学计算机与信息技术学院
王晓东
杨建宇
论文数:
0
引用数:
0
h-index:
0
机构:
北京得意音通技术有限责任公司
河南师范大学计算机与信息技术学院
杨建宇
周卫东
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学信息所
河南师范大学计算机与信息技术学院
周卫东
[J].
计算机应用研究,
2009,
26
(09)
: 3326
-
3329
[3]
农业古籍断句标点模式研究
黄建年
论文数:
0
引用数:
0
h-index:
0
机构:
南京农业大学人文与社会科学学院
黄建年
侯汉清
论文数:
0
引用数:
0
h-index:
0
机构:
南京农业大学人文与社会科学学院
侯汉清
[J].
中文信息学报,
2008,
(04)
: 31
-
38
[4]
基于前后文n-gram模型的古汉语句子切分
陈天莹
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
陈天莹
论文数:
引用数:
h-index:
机构:
陈蓉
潘璐璐
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
潘璐璐
论文数:
引用数:
h-index:
机构:
李红军
于中华
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
于中华
[J].
计算机工程,
2007,
(03)
: 192
-
193+196
[5]
On early stopping in gradient descent learning
Yao, Yuan
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Berkeley, Dept Math, Berkeley, CA 94720 USA
Univ Calif Berkeley, Dept Math, Berkeley, CA 94720 USA
Yao, Yuan
Rosasco, Lorenzo
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Berkeley, Dept Math, Berkeley, CA 94720 USA
Rosasco, Lorenzo
Caponnetto, Andrea
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Berkeley, Dept Math, Berkeley, CA 94720 USA
Caponnetto, Andrea
[J].
CONSTRUCTIVE APPROXIMATION,
2007,
26
(02)
: 289
-
315
←
1
→