基于罪名相关成分标注的刑事裁判文书概要信息提取

被引:11
作者
刘晨玥 [1 ]
李兵 [2 ]
吴卫星 [1 ]
机构
[1] 对外经济贸易大学金融学院
[2] 对外经济贸易大学信息学院
基金
北京市自然科学基金;
关键词
罪名实体识别; 刑事裁判文书; 隐马尔科夫模型; 最大熵马尔科夫模型; 罪名相关成分标注;
D O I
10.16452/j.cnki.sdkjzk.2018.04.012
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
近年来,互联网信贷市场迅猛发展,多角度多信息源充分了解贷款申请人的信用情况显得愈发重要。法院的案件裁判文书的权威性、规范性以及其官方可得性,使其成为贷款申请人信用评估的重要数据源。命名实体识别技术在司法领域的应用亟待探索。针对网上公开的刑事裁判文书进行概要信息提取,构建基于罪名相关成分标注语料库的隐马尔科夫模型和最大熵马尔科夫模型,并利用其识别提取裁判文书中的被告人及其罪名等关键司法信息,可以为互联网信贷平台的信用风险管理工作提供更充分的信息资源。开放性测试结果显示基于罪名相关成分标注的HMM和MEMM的平均F值分别达到了87.79%、90.25%,说明提出的方法克服了裁判文书格式的差异和罪名实体识别的困难,具有较好的刑事裁判文书概要信息提取效果。
引用
收藏
页码:92 / 101+124 +124
页数:11
相关论文
共 6 条
[1]
Semi-Supervised Bootstrapping Approach for Named Entity Recognition.[J].Thenmalar S;Balaji J;Geetha T.V.International Journal on Natural Language Computing.2015, 5
[2]
Analysis of named entity recognition and linking for tweets [J].
Derczynski, Leon ;
Maynard, Diana ;
Rizzo, Giuseppe ;
van Erp, Marieke ;
Gorrell, Genevieve ;
Troncy, Raphael ;
Petrak, Johann ;
Bontcheva, Kalina .
INFORMATION PROCESSING & MANAGEMENT, 2015, 51 (02) :32-49
[3]
Semantic NLP-Based Information Extraction from Construction Regulatory Documents for Automated Compliance Checking.[J].Jiansong Zhang;Nora M. El-Gohary.Journal of Computing in Civil Engineering.2013, 2
[4]
电子病历中命名实体的智能识别 [J].
叶枫 ;
陈莺莺 ;
周根贵 ;
李昊旻 ;
李莹 .
中国生物医学工程学报, 2011, 30 (02) :256-262
[5]
基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[6]
中文金融新闻中公司名的识别 [J].
王宁 ;
葛瑞芳 ;
苑春法 ;
黄锦辉 ;
李文捷 .
中文信息学报, 2002, (02) :1-6