面向司法案件的案情知识图谱自动构建

被引:58
作者
洪文兴 [1 ]
胡志强 [1 ]
翁洋 [2 ]
张恒 [3 ]
王竹 [4 ]
郭志新 [5 ]
机构
[1] 厦门大学航空航天学院
[2] 四川大学数学学院
[3] 成都星云律例科技有限责任公司
[4] 四川大学法学院
[5] 电子科技大学公共管理学院
基金
国家重点研发计划;
关键词
司法案件; 知识图谱; 实体识别; 关系抽取;
D O I
暂无
中图分类号
D926 [司法制度]; TP18 [人工智能理论];
学科分类号
030202 [中外政治制度]; 140502 [人工智能];
摘要
以法学知识为中心的认知智能是当前司法人工智能发展的重要方向。该文提出了以自然语言处理(NLP)为核心技术的司法案件案情知识图谱自动构建技术。以预训练模型为基础,对涉及的实体识别和关系抽取这两个NLP基本任务进行了模型研究与设计。针对实体识别任务,对比研究了两种基于预训练的实体识别模型;针对关系抽取任务,该文提出融合平移嵌入的多任务联合的语义关系抽取模型,同时获得了结合上下文的案情知识表示学习。在"机动车交通事故责任纠纷"案由下,和基准模型相比,实体识别的F1值可提升0.36,关系抽取的F1值提升高达2.37。以此为基础,该文设计了司法案件的案情知识图谱自动构建流程,实现了对数十万份判决书案情知识图谱的自动构建,为类案精准推送等司法人工智能应用提供语义支撑。
引用
收藏
页码:34 / 44
页数:11
相关论文
共 7 条
[1]
A Combination of RNN and CNN for Attention-based Relation Classification.[J].Xiaobin Zhang;Fucai Chen;Ruiyang Huang.Procedia Computer Science.2018,
[2]
Named Entity Recognition with Bidirectional LSTM-CNNs.[J].Jason P.C. Chiu;Eric Nichols.Transactions of the Association for Computational Linguistics.2016,
[3]
Wikidata.[J].Denny Vrandečić;Markus Krötzsch.Communications of the ACM.2014, 10
[4]
Dropout: a simple way to prevent neural networks from overfitting..[J].Nitish Srivastava;Geoffrey E. Hinton;Alex Krizhevsky;Ilya Sutskever;Ruslan Salakhutdinov.Journal of Machine Learning Research.2014, 1
[5]
DBpedia - A crystallization point for the Web of Data [J].
Bizer, Christian ;
Lehmann, Jens ;
Kobilarov, Georgi ;
Auer, Soeren ;
Becker, Christian ;
Cyganiak, Richard ;
Hellmann, Sebastian .
JOURNAL OF WEB SEMANTICS, 2009, 7 (03) :154-165
[6]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[7]
The viterbi algorithm.[J].G.D. Forney.Proceedings of the IEEE.1973, 3