互联网社区中网络化知识实体抽取研究

被引:7
作者
王怀波 [1 ]
郑勤华 [2 ]
机构
[1] 北京师范大学系统科学学院
[2] 北京师范大学远程教育研究中心
关键词
互联网社区; 网络化知识; 知识实体; 知识抽取;
D O I
10.19605/j.cnki.kfxxyj.2022.02.002
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
互联网社区中“群体贡献、生产众筹”的知识涌现和汇聚现象,颠覆了知识稳定、权威的本质特征,改变了知识的表征形式与抽取方式。已有研究从理论层面提出“网络化知识”内涵及其表征模型,但缺少实践层面的落地应用。为此,本研究重点探究一套适用于互联网社区中网络化知识实体抽取的方法框架,以适应新时期网络化知识抽取的需要。抽取框架包括“数据采集与处理、分词与实体抽取、实体过滤与统一”三个环节。该框架综合考虑网络化知识的境遇化和动态性特征,通过设定一套基于话题文档的分类规则,将文本内容处理到相对独立的语境中;同时探索关键词、词语组合、命名实体识别三种方式获取候选实体;最终借助实体语义相似度计算等方法完成实体的过滤与统一。最后,研究借助cMOOC联通主义学习社区中网络化知识实体的抽取进行框架的应用与验证。
引用
收藏
页码:7 / 16
页数:10
相关论文
共 31 条
[1]   国际教育文本挖掘研究热点与前沿透视 [J].
王萌 ;
符雅茹 ;
牟智佳 .
开放学习研究, 2021, 26 (03) :17-27
[2]   LAC-DGLU:基于CNN和注意力机制的命名实体识别模型 [J].
赵丰 ;
黄健 ;
张中杰 .
计算机科学, 2020, 47 (11) :212-219
[3]   基于深度学习模型的菊花古典诗词命名实体识别 [J].
崔竞烽 ;
郑德俊 ;
王东波 ;
李婷婷 .
情报理论与实践, 2020, 43 (11) :150-155
[4]   网络化知识的内涵解析与表征模型构建 [J].
王怀波 ;
陈丽 .
中国远程教育, 2020, (05) :10-17+76
[5]   SentiBERT:结合情感信息的预训练语言模型 [J].
杨晨 ;
宋晓宁 ;
宋威 .
计算机科学与探索, 2020, 14 (09) :1563-1570
[6]   基于文本挖掘的继续教育机构评价方法新探 [J].
郭玉娟 ;
胡韧奋 .
开放学习研究, 2019, 24 (06) :8-14
[7]   人机协同的新时代:我国人工智能教育应用的现状与趋势 [J].
陈丽 ;
郭玉娟 ;
高欣峰 ;
谢雷 ;
郑勤华 .
开放学习研究, 2019, 24 (05) :1-8
[8]   新知识观:重塑面向智能时代的教与学 [J].
王竹立 .
华东师范大学学报(教育科学版), 2019, 37 (05) :38-55
[9]   基于多维相似度的整体式实体统一算法研究 [J].
范威振 ;
陈占芳 ;
刘燕龙 .
长春理工大学学报(自然科学版), 2019, 42 (04) :114-119
[10]  
“互联网+教育”的知识观:知识回归与知识进化[J]. 陈丽,逯行,郑勤华.中国远程教育. 2019(07)