文本嵌入技术的研究与应用进展

被引:4
作者
赵悦阳 [1 ]
崔雷 [2 ]
机构
[1] 中国医科大学附属盛京医院图书馆
[2] 中国医科大学医学健康管理学院
关键词
文本嵌入; 自然语言处理; 内容分析法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
[目的]本文对国内外已经发表的自然语言处理领域有关文本嵌入的研究进行较深入的分析和对比,详细描述文本嵌入的知识结构和发展脉络,以及针对不同领域、不同数据集的模型改进方法,讨论流行的嵌入模型,比较每个模型在文本嵌入中的优缺点,同时指出文本嵌入所面临的挑战,提出可能的解决方案。[方法]检索Web of Science数据库、CNKI数据库和万方数据,获取国内外文本嵌入研究的相关文献,运用内容分析法对文献做系统梳理分析,对这些文献中利用的文本嵌入技术以及改进方案、建模思想、生成过程等方面进行对比与分析。[结果]经过去重和合并,保留内容最相关的61篇文献。文本嵌入方法可以归纳为三类:基于频率的文本嵌入、基于神经网络的文本嵌入和基于主题建模的文本嵌入。针对语料库的规模大小、多义词嵌入、通用嵌入的域适应等文本嵌入所面临的挑战,从被调查的研究文章中提出了可能的解决方案。
引用
收藏
页码:92 / 110
页数:19
相关论文
共 76 条
[1]   Configuring products with natural language: a simple yet effective approach based on text embeddings and multilayer perceptron [J].
Wang, Yue ;
Li, Xiang ;
Zhang, Linda L. ;
Mo, Daniel .
INTERNATIONAL JOURNAL OF PRODUCTION RESEARCH, 2022, 60 (17) :5394-5406
[2]  
Predicting user emotional tone in mental disorder online communities.[J].Silveira Bárbara;Silva Henrique S.;Murai Fabricio;da Silva Ana Paula C..Future Generation Computer Systems.2021,
[3]   Topic-Based Document-Level Sentiment Analysis Using Contextual Cues [J].
Truica, Ciprian-Octavian ;
Apostol, Elena-Simona ;
Serban, Maria-Luiza ;
Paschke, Adrian .
MATHEMATICS, 2021, 9 (21)
[4]   A Nested Chinese Restaurant Topic Model for Short Texts with Document Embeddings [J].
Niu, Yue ;
Zhang, Hongjie ;
Li, Jing .
APPLIED SCIENCES-BASEL, 2021, 11 (18)
[5]  
SynSeq4ED: A Novel Event-Aware Text Representation Learning for Event Detection.[J].Vo; Tham.Neural Processing Letters.2021, prepublish
[6]   An Automated System to Predict Popular Cybersecurity News Using Document Embeddings [J].
Saeed, Ramsha ;
Rubab, Saddaf ;
Asif, Sara ;
Khan, Malik M. ;
Murtaza, Saeed ;
Kadry, Seifedine ;
Nam, Yunyoung ;
Khan, Muhammad Attique .
CMES-COMPUTER MODELING IN ENGINEERING & SCIENCES, 2021, 127 (02) :533-547
[7]  
Tens-embedding: A Tensor-based document embedding method.[J].Zahra Rahimi;Mohammad Mehdi Homayounpour.Expert Systems With Applications.2020,
[8]   Combining structured and unstructured data for predictive models: a deep learning approach [J].
Zhang, Dongdong ;
Yin, Changchang ;
Zeng, Jucheng ;
Yuan, Xiaohui ;
Zhang, Ping .
BMC MEDICAL INFORMATICS AND DECISION MAKING, 2020, 20 (01)
[9]   Bi-Directional Recurrent Attentional Topic Model [J].
Li, Shuangyin ;
Zhang, Yu ;
Pan, Rong .
ACM TRANSACTIONS ON KNOWLEDGE DISCOVERY FROM DATA, 2020, 14 (06)
[10]   Automatic document screening of medical literature using word and text embeddings in an active learning setting [J].
Carvallo, Andres ;
Parra, Denis ;
Lobel, Hans ;
Soto, Alvaro .
SCIENTOMETRICS, 2020, 125 (03) :3047-3084