基于深度学习的文本特征提取研究综述

被引:10
作者
张千
王庆玮
张悦
纪校锋
张宇翔
祝赫
赵昌志
机构
[1] 中国石油大学(华东)计算机与通信工程学院
关键词
深度学习; 特征提取; 文本特征; 自然语言处理; 文本挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
文本特征项的选择是文本挖掘和信息检索的基础和重要内容。传统的特征提取方法需要手工制作的特征,而手工设计有效的特征是一个漫长的过程,但针对新的应用深度学习能够快速地从训练数据中获取新的有效特征表示。作为一种新的特征提取方法,深度学习在文本挖掘方面取得了一定的成果。深度学习与传统方法的主要区别在于,深度学习能自动地从大数据中学习特征而不是采用手工制作的特征,手工制作的特征主要依赖于设计者的先验知识,很难充分利用大数据;深度学习可以自动地从大数据中学习特征表示,并包括数以万计的参数。文中概述了用于文本特征提取的常用方法,并阐述了在文本特征提取及应用中常用的深度学习方法,以及深度学习在特征提取中的应用展望。
引用
收藏
页码:61 / 65
页数:5
相关论文
共 4 条
  • [1] 基于词频统计的文本关键词提取方法
    罗燕
    赵书良
    李晓超
    韩玉辉
    丁亚飞
    [J]. 计算机应用, 2016, 36 (03) : 718 - 725
  • [2] An Improved KNN Text Classification Algorithm Based on Clustering
    Zhou Yong
    Li Youwen
    Xia Shixiong
    [J]. JOURNAL OF COMPUTERS, 2009, 4 (03) : 230 - 237
  • [3] Estimation of entropy and mutual information
    Paninski, L
    [J]. NEURAL COMPUTATION, 2003, 15 (06) : 1191 - 1253
  • [4] "Text Categorization Using Weight Adjusted k-Nearest Neighbor Classification" .2 Eui-Hong Han,George Karypis,and Vipin Kumar. Pacific-Asia Conference on Knowledge Discovery and Data Minings . 2001