自然语言理解心理学在短文本分类中的实证研究

被引:2
作者
盛宇
刘俊熙
郭金兰
龙怡
机构
[1] 上海政法学院计算机教研室
关键词
文本分类; 短文本; 特征选择; 自然语言; 心理学;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
目前对文本分类研究多数集中在对大规模语料基础上的特征选择或分类器算法的研究。本文是建立在训练样本少且样本长度短的基础上,根据人脑对自然语言理解的心理学原理"人们总是根据已知的最熟悉的、最典型的例子进行判断,只有在该方法不奏效的时候才使用频率这一概念,并且使用的是十分简单的频率"从该角度进行短文本分类的实证研究。以心理学中的"熟悉原理"、"典型原理"等为模型建立特殊词库和典型案例词库,改进了传统文本分类的实验步骤,同时提出了该方法的优势和局限性。
引用
收藏
页码:4 / 7
页数:4
相关论文
共 10 条
[1]   文本分类技术中的特征选择算法研究 [J].
张申亚 .
信阳农业高等专科学校学报, 2007, (03) :125-127
[2]   基于关键短语的文本分类研究 [J].
刘华 .
中文信息学报, 2007, (04) :34-41
[3]   文本分类中特征选择方法的比较和改进 [J].
伍建军 ;
康耀红 .
郑州大学学报(理学版), 2007, (02) :110-113
[4]   短文本数据的自动分类 [J].
宋东风 ;
张志浩 .
电脑与信息技术, 2007, (01) :36-38+57
[5]   基于文本分类中特征提取的领域词语聚类 [J].
刘华 .
语言文字应用, 2007, (01) :139-144
[6]   一种基于特征词句子环境的文本分类器 [J].
孙晓霞 ;
郑玉明 ;
廖湖声 .
计算机应用研究, 2007, (02) :116-119
[7]   SVM在文本分类中的应用研究 [J].
刘霞 ;
卢苇 .
计算机教育, 2007, (02) :72-74+77
[8]   带专业词库的特征选择 [J].
刘晓志 ;
黄厚宽 ;
尚文倩 .
北京交通大学学报, 2006, (02) :97-100
[9]   基于领域词典的文本特征表示 [J].
陈文亮 ;
朱靖波 ;
朱慕华 ;
姚天顺 .
计算机研究与发展, 2005, (12) :2155-2160
[10]  
自然语言理解的心理学原理.[M].李伯约; 赛丹; 著.学林出版社.2007,