学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于句类特征的作者写作风格分类研究
被引:18
作者
:
张运良
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
张运良
[
1
]
朱礼军
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
朱礼军
[
1
]
乔晓东
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
乔晓东
[
1
]
张全
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术信息研究所
不详
张全
[
2
]
机构
:
[1]
不详
[2]
中国科学技术信息研究所
[3]
不详
[4]
中国科学院声学研究所
[5]
不详
来源
:
计算机工程与应用
|
2009年
/ 22期
关键词
:
文本分类;
作者写作风格;
句类;
向量空间模型;
概念层次网络(HNC)理论;
自然语言理解;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
不同作家的作品有自己的特点,这些特点体现在词汇、句型、修辞手法等各个方面,尝试使用句类特征进行作者写作风格分类,进一步可以用于作者的识别。利用向量空间模型,以句类作为特征,并通过混合句类分解等技术对句类向量空间降维,使用itc算法对特征项进行权重计算,KNN算法进行分类并利用集成判决技术,形成作者写作风格分类器。本分类器的性能在近现代小说的按作者写作风格的分类和鉴别方面的性能是可以接受的,并有进一步提升的可能。
引用
收藏
页码:129 / 131+223 +223
页数:4
相关论文
共 9 条
[1]
基于语义分析的作者身份识别方法研究
武晓春
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学与工程系
武晓春
论文数:
引用数:
h-index:
机构:
黄萱菁
论文数:
引用数:
h-index:
机构:
吴立德
[J].
中文信息学报,
2006,
(06)
: 61
-
68
[2]
文本分类器性能评估指标
宋枫溪
论文数:
0
引用数:
0
h-index:
0
机构:
炮兵学院系
宋枫溪
高林
论文数:
0
引用数:
0
h-index:
0
机构:
炮兵学院系
高林
[J].
计算机工程,
2004,
(13)
: 107
-
109+127
[3]
中文文本分类中的特征选择研究
周茜
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
周茜
论文数:
引用数:
h-index:
机构:
赵明生
论文数:
引用数:
h-index:
机构:
扈旻
[J].
中文信息学报,
2004,
(03)
: 17
-
23
[4]
基于向量空间模型的文本自动分类系统的研究与实现
论文数:
引用数:
h-index:
机构:
庞剑锋
论文数:
引用数:
h-index:
机构:
卜东波
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
白硕
[J].
计算机应用研究,
2001,
(09)
: 23
-
26
[5]
基于写作风格的中文邮件作者身份识别技术研究[D]. 常淑惠.河北农业大学. 2005
[6]
基于SVM的中文电子邮件作者身份挖掘技术研究[D]. 马建斌.河北农业大学. 2004
[7]
HNC(概念层次网络)语言理解技术及其应用[M]. 科学出版社 , 晋耀红著, 2006
[8]
HNC(概念层次网络)理论[M]. 清华大学出版社 , 黄曾阳著, 1998
[9]
COMPUTER EVALUATION OF INDEXING AND TEXT PROCESSING
SALTON, G
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science, Cornell University, Ithaca, New York
SALTON, G
LESK, ME
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science, Cornell University, Ithaca, New York
LESK, ME
[J].
JOURNAL OF THE ACM,
1968,
15
(01)
: 8
-
&
←
1
→
共 9 条
[1]
基于语义分析的作者身份识别方法研究
武晓春
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学与工程系
武晓春
论文数:
引用数:
h-index:
机构:
黄萱菁
论文数:
引用数:
h-index:
机构:
吴立德
[J].
中文信息学报,
2006,
(06)
: 61
-
68
[2]
文本分类器性能评估指标
宋枫溪
论文数:
0
引用数:
0
h-index:
0
机构:
炮兵学院系
宋枫溪
高林
论文数:
0
引用数:
0
h-index:
0
机构:
炮兵学院系
高林
[J].
计算机工程,
2004,
(13)
: 107
-
109+127
[3]
中文文本分类中的特征选择研究
周茜
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
周茜
论文数:
引用数:
h-index:
机构:
赵明生
论文数:
引用数:
h-index:
机构:
扈旻
[J].
中文信息学报,
2004,
(03)
: 17
-
23
[4]
基于向量空间模型的文本自动分类系统的研究与实现
论文数:
引用数:
h-index:
机构:
庞剑锋
论文数:
引用数:
h-index:
机构:
卜东波
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
白硕
[J].
计算机应用研究,
2001,
(09)
: 23
-
26
[5]
基于写作风格的中文邮件作者身份识别技术研究[D]. 常淑惠.河北农业大学. 2005
[6]
基于SVM的中文电子邮件作者身份挖掘技术研究[D]. 马建斌.河北农业大学. 2004
[7]
HNC(概念层次网络)语言理解技术及其应用[M]. 科学出版社 , 晋耀红著, 2006
[8]
HNC(概念层次网络)理论[M]. 清华大学出版社 , 黄曾阳著, 1998
[9]
COMPUTER EVALUATION OF INDEXING AND TEXT PROCESSING
SALTON, G
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science, Cornell University, Ithaca, New York
SALTON, G
LESK, ME
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science, Cornell University, Ithaca, New York
LESK, ME
[J].
JOURNAL OF THE ACM,
1968,
15
(01)
: 8
-
&
←
1
→