基于潜在语义分析的BBS文档Bayes鉴别器

被引:17
作者
刘昌钰
唐常杰
于中华
杜永萍
郭颖
机构
[1] 四川大学计算机科学系
[2] 山西大学计算机科学系
基金
高等学校博士学科点专项科研基金;
关键词
数据挖掘; 关联规则; Bayes分类; 潜在语义分析; BBS;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
电子公告栏 (BBS)的滥用是一种以信息污染为特色的社会问题 ,对BBS文档进行鉴别已成为信息安全重要内容之一 .该文融合了数据挖掘技术、数理统计技术和自然语言理解技术 ,提出了基于潜在语义分析与Bayes分类的BBS文档鉴别方法 :利用自然语言处理技术从训练文档中抽取典型短语集 ;通过潜在语义分析进行典型短语同义归约 ,应用关联规则采掘技术提高典型短语间的独立性 ;用Bayes分类器对BBS文档进行鉴别 .该文还对影响系统的关键参数进行了大量的讨论和测试 ,实验表明该方法对于BBS文档的鉴别是可行而有效的 .
引用
收藏
页码:566 / 572
页数:7
相关论文
共 2 条
  • [1] “信译”英汉机器翻译系统的语法分析策略
    于中华
    唐常杰
    张天庆
    朱敏
    廖果
    李志蜀
    沙芦华
    [J]. 小型微型计算机系统, 2000, (03) : 316 - 318
  • [2] 矩阵计算引论[M]. 上海科学技术出版社[]G·W·斯图尔特, 1980