基于中文文本分类的分词方法研究

被引:21
作者
湛燕
陈昊
袁方
王熙照
不详
机构
[1] 河北大学数学与计算机科学学院
[2] 河北大学数学与计算机科学学院 保定
[3] 保定
[4] 保定
关键词
文本分类; 分词; 查询; 数据库; 主题词;
D O I
暂无
中图分类号
TP391.12 [];
学科分类号
摘要
文本分类有助于用户有选择地阅读和处理海量文本,因此其预备工作分词系统的研究是很有意义的。该文主要提出了一种基于中文文本分类的分词方法,区别于常用的基于字符串匹配等方法,并利用数据库特有的查询技术设计和实现了该分词系统,旨在通过新的分词方法提供更加准确的分词率,同时提高系统实现效率。
引用
收藏
页码:87 / 88+91 +91
页数:3
相关论文
共 5 条