基于矩阵约束法的中文分词研究

被引:12
作者
张素智
刘放美
机构
[1] 郑州轻工业学院计算机与通信工程学院
关键词
中文分词; 矩阵约束; 歧义消除; 分词系统;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
分词识别和歧义消除是影响信息检索系统准确度的重要因素,该文提出了一种基于语法和语义的使用约束矩阵的中文分词算法。该算法建立在语法和句法的基础上,从语境角度分析歧义字段,提高分词准确率。系统可以将输入的连续汉字串进行分词处理,输出分割后的汉语词串,并得到一个词典。再用《现代汉语语法信息词典》进行处理,实验结果显示分词准确率能提高10%左右。
引用
收藏
页码:98 / 100
页数:3
相关论文
共 6 条
  • [1] 面向信息检索的自适应中文分词系统
    曹勇刚
    曹羽中
    金茂忠
    刘超
    [J]. 软件学报, 2006, (03) : 356 - 363
  • [2] 几何命题处理中的中文分词技术
    佘莉
    符红光
    方海光
    [J]. 计算机工程, 2005, (18) : 180 - 182
  • [3] 一种基于语境的中文分词方法研究
    张茂元
    卢正鼎
    邹春燕
    [J]. 小型微型计算机系统, 2005, (01) : 129 - 133
  • [4] 基于汉语句模的中文分词算法
    张滨
    晏蒲柳
    李文翔
    夏德麟
    [J]. 计算机工程, 2004, (01) : 134 - 135+191
  • [5] 一种中文分词词典新机制——双字哈希机制
    李庆虎
    陈玉健
    孙家广
    [J]. 中文信息学报, 2003, (04) : 13 - 18
  • [6] 两种典型的中文分词方法的分析和比较[J]. 汤洪燕,李晓军,王洪利.高性能计算技术. 2005 (04)