一种基于语境的中文分词方法研究

被引:9
作者
张茂元
卢正鼎
邹春燕
机构
[1] 华中科技大学计算机科学与技术学院
[2] 华中师范大学外国语学院
关键词
语境; 中文分词; 马尔可夫链; 歧义切分;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
汉语不同于英语 ,词之间没有间隔标记 .而汉语分词是文本分析的第一步 ,且存在歧义切分 ,因此分词问题成为汉语分析的首要难题 .通过中文切分过程的本质分析 ,推导并提出基于马尔可夫链的语境中文切分理论 ,进而提出一种语境中文分词方法 .该方法建立在词法和句法基础上 ,从语境角度分析歧义字段 ,提高分词准确率 .
引用
收藏
页码:129 / 133
页数:5
相关论文
共 9 条
  • [1] 有扰对称信道平均信息量的计算
    郑世林
    [J]. 通信技术, 2002, (12) : 32 - 33
  • [2] 文本分割算法对中文信息过滤影响研究
    朱寰
    阮彤
    于庆喜
    [J]. 计算机工程与应用, 2002, (13) : 62 - 65
  • [3] 模糊聚类算法在汉语文本聚类中的应用
    李家福
    陆建江
    张亚非
    [J]. 计算机工程, 2002, (04) : 15 - 16+33
  • [4] 一种多知识源汉语语言模型的研究与实现
    刘秉权
    王晓龙
    王宇颖
    [J]. 计算机研究与发展, 2002, (02) : 231 - 235
  • [5] 一种改进的MM分词算法
    郭辉
    苏中义
    王文
    崔骏
    [J]. 微型电脑应用, 2002, (01) : 13 - 15+2
  • [6] 中文搜索引擎中的中文信息处理技术
    邹海山
    吴勇
    吴月珠
    陈阵
    [J]. 计算机应用研究, 2000, (12) : 21 - 24
  • [7] Web文本挖掘技术研究
    王继成
    潘金贵
    张福炎
    [J]. 计算机研究与发展, 2000, (05) : 513 - 520
  • [8] 人工智能及其应用[M]. 清华大学出版社 , 蔡自兴,徐光〓[编著], 1996
  • [9] Process simulation using randomized Markov chain and truncated marginal distribution
    Rodionov, AS
    Choo, H
    Youn, HY
    [J]. JOURNAL OF SUPERCOMPUTING, 2002, 22 (01) : 69 - 85