基于中文信息处理的古代汉语分词研究

被引：31

作者：

邱冰 ^{[1
]}

皇甫娟 ^{[2
]}

机构：

[1] 北京大学中文系

[2] 河南工程学院图书馆

来源：

微计算机信息 | 2008年 / 24期

关键词：

计算机自然语言处理; 中文信息处理; 自动分词;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

本文在计算机语言处理与古代汉语词汇研究的交叉学科领域进行了新的探索,提出了一种基于计算机自动分词的词汇处理及量化统计方法,并给出了具体的实现方式。统计结果显示,古代汉语双音词比重自先秦以来以一种平稳的方式增长,该结论与古代汉语词汇研究成果一致。本文提出的方法具有良好的合理性和高效的处理性能,在一定程度上克服了传统人工分词方法的缺陷和不足,因而计算机自然语言处理在古代汉语研究中也有重要的应用价值。

引用

页码：100 / 102

页数：3

共 5 条

[1]

计算机自然语言处理.[M].王晓龙;关毅等编著;.清华大学出版社.2005,

[2]

自然语言处理综论.[M].(美)DanielJurafsky;(美)JamesH.Martin著;冯志伟;孙乐译;.电子工业出版社.2005,

[3] 基于词典和词频的中文分词方法 [J].

张恒 ;

杨文昭 ;

屈景辉 ;

卢虹冰 ;

张亮 ;

赵飞 .

微计算机信息, 2008, (03) :239-240+232

[4] 基于SVM的词频统计中文分词研究 [J].

朱小娟 ;

陈特放 .

微计算机信息, 2007, (30) :205-207

[5] 串频统计和词形匹配相结合的汉语自动分词系统 [J].

刘挺 ;

吴岩 ;

王开铸 .

中文信息学报, 1998, (01) :18-26

← 1 →