共 9 条
词典与统计相结合的中文分词算法研究
被引:9
作者:

李宏波
论文数: 0 引用数: 0
h-index: 0
机构: 武汉理工大学计算机科学与技术学院
机构:
[1] 武汉理工大学计算机科学与技术学院
关键词:
分词词典;
统计分析;
未登录词;
歧义词;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
基于对算法的时间复杂度和分词精度的综合考虑,提出了一种分词词典和统计分析相结合的解决方案。该算法采用统计和机械分词相结合的策略,合理解决了歧义词和未登录词两大难题,实验证明分词效果比较理想。
引用
收藏
页码:907 / 909+913
+913
页数:4
相关论文
共 9 条
- [2] 中文分词中歧义切分处理策略[J]. 山西大学学报(自然科学版), 2007, (02) : 163 - 167郑家恒论文数: 0 引用数: 0 h-index: 0机构: 山西大学计算机与信息技术学院计算智能与中文信息处理省部共建教育部重点实验室张剑锋论文数: 0 引用数: 0 h-index: 0机构: 山西大学计算机与信息技术学院计算智能与中文信息处理省部共建教育部重点实验室论文数: 引用数: h-index:机构:
- [3] 基于条件随机场的汉语分词系统[J]. 微计算机信息, 2006, (28) : 178 - 180李双龙论文数: 0 引用数: 0 h-index: 0机构: 北京科技大学 北京科技大学刘群论文数: 0 引用数: 0 h-index: 0机构: 中科院计算所 北京科技大学论文数: 引用数: h-index:机构:
- [4] 汉语自动分词的研究现状与困难[J]. 系统仿真学报, 2005, (01) : 138 - 143+147张春霞论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所郝天永论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所
- [5] 一种中文分词词典新机制——双字哈希机制[J]. 中文信息学报, 2003, (04) : 13 - 18李庆虎论文数: 0 引用数: 0 h-index: 0机构: 清华大学计算机系陈玉健论文数: 0 引用数: 0 h-index: 0机构: 清华大学计算机系论文数: 引用数: h-index:机构:
- [6] 基于Web的字词频统计程序的设计与应用[J]. 苏州大学学报(自然科学), 2002, (01) : 38 - 44周丽琴论文数: 0 引用数: 0 h-index: 0机构: 苏州大学工学院计算机系杨季文论文数: 0 引用数: 0 h-index: 0机构: 苏州大学工学院计算机系论文数: 引用数: h-index:机构:
- [7] 中文搜索引擎中的中文信息处理技术[J]. 计算机应用研究, 2000, (12) : 21 - 24邹海山论文数: 0 引用数: 0 h-index: 0机构: 南京大学电子科学与工程系!江苏 南京吴勇论文数: 0 引用数: 0 h-index: 0机构: 南京大学电子科学与工程系!江苏 南京吴月珠论文数: 0 引用数: 0 h-index: 0机构: 南京大学电子科学与工程系!江苏 南京陈阵论文数: 0 引用数: 0 h-index: 0机构: 南京大学电子科学与工程系!江苏 南京
- [8] 交集型歧义字段切分方法研究[J]. 情报学报, 2000, (06) : 637 - 643闫引堂论文数: 0 引用数: 0 h-index: 0机构: 山西大学!太原周晓强论文数: 0 引用数: 0 h-index: 0机构: 山西大学!太原
- [9] 快速书面汉语自动分词系统及其算法设计[J]. 计算机研究与发展 , 1993, (01) : 61 - 65张国煊论文数: 0 引用数: 0 h-index: 0机构: 杭州电子工业学院计算机系王小华论文数: 0 引用数: 0 h-index: 0机构: 杭州电子工业学院计算机系周必水论文数: 0 引用数: 0 h-index: 0机构: 杭州电子工业学院计算机系不详论文数: 0 引用数: 0 h-index: 0机构: 杭州电子工业学院计算机系