共 7 条
中文文本挖掘中的无词典分词的算法及其应用
被引:22
作者:
胥桂仙
苏筱蔚
陈淑艳
机构:
[1] 吉林工学院计算机科学与工程学院
[2] 吉林工学院计算机科学与工程学院 吉林长春
[3] 吉林长春
来源:
关键词:
文本挖掘;
中文分词;
无词典分词;
D O I:
10.15923/j.cnki.cn22-1382/t.2002.01.005
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
对中文文本挖掘中的词汇处理技术进行了较深入的探讨 ,提出了针对汉语语言特点的无词典分词算法。该算法基于“找最长字共现”的原则 ,可以准确地将文本中的词汇切分出来。
引用
收藏
页码:16 / 18
页数:3
相关论文