学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于Lucene的中文文本分词
被引:12
作者
:
王继明
论文数:
0
引用数:
0
h-index:
0
机构:
内蒙古工业大学信息工程学院
王继明
论文数:
引用数:
h-index:
机构:
杨国林
机构
:
[1]
内蒙古工业大学信息工程学院
来源
:
内蒙古工业大学学报(自然科学版)
|
2007年
/ 03期
关键词
:
中文文本分词;
文本检索;
Lucene;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
中文文本分词技术是文本挖掘领域的一个重要分支,在中国仍然处于发展阶段.Apache Jakarta的开源工程Lucene是一个十分优秀的基于Java语言的文本检索工具包,在国外已经得到广泛的应用.但是Lucene对中文分词功能的支持不太理想,给Lucene加入好的中文分词功能对Lucene在国内的发展和应用将会起到很大的推动作用.
引用
收藏
页码:185 / 188
页数:4
相关论文
共 5 条
[1]
汉语自动分词的研究现状与困难
[J].
张春霞
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
张春霞
;
郝天永
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
郝天永
.
系统仿真学报,
2005,
(01)
:138
-143+147
[2]
汉语自动分词研究及其在信息检索中的应用
[J].
曹倩
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
曹倩
;
丁艳
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
丁艳
;
王超
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
王超
;
潘金贵
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
潘金贵
.
计算机应用研究,
2004,
(05)
:71
-74+91
[3]
自然语言理解研究略述
[J].
胡俊华
论文数:
0
引用数:
0
h-index:
0
机构:
济南大学信息科学与工程学院
胡俊华
;
杨波
论文数:
0
引用数:
0
h-index:
0
机构:
济南大学信息科学与工程学院
杨波
;
李金屏
论文数:
0
引用数:
0
h-index:
0
机构:
济南大学信息科学与工程学院
李金屏
.
济南大学学报(社会科学版),
2001,
(05)
:58
-62
[4]
一种基于EM非监督训练的自组织分词歧义解决方案
[J].
论文数:
引用数:
h-index:
机构:
王伟
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学智能中心!#北京
钟义信
;
孙建
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学智能中心!#北京
孙建
;
杨力
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学智能中心!#北京
杨力
.
中文信息学报,
2001,
(02)
:38
-44
[5]
Information retrieval and artificial intelligence[J] . Karen Sparck Jones.Artificial Intelligence . 1999 (1)
←
1
→
共 5 条
[1]
汉语自动分词的研究现状与困难
[J].
张春霞
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
张春霞
;
郝天永
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
郝天永
.
系统仿真学报,
2005,
(01)
:138
-143+147
[2]
汉语自动分词研究及其在信息检索中的应用
[J].
曹倩
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
曹倩
;
丁艳
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
丁艳
;
王超
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
王超
;
潘金贵
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室
潘金贵
.
计算机应用研究,
2004,
(05)
:71
-74+91
[3]
自然语言理解研究略述
[J].
胡俊华
论文数:
0
引用数:
0
h-index:
0
机构:
济南大学信息科学与工程学院
胡俊华
;
杨波
论文数:
0
引用数:
0
h-index:
0
机构:
济南大学信息科学与工程学院
杨波
;
李金屏
论文数:
0
引用数:
0
h-index:
0
机构:
济南大学信息科学与工程学院
李金屏
.
济南大学学报(社会科学版),
2001,
(05)
:58
-62
[4]
一种基于EM非监督训练的自组织分词歧义解决方案
[J].
论文数:
引用数:
h-index:
机构:
王伟
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学智能中心!#北京
钟义信
;
孙建
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学智能中心!#北京
孙建
;
杨力
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学智能中心!#北京
杨力
.
中文信息学报,
2001,
(02)
:38
-44
[5]
Information retrieval and artificial intelligence[J] . Karen Sparck Jones.Artificial Intelligence . 1999 (1)
←
1
→