学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于机械分词与统计学的新词识别研究
被引:6
作者
:
论文数:
引用数:
h-index:
机构:
梁刚
机构
:
[1]
南京农业大学信息科技学院江苏
来源
:
情报理论与实践
|
2005年
/ 05期
关键词
:
信息处理技术;
自动分词/新词识别;
未登录词;
D O I
:
10.16353/j.cnki.1000-7490.2005.05.008
中图分类号
:
G254 [文献标引与编目];
学科分类号
:
摘要
:
分词是所有中文信息处理工作的基础,也是汉语信息处理的难点之一,如何识别文中出现的新词更成为当前研究的重点之一。本文综合利用几种传统的机械分词方法,加上统计学的方法,提出了一种从文献中抽取新词的新方法。
引用
收藏
页码:475 / 477
页数:3
相关论文
共 6 条
[1]
汉语自动分词研究评述
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
孙茂松
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
邹嘉彦
[J].
当代语言学,
2001,
(01)
: 22
-
32+77
[2]
自动分词中未登录词问题的一揽子解决方案
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
北京语言文化大学
陈小荷
[J].
语言文字应用,
1999,
(03)
: 103
-
109
[3]
最大概率分词问题及其解法
论文数:
引用数:
h-index:
机构:
刘挺
吴岩
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!
吴岩
王开铸
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!
王开铸
[J].
哈尔滨工业大学学报,
1998,
(06)
: 37
-
41
[4]
中文姓名的自动辨识
孙茂松,黄昌宁,高海燕,方捷
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学系,烟台大学计算机应用系
孙茂松,黄昌宁,高海燕,方捷
[J].
中文信息学报,
1995,
(02)
: 16
-
27
[5]
信息检索理论与技术[M]. - 科学技术文献出版社 , 苏新宁主编, 2004
[6]
计算语言学进展与应用 .2 王开铸,李俊杰. 清华大学出版社 . 1995
←
1
→
共 6 条
[1]
汉语自动分词研究评述
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
孙茂松
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
邹嘉彦
[J].
当代语言学,
2001,
(01)
: 22
-
32+77
[2]
自动分词中未登录词问题的一揽子解决方案
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
北京语言文化大学
陈小荷
[J].
语言文字应用,
1999,
(03)
: 103
-
109
[3]
最大概率分词问题及其解法
论文数:
引用数:
h-index:
机构:
刘挺
吴岩
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!
吴岩
王开铸
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!
王开铸
[J].
哈尔滨工业大学学报,
1998,
(06)
: 37
-
41
[4]
中文姓名的自动辨识
孙茂松,黄昌宁,高海燕,方捷
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学系,烟台大学计算机应用系
孙茂松,黄昌宁,高海燕,方捷
[J].
中文信息学报,
1995,
(02)
: 16
-
27
[5]
信息检索理论与技术[M]. - 科学技术文献出版社 , 苏新宁主编, 2004
[6]
计算语言学进展与应用 .2 王开铸,李俊杰. 清华大学出版社 . 1995
←
1
→