学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于最大熵方法的中英文基本名词短语识别
被引:203
作者
:
论文数:
引用数:
h-index:
机构:
周雅倩
论文数:
引用数:
h-index:
机构:
郭以昆
论文数:
引用数:
h-index:
机构:
黄萱菁
论文数:
引用数:
h-index:
机构:
吴立德
机构
:
[1]
复旦大学计算机科学与工程系,复旦大学计算机科学与工程系,复旦大学计算机科学与工程系,复旦大学计算机科学与工程系上海,上海,上海,上海
来源
:
计算机研究与发展
|
2003年
/ 03期
关键词
:
最大熵;
基本名词短语;
自然语言处理;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
使用了基于最大熵的方法识别中文基本名词短语 在开放语料ChineseTreeBank上 ,只使用词性标注 ,达到了平均 87 4 3% / 88 0 9%的查全率 /准确率 由于 ,关于中文的基本名词短语识别的结果没有很好的可比性 ,又使用相同的算法 ,尝试了英文的基本名词短语识别 在英文标准语料TREEBANKⅡ上 ,开放测试达到了 93 31% / 93 0 4 %的查全率/准确率 ,极为接近国际最优水平 这既证明了此算法的行之有效 ,又表明该方法的语言无关性
引用
收藏
页码:440 / 446
页数:7
相关论文
共 6 条
[1]
基于统计的汉语组块分析
[J].
论文数:
引用数:
h-index:
机构:
刘芳
;
论文数:
引用数:
h-index:
机构:
赵铁军
;
论文数:
引用数:
h-index:
机构:
于浩
;
论文数:
引用数:
h-index:
机构:
杨沐昀
;
论文数:
引用数:
h-index:
机构:
方高林
.
中文信息学报,
2000,
(06)
:28
-32+39
[2]
汉语最长名词短语的自动识别
[J].
论文数:
引用数:
h-index:
机构:
周强
;
论文数:
引用数:
h-index:
机构:
孙茂松
;
论文数:
引用数:
h-index:
机构:
黄昌宁
.
软件学报,
2000,
(02)
:195
-201
[3]
汉语句子的组块分析体系
[J].
周强
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系!北京
周强
;
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系!北京
孙茂松
;
黄昌宁
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系!北京
黄昌宁
.
计算机学报,
1999,
(11)
:1158
-1165
[4]
汉语短语结构定界歧义类型分析及分布统计
[J].
詹卫东
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学中文系
詹卫东
;
常宝宝
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学中文系
常宝宝
;
论文数:
引用数:
h-index:
机构:
俞士汶
.
中文信息学报,
1999,
(03)
[5]
基于转换的汉语基本名词短语识别模型
[J].
论文数:
引用数:
h-index:
机构:
赵军
;
论文数:
引用数:
h-index:
机构:
黄昌宁
.
中文信息学报,
1999,
(02)
[6]
三个平面的语法观.[M].范晓著;.北京语言文化大学出版社.1996,
←
1
→
共 6 条
[1]
基于统计的汉语组块分析
[J].
论文数:
引用数:
h-index:
机构:
刘芳
;
论文数:
引用数:
h-index:
机构:
赵铁军
;
论文数:
引用数:
h-index:
机构:
于浩
;
论文数:
引用数:
h-index:
机构:
杨沐昀
;
论文数:
引用数:
h-index:
机构:
方高林
.
中文信息学报,
2000,
(06)
:28
-32+39
[2]
汉语最长名词短语的自动识别
[J].
论文数:
引用数:
h-index:
机构:
周强
;
论文数:
引用数:
h-index:
机构:
孙茂松
;
论文数:
引用数:
h-index:
机构:
黄昌宁
.
软件学报,
2000,
(02)
:195
-201
[3]
汉语句子的组块分析体系
[J].
周强
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系!北京
周强
;
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系!北京
孙茂松
;
黄昌宁
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系!北京
黄昌宁
.
计算机学报,
1999,
(11)
:1158
-1165
[4]
汉语短语结构定界歧义类型分析及分布统计
[J].
詹卫东
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学中文系
詹卫东
;
常宝宝
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学中文系
常宝宝
;
论文数:
引用数:
h-index:
机构:
俞士汶
.
中文信息学报,
1999,
(03)
[5]
基于转换的汉语基本名词短语识别模型
[J].
论文数:
引用数:
h-index:
机构:
赵军
;
论文数:
引用数:
h-index:
机构:
黄昌宁
.
中文信息学报,
1999,
(02)
[6]
三个平面的语法观.[M].范晓著;.北京语言文化大学出版社.1996,
←
1
→