学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于种子自扩展的命名实体关系抽取方法
被引:24
作者
:
何婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学与技术系
何婷婷
徐超
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学与技术系
徐超
李晶
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学与技术系
李晶
赵君喆
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学与技术系
赵君喆
机构
:
[1]
华中师范大学计算机科学与技术系
来源
:
计算机工程
|
2006年
/ 21期
关键词
:
命名实体;
关系抽取;
自学习;
D O I
:
暂无
中图分类号
:
TP182 [专家系统、知识工程];
学科分类号
:
1111 ;
摘要
:
命名实体间关系的抽取是信息抽取中的一个重要研究问题,该文提出了一种从大量的文本集合中自动抽取命名实体间关系的方法,找出了所有出现在同一句子内、词语之间的距离在一定范围之内的命名实体对,把它们的上下文转化成向量。手工选取少量具有抽取关系的命名实体对,把它们作为初始关系的种子集合,通过自学习,关系种子集合不断扩展。通过计算命名实体对和关系种子之间的上下文相似度来得到所要抽取的命名实体对。通过扩展关系种子集合的方法,抽取的召回率和准确率都得到了提高。该方法在对《人民日报》语料库的测试中,取得了加权平均值F-Score为0.813的效果。
引用
收藏
页码:183 / 184+193 +193
页数:3
相关论文
共 2 条
[1]
统计自然语言处理基础.[M].(美)ChristopherD.Manning;(德)HinrichSchutze著;苑春法等译;.电子工业出版社.2005,
[2]
基于向量空间模型中义项词语的无导词义消歧
[J].
鲁松
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
鲁松
;
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
白硕
;
黄雄
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
黄雄
.
软件学报,
2002,
(06)
:1082
-1089
←
1
→
共 2 条
[1]
统计自然语言处理基础.[M].(美)ChristopherD.Manning;(德)HinrichSchutze著;苑春法等译;.电子工业出版社.2005,
[2]
基于向量空间模型中义项词语的无导词义消歧
[J].
鲁松
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
鲁松
;
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
白硕
;
黄雄
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
黄雄
.
软件学报,
2002,
(06)
:1082
-1089
←
1
→