一种统计和词性相结合的命名实体发现方法

被引:10
作者
庄明
老松杨
吴玲达
机构
[1] 国防科技大学多媒体研究开发中心
[2] 国防科技大学多媒体研究开发中心 湖南长沙
[3] 湖南长沙
关键词
命名实体; 预处理; 自增长统计; 词性;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在利用专业文献自动构建知识库的过程中 ,需要正确识别专业文献中的命名实体。文章针对命名实体识别问题 ,提出了一种以统计为主发现命名实体的方法。该方法利用切分标记将原文切分为较短的汉字串 ,采用自增长统计算法从汉字串中生成原始模式集 ,并利用统计信息和词性信息筛选出命名实体。
引用
收藏
页码:22 / 24
页数:3
相关论文
empty
未找到相关数据