关键词组鉴别的新方法——双向型高搭配力度ngram链

被引:1
作者
苗永
汪宏
于洋
机构
[1] 河南师范大学
关键词
ngram; 搭配; 中国英语语料库; 关键词组; 双向型高搭配力度ngram链;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
候选关键词组鉴别是关键词组自动化提取的第一步,在这个过程中采用了一种新的数据结构:双向型高搭配力度ngram链.这种链式结构以搭配力度高者优先为延伸(生长)原则,可以向左右2个方向延伸(生长).经过对得到的ngrams消除冗余,可以得到一些结构比较规范的ngrams,可以作为文章的候选关键词组.
引用
收藏
页码:118 / 121
页数:4
相关论文
共 3 条
  • [1] 中国学习者英语语料库.[M].桂诗春;杨惠中编著;.上海外语教育出版社.2003,
  • [2] 外国语言学及应用语言学统计方法.[M].马广惠主编;.西北农林科技大学出版社.2003,
  • [3] 语料库语言学导论.[M].卫乃兴等编著;杨惠中主编;.上海外语教育出版社.2002,