一种高稳定性词汇共现模型

被引:2
作者
乔亚男
齐勇
侯迪
机构
[1] 西安交通大学计算机科学与技术系
基金
高等学校博士学科点专项科研基金;
关键词
项场; 词汇共现; 窗口内稳定性; 数据集稳定性;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
针对传统词汇共现模型存在的缺乏理论基础和稳定性欠佳等问题,提出了一种基于项场的高稳定性词汇共现模型.借鉴经典物理学中场的概念给出了项场的定义,其中项是语言的基本单位,是概念的抽象描述,而项场则是项在文档中的影响范围.在此基础上,引入量子场论将项与项的相关度类比为项场的叠加,由此给出了项与项之间距离和相关度的函数关系,并用其建立了词汇共现模型.实验结果证明,在小距离的情况下,所提模型中项的相关度大体呈常数,具有一定的窗口内稳定性,而同范畴的项对相关度振幅只有对照模型中最小振幅的26%,表明它具有较好的数据集稳定性.
引用
收藏
页码:24 / 27
页数:4
相关论文
共 2 条
  • [1] 基于词汇吸引与排斥模型的共现词提取
    郭锋
    李绍滋
    周昌乐
    林颖
    李胜睿
    [J]. 中文信息学报, 2004, (06) : 16 - 22
  • [2] 自然语言处理中词语上下文有效范围的定量描述
    鲁松
    白硕
    [J]. 计算机学报, 2001, (07) : 742 - 747