潜伏语义分析的理论及其应用

被引:34
作者
桂诗春
机构
[1] 广东外语外贸大学外国语言学及应用语言学研究中心
关键词
柏拉图问题; 相似性; 归纳; 潜伏语义分析; 奇异值分解;
D O I
暂无
中图分类号
H03 [语义学、语用学、词汇学、词义学];
学科分类号
摘要
人们为什么能够在他们所得到的稀少信息基础上获得那么多的知识?对这个柏拉图问题有各种各样的回答。潜伏语义分析(Latent Semantic Analysis, LSA)使用了奇异值分解的线性代数的方法说明减少维数有助于揭示语义的潜伏关系,本文举了两个事例来加以说明:一个是对包括了计算机人机对话和数学图论两个内容的九篇文章题目进行分析,两个原来无甚联系的词经处理后却有很高的相关(.90)。另一个是对中国学生英语失误的关系的分析,减少维数后能更好地解释五种水平不同的学习者的拼写失误、用词失误和句法结构的发展趋势。LSA在文本处理方面有广泛的应用范围。
引用
收藏
页码:76 / 84
页数:9
相关论文
共 3 条
  • [1] 新编心理语言学[M]. 上海外语教育出版社 , 桂诗春编著, 2000
  • [2] Developing Summarization Skills through the Use of LSA-Based Feedback[J] . Eileen Kintsch,Dave Steinhart,Gerry Stahl,LSA Research Group LSA Research Group,Cindy Matthews,Ronald Lamb.Interactive Learning Environments . 2000 (2)
  • [3] An introduction to latent semantic analysis[J] . Thomas K. Landauer,Peter W. Foltz,Darrell Laham.Discourse Processes . 1998 (2-3)