基于多维尺度模型的潜在主题可视化研究

被引:4
作者
赵一鸣 [1 ]
张进 [2 ]
黎苑楚 [3 ]
机构
[1] 武汉大学信息资源研究中心
[2] 美国威斯康辛大学密尔沃基分校信息研究学院
[3] 湖北省科技厅
关键词
潜在主题; 可视化; 多维尺度模型; 数据编码;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据库内容结构分析把共词分析方法应用于全文主题发现,但事先选定种子词和统计共现次数等步骤导致该方法会遗漏很多重要的词汇组合和潜在主题。本文提出使用词汇集聚理论作为潜在主题可视化的理论基础,跳过事先选定种子词和统计共现矩阵的步骤,把词条表示在转置的向量空间中,通过多维尺度模型(MDS)算法把词条在转置向量空间中的邻近关系投影到三维空间图上,通过词汇的空间聚类来发现和表示潜在主题;引入数据编码的方法来克服MDS可视空间容量的局限,并设计了邻近矩阵、质心邻近矩阵、属性叠加邻近矩阵及三个层次的方法流程。最后,成功地将三个层次的潜在主题可视化的方法流程应用于计算机应用服务业上市公司的风险识别。
引用
收藏
页码:45 / 54
页数:10
相关论文
共 13 条
  • [1] Indexing by latent semantic analysis. Deerwester S,Dumais S T,Landauer TK,et al. Journal of the American Society for Information Science . 1990
  • [2] Lexical cohesion computed by thesaural relations as an indicator of the structure of text. Jane Morris,Graeme Hirst. Computational Linguistics . 1991
  • [3] 基于自组织映射的期刊主题可视化组织[J]. 安璐,李纲.  报学报. 2011 (02)
  • [4] 国外知识管理研究范式——以共词分析为方法
    张勤
    马费成
    [J]. 管理科学学报 , 2007, (06) : 65 - 75
  • [5] Fish oil, Raynaud’s syndrome, and undiscovered public knowledge. Swanson D R. Perspectives in biology and medicine . 1986
  • [6] Text mining using database tomography and bibliometrics: A review[J] . Ronald N Kostoff,Darrell Ray Toothman,Henry J Eberhart,James A Humenik. &nbspTechnological Forecasting & Social Change . 2001 (3)
  • [7] 基于共词分析的文本主题词聚类与主题发现
    王小华
    徐宁
    谌志群
    [J]. 情报科学 , 2011, (11) : 1621 - 1624
  • [8] 基于词共现的社会化标签研究热点可视化分析[J]. 卢小宾,孟玺,张进.  报学报. 2012 (02)
  • [9] Coding Qualitative Data. Lockyer,Sharon. The Sage Encyclopedia of Social Science Research Methods . 2004
  • [10] Modern multidimensional scaling;Theory and applications. Borg I,Groenen P. . 2005