基于内容的教学资源搜索引擎研究

被引:0
作者
贺瑞芳
机构
[1] 东北师范大学
关键词
信息检索; 查询扩展; 自动索引; 索引压缩; 潜在语义索引; 自动文摘; 自动文本分类; 教育语义网; 分类字典; 数据挖掘;
D O I
暂无
年度学位
2005
学位类型
硕士
摘要
本文征对中小学信息化基础教育的需求特点,对教学资源的个性化搜索引擎进行了一个特色规划。随着用户群和教学资源库的不断壮大,如何人化地理解用户的查询请求,尽可能地返回反映查询请求内涵和外延的结果;如何自动化地建立高效的索引数据库和如何压缩索引;如何建设中小学基础教育的常识知识库和反映教学经验的规律库将显得尤为严峻。 本文主要研究了教学素材的智能搜索和主动推送;并在教学资源库的自动化建设方面提出为教学素材加文摘性的标注(即为教学资源库添加一个文摘系统),并将文摘作为文本分类的特征提取步将大量教学素材自动入库的想法;同时将从文摘里提取出的关键词用作自动索引,考虑到节省存储空间又进行了索引压缩的研究,以及基于内容的潜在语义索引的研究(LSI);并分析了关于构造分类字典和教育语义网的构想。 首先,在完成教学素材的智能搜索和主动推送方面,本文主要探索了利用人工和自动生成的资源进行查询扩展,并提出用教学资源联想链,亦即思维导图的方式来进行高效的查询扩展; 其次,在自动索引和索引压缩方面,本文分析了压缩的可行性及其带来的优势,并阐述了潜在语义索引在基于内容的教学资源检索中的应用; 再次,在教学资源库自动化建设方面,本文提出为教学素材加文摘性的标注(即为教学资源库添加一个文摘系统),并利用文本分类技术将大量教学素材自动入库的想法; 最后,分析了关于构造分类字典和教育语义网的构想。同时,阐述了系统特色和一些潜在的问题以及将来要做的工作。 Google 的使命是组织信息并为人们提供易于访问的最好的服务,DSJet 的使命是高效组织教学资源并为推动中小学基础教育的发展提供最好的服务。
引用
收藏
页数:63
共 3 条
[1]
Using Statistical Term Similarity for Sense Disambiguation in Cross-Language Information Retrieval [J].
Mirna Adriani .
Information Retrieval, 2000, 2 (1) :71-82
[2]
计算语言学概论.[M].俞士汶主编;.商务印书馆.2003,
[3]
同义词词林.[M].梅家驹;竺一鸣;高蕴琦;殷鸿翔 编.上海辞书出版社.1983,