一种从医学文本中实现自动关键词抽取和筛选的技术方法

被引:4
作者
殷蜀梅 [1 ]
张智雄 [2 ]
吴振新 [2 ]
机构
[1] 北京大学医学图书馆
[2] 中国科学院国家科学图书馆
关键词
关键词抽取; 关键词筛选; BM25F; MMTx; 文本挖掘; 医学数据挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的重要关键词抽取和筛选的技术方法。该方法主要解决两个关键问题:关键词的识别和抽取、关键词重要性的衡量和筛选。以2001-2007年骨关节炎领域的文献集合为数据来源,对该技术方法进行实践尝试,并验证其实际有效性,为知识挖掘中的重要关键词抽取提供一个行之有效的途径。
引用
收藏
页码:31 / 36
页数:6
相关论文
共 4 条
[1]   基于文本分类中特征提取的领域词语聚类 [J].
刘华 .
语言文字应用, 2007, (01) :139-144
[2]   基于域加权词频法的XML文档级检索实现与评价 [J].
陆伟 ;
Stephen Robertson .
中国图书馆学报, 2006, (06) :57-60
[3]   High doses of glucosamine-HCl have detrimental effects on bovine articular cartilage explants cultured in vitro [J].
De Mattei, M ;
Pellati, A ;
Pasello, M ;
de Terlizzi, F ;
Massari, L ;
Gemmati, D ;
Caruso, A .
OSTEOARTHRITIS AND CARTILAGE, 2002, 10 (10) :816-825
[4]   TECHNOLOGY OPPORTUNITIES ANALYSIS [J].
PORTER, AL ;
DETAMPEL, MJ .
TECHNOLOGICAL FORECASTING AND SOCIAL CHANGE, 1995, 49 (03) :237-255