共 13 条
基于混合策略的公众健康领域新词识别方法研究
被引:2
作者:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

陈松景
论文数: 0 引用数: 0
h-index: 0
机构: 中国医学科学院医学信息研究所
机构:
[1] 中国医学科学院医学信息研究所
来源:
关键词:
互联网查询数据;
公众健康术语;
N-Gram;
实体识别;
D O I:
10.13266/j.issn.0252-3116.2015.23.017
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
[目的 /意义]从互联网公众查询数据中发现公众使用的健康术语,为建立公众健康术语与医学专业术语的映射提供基础,进而优化健康类知识服务平台的知识组织与管理性能。[方法 /过程]设计规则与NGram相结合的健康术语新词的识别模型,采集公众查询数据,开展实验验证,通过多次实验,逐步完善过滤语料集合,结合人工判读,不断优化并验证方案的有效性。[结果 /结论]从互联网中公众提问句抽取出规则,结合统计算法进行公众使用的健康类新词抽取,该技术方法对识别公众使用的健康术语具有一定的通用性,能为建立公众术语与医学术语映射提供数据基础。实验结果表明:基于规则进行公众日志数据预处理,能为后续的实验方案提供较好的预处理文本,而采用N-Gram及各种过滤规则结合的术语识别方法,能较好地识别发现短文本中的新词。
引用
收藏
页码:115 / 123
页数:9
相关论文
共 13 条
- [1] 规则与统计相结合的中文新词识别研究[J]. 嘉兴学院学报, 2014, 26 (06) : 124 - 130王琳琳论文数: 0 引用数: 0 h-index: 0机构: 枣庄学院信息科学与工程学院
- [2] CRF与规则相结合的医学病历实体识别[J]. 计算机应用研究, 2015, 32 (04) : 1082 - 1086栗伟论文数: 0 引用数: 0 h-index: 0机构: 东北大学医学影像计算教育部重点实验室 东北大学医学影像计算教育部重点实验室赵大哲论文数: 0 引用数: 0 h-index: 0机构: 东北大学医学影像计算教育部重点实验室 东北大学信息科学与工程学院 东北大学医学影像计算教育部重点实验室李博论文数: 0 引用数: 0 h-index: 0机构: 东北大学医学影像计算教育部重点实验室 东北大学医学影像计算教育部重点实验室彭新茗论文数: 0 引用数: 0 h-index: 0机构: 东软集团股份有限公司 东北大学医学影像计算教育部重点实验室论文数: 引用数: h-index:机构:
- [3] 基于CRF和规则的中文医疗机构名称识别[J]. 计算机应用与软件, 2014, 31 (03) : 159 - 162+198论文数: 引用数: h-index:机构:王石论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所 江苏科技大学计算机科学与工程学院论文数: 引用数: h-index:机构:
- [4] 基于N-Gram的专业领域中文新词识别研究[J]. 现代图书情报技术, 2012, (02) : 41 - 47段宇锋论文数: 0 引用数: 0 h-index: 0机构: 华东师范大学商学院论文数: 引用数: h-index:机构:
- [5] 统计与规则相结合的术语抽取[J]. 沈阳航空航天大学学报, 2011, 28 (05) : 71 - 74唐涛论文数: 0 引用数: 0 h-index: 0机构: 沈阳航空航天大学知识工程研究中心论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [6] 电子病历中命名实体的智能识别[J]. 中国生物医学工程学报, 2011, 30 (02) : 256 - 262叶枫论文数: 0 引用数: 0 h-index: 0机构: 浙江工业大学经贸管理学院 浙江工业大学经贸管理学院陈莺莺论文数: 0 引用数: 0 h-index: 0机构: 浙江工业大学经贸管理学院 浙江工业大学经贸管理学院周根贵论文数: 0 引用数: 0 h-index: 0机构: 浙江工业大学经贸管理学院 浙江工业大学经贸管理学院李昊旻论文数: 0 引用数: 0 h-index: 0机构: 浙江大学生物医学工程与仪器科学学院 浙江工业大学经贸管理学院李莹论文数: 0 引用数: 0 h-index: 0机构: 浙江大学生物医学工程与仪器科学学院 浙江工业大学经贸管理学院
- [7] 中文新词识别技术综述[J]. 计算机科学, 2010, 37 (03) : 6 - 10+16张海军论文数: 0 引用数: 0 h-index: 0机构: 中国科学技术大学计算机科学与技术学院 新疆师范大学计算机系 中国科学技术大学计算机科学与技术学院论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [8] 面向短文本的命名实体识别[J]. 计算机应用, 2009, 29 (01) : 143 - 145+171论文数: 引用数: h-index:机构:樊兴华论文数: 0 引用数: 0 h-index: 0机构: 重庆邮电大学计算机科学与技术研究所
- [9] 一种基于大规模语料的新词识别方法[J]. 计算机工程与应用, 2007, (21) : 157 - 159论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:张华平论文数: 0 引用数: 0 h-index: 0机构: 中国科学院计算技术研究所论文数: 引用数: h-index:机构:
- [10] 基于构词法的网络新词自动识别初探[J]. 山西大学学报(自然科学版), 2002, (02) : 115 - 119郑家恒论文数: 0 引用数: 0 h-index: 0机构: 山西大学计算机科学系李文花论文数: 0 引用数: 0 h-index: 0机构: 山西大学计算机科学系