学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
中医诊断古文的词性标注与特征重组
被引:11
作者
:
论文数:
引用数:
h-index:
机构:
王国龙
[
1
]
论文数:
引用数:
h-index:
机构:
杜建强
[
1
]
郝竹林
论文数:
0
引用数:
0
h-index:
0
机构:
江西中医药大学计算机学院
江西中医药大学计算机学院
郝竹林
[
1
]
程春雷
论文数:
0
引用数:
0
h-index:
0
机构:
江西中医药大学计算机学院
江西中医药大学计算机学院
程春雷
[
1
]
论文数:
引用数:
h-index:
机构:
蔡良俊
[
2
]
论文数:
引用数:
h-index:
机构:
张鑫
[
1
]
机构
:
[1]
江西中医药大学计算机学院
[2]
江西中医药大学临床医学院
来源
:
计算机工程与设计
|
2015年
/ 36卷
/ 03期
关键词
:
中医诊断古文;
键值对模型;
隐马尔可夫模型;
词性标注;
特征重组;
D O I
:
10.16208/j.issn1000-7024.2015.03.054
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
中医诊断古文存在大量单音词,使用通用切词技术处理,结果是单个的分词结果,不能构成一个完整的诊断词汇。对此,设计一个基于键值对模型的中医诊断词性标记集,提出基于词汇联系的隐马尔可夫模型(HMM),进行词性标注,结合词法分析,采用移进归约算法进行特征重组,生成中医诊断词汇。实验结果表明,改进的HMM的词性标注准确率在训练集和测试集中分别提高了2.58%和1.02%,特征重组结果是完整独立的诊断词汇,方便中医人员进行诊断分析,适合构成向量空间模型的特征。
引用
收藏
页码:835 / 841
页数:7
相关论文
共 11 条
[1]
基于改进的隐马尔科夫模型的词性标注方法
袁里驰
论文数:
0
引用数:
0
h-index:
0
机构:
江西财经大学信息学院数据与知识工程江西省重点实验室
袁里驰
[J].
中南大学学报(自然科学版),
2012,
43
(08)
: 3053
-
3057
[2]
基于历史模型的蒙古文自动词性标注研究
论文数:
引用数:
h-index:
机构:
赵建东
高光来
论文数:
0
引用数:
0
h-index:
0
机构:
内蒙古大学计算机学院
高光来
论文数:
引用数:
h-index:
机构:
飞龙
[J].
中文信息学报,
2013,
(05)
: 156
-
159+165
[3]
融合音节特征的最大熵藏文词性标注研究
于洪志
论文数:
0
引用数:
0
h-index:
0
机构:
西北民族大学
西北民族大学
于洪志
李亚超
论文数:
0
引用数:
0
h-index:
0
机构:
西北民族大学
西北民族大学
李亚超
汪昆
论文数:
0
引用数:
0
h-index:
0
机构:
西北民族大学
汪昆
冷本扎西
论文数:
0
引用数:
0
h-index:
0
机构:
西北民族大学
西北民族大学
冷本扎西
[J].
中文信息学报,
2013,
(05)
: 160
-
165
[4]
上古汉语分词及词性标注语料库的构建——以《淮南子》为范例
留金腾
论文数:
0
引用数:
0
h-index:
0
机构:
香港城市大学中文翻译及语言学系
香港理工大学香港专上学院
香港城市大学中文翻译及语言学系
留金腾
宋彦
论文数:
0
引用数:
0
h-index:
0
机构:
香港城市大学中文翻译及语言学系
香港城市大学中文翻译及语言学系
宋彦
夏飞
论文数:
0
引用数:
0
h-index:
0
机构:
华盛顿大学语言学系
香港城市大学中文翻译及语言学系
夏飞
[J].
中文信息学报,
2013,
27
(06)
: 6
-
15+81
[5]
POS tagging using HMM and rule-based chunking. Ekbal A,Mondal S,Bandyopadhyay S. The Proceedings of SPSAL . 2007
[6]
隐马尔可夫模型在自然语言处理中的应用
论文数:
引用数:
h-index:
机构:
于江德
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学技术学院
樊孝忠
尹继豪
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学技术学院
尹继豪
[J].
计算机工程与设计,
2007,
(22)
: 5514
-
5516
[7]
基于规则和统计的日语分词和词性标注的研究
论文数:
引用数:
h-index:
机构:
姜尚仆
论文数:
引用数:
h-index:
机构:
陈群秀
[J].
中文信息学报,
2010,
(01)
: 117
-
122
[8]
HMM在自然语言处理领域中的应用研究
韩普
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学教育科学学院
韩普
论文数:
引用数:
h-index:
机构:
姜杰
[J].
计算机技术与发展,
2010,
20
(02)
: 245
-
248+252
[9]
中医古籍数字化与知识挖掘
论文数:
引用数:
h-index:
机构:
刘毅
[J].
图书馆工作与研究,
2010,
(12)
: 92
-
94
[10]
改进的HMM应用于哈萨克语词性标注
论文数:
引用数:
h-index:
机构:
侯呈风
古丽拉·阿东别克
论文数:
0
引用数:
0
h-index:
0
机构:
新疆大学信息科学与工程学院
古丽拉·阿东别克
[J].
计算机工程与应用,
2010,
46
(36)
: 147
-
149
←
1
2
→
共 11 条
[1]
基于改进的隐马尔科夫模型的词性标注方法
袁里驰
论文数:
0
引用数:
0
h-index:
0
机构:
江西财经大学信息学院数据与知识工程江西省重点实验室
袁里驰
[J].
中南大学学报(自然科学版),
2012,
43
(08)
: 3053
-
3057
[2]
基于历史模型的蒙古文自动词性标注研究
论文数:
引用数:
h-index:
机构:
赵建东
高光来
论文数:
0
引用数:
0
h-index:
0
机构:
内蒙古大学计算机学院
高光来
论文数:
引用数:
h-index:
机构:
飞龙
[J].
中文信息学报,
2013,
(05)
: 156
-
159+165
[3]
融合音节特征的最大熵藏文词性标注研究
于洪志
论文数:
0
引用数:
0
h-index:
0
机构:
西北民族大学
西北民族大学
于洪志
李亚超
论文数:
0
引用数:
0
h-index:
0
机构:
西北民族大学
西北民族大学
李亚超
汪昆
论文数:
0
引用数:
0
h-index:
0
机构:
西北民族大学
汪昆
冷本扎西
论文数:
0
引用数:
0
h-index:
0
机构:
西北民族大学
西北民族大学
冷本扎西
[J].
中文信息学报,
2013,
(05)
: 160
-
165
[4]
上古汉语分词及词性标注语料库的构建——以《淮南子》为范例
留金腾
论文数:
0
引用数:
0
h-index:
0
机构:
香港城市大学中文翻译及语言学系
香港理工大学香港专上学院
香港城市大学中文翻译及语言学系
留金腾
宋彦
论文数:
0
引用数:
0
h-index:
0
机构:
香港城市大学中文翻译及语言学系
香港城市大学中文翻译及语言学系
宋彦
夏飞
论文数:
0
引用数:
0
h-index:
0
机构:
华盛顿大学语言学系
香港城市大学中文翻译及语言学系
夏飞
[J].
中文信息学报,
2013,
27
(06)
: 6
-
15+81
[5]
POS tagging using HMM and rule-based chunking. Ekbal A,Mondal S,Bandyopadhyay S. The Proceedings of SPSAL . 2007
[6]
隐马尔可夫模型在自然语言处理中的应用
论文数:
引用数:
h-index:
机构:
于江德
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学技术学院
樊孝忠
尹继豪
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学技术学院
尹继豪
[J].
计算机工程与设计,
2007,
(22)
: 5514
-
5516
[7]
基于规则和统计的日语分词和词性标注的研究
论文数:
引用数:
h-index:
机构:
姜尚仆
论文数:
引用数:
h-index:
机构:
陈群秀
[J].
中文信息学报,
2010,
(01)
: 117
-
122
[8]
HMM在自然语言处理领域中的应用研究
韩普
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学教育科学学院
韩普
论文数:
引用数:
h-index:
机构:
姜杰
[J].
计算机技术与发展,
2010,
20
(02)
: 245
-
248+252
[9]
中医古籍数字化与知识挖掘
论文数:
引用数:
h-index:
机构:
刘毅
[J].
图书馆工作与研究,
2010,
(12)
: 92
-
94
[10]
改进的HMM应用于哈萨克语词性标注
论文数:
引用数:
h-index:
机构:
侯呈风
古丽拉·阿东别克
论文数:
0
引用数:
0
h-index:
0
机构:
新疆大学信息科学与工程学院
古丽拉·阿东别克
[J].
计算机工程与应用,
2010,
46
(36)
: 147
-
149
←
1
2
→