一种基于粗糙集的大规模语料库语言学知识发现模型

被引：1

作者：

陈清才

王晓龙

赵健

机构：

[1] 哈尔滨工业大学计算机科学与技术学院

来源：

计算机工程与科学 | 2004年 / 05期

关键词：

语言学知识发现; 粗糙集; 自动排歧; 汉语音字转换;

D O I：

暂无

中图分类号：

TP391.12 [];

学科分类号：

摘要：

文中首先通过语言学特征表来对文本信息进行结构化处理 ,同时实现了对远距离约束的表示 ;然后借助于面向个体的数据泛化算法来去除语言学特征表中的冗余信息 ,并利用规则抽取算法过滤特征表中不一致的部分 ,从而为相应的自然语言处理任务建立了一个一致、高效的规则库。最后 ,本文研究了模型在汉语词义排歧以及音字转换中的应用 ,在采用了动态规则平滑算法后 ,分别获得了 0 .93和 0 .95的判别精度以及 0 .92和 0 .89的覆盖率 ,这一结果显示模型具有很高的实用性

引用

页码：56 / 61

页数：6