文本切分知识获取及其应用

被引:8
作者
钱揖丽
郑家恒
不详
机构
[1] 山西大学计算机科学系
[2] 山西大学计算机科学系 太原
[3] 太原
关键词
分词; 知识获取; 语料库; 质量保证;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文章描述了一种从熟语料中自动获取文本切分知识的机器学习的方法。该方法从已切分标注加工的熟语料中自动获取错误的文本切分形式及其相应的上下文信息,以及正确的切分形式,形成知识库,并将获取的知识再应用到新语料的加工过程,从而进一步提高机器切分的正确率;同时,采用滚动式的方法,建造具有较高加工质量的大规模语料库。
引用
收藏
页码:63 / 64+100 +100
页数:3
相关论文
共 5 条
[1]   基于转移的音字转换纠错规则获取技术 [J].
关毅 ;
王晓龙 ;
张凯 ;
不详 .
计算机研究与发展 , 1999, (03) :13-18
[2]  
构建大规模的汉语语块库[A]. 周强,詹卫东,任海波.自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C]. 2001
[3]  
知识发现[M]. 清华大学出版社 , 史忠植著, 2002
[4]  
中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000
[5]  
高级人工智能[M]. 科学出版社 , 史忠植编著, 1998