基于《知网》的中文信息结构抽取研究

被引：4

作者：

尤昉

李涓子

王作英

不详

机构：

[1] 清华大学电子工程系

[2] 清华大学计算机科学与技术系

[3] 清华大学电子工程系北京

[4] 北京

来源：

计算机工程与应用 | 2002年 / 18期

关键词：

知网; 中文信息结构; 部分依存分析器; 规则;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

文章提出了一种在真实文本中抽取中文信息结构的方法—利用大规模基于语义依存关系的语料库对《知网》的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从而从真实文本中最大限度地抽取符合知网中文信息结构定义的短语。该研究除了对将要建立的基于语义依存关系的语言模型是个有益的补充外,对于文本理解、对话系统甚至语音合成中的重音预测、韵律建模等等方面都有十分广阔的应用前景。

引用

页码：56 / 58

页数：3