基于大规模语料库的句法模式匹配研究

被引:9
作者
张亮
陈家骏
机构
[1] 南京大学计算机软件新技术国家重点实验室
关键词
计算机应用; 中文信息处理; 句法分析; 模式匹配; 句法树库;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
通过大量记录的正确处理实例的分析过程和结果,在句法分析时,搜寻近似实例或片段,匹配相似语言结构和分析过程,这样的句法分析体现了"语言分析依赖经验"的思想。基于这样的思想,本文提出了一种基于模式匹配的句法分析的方法,即从大规模标注语料树库中抽取出蕴含的句法模式,构建模式、子模式及其规约库,句法分析的过程转化为模式匹配和局部模式转换的过程。实验表明句法分析的各项指标都比较理想,尤其是处理效率很高,平均句耗时0.46秒(CPU为Intel双核2.8G,内存为1G)。
引用
收藏
页码:31 / 35
页数:5
相关论文
共 7 条
  • [1] 引入标点处理的层次化汉语长句句法分析方法
    李幸
    宗成庆
    [J]. 中文信息学报, 2006, (04) : 8 - 15
  • [2] 基于网络的中文问答系统及信息抽取算法研究
    崔桓
    蔡东风
    苗雪雷
    [J]. 中文信息学报, 2004, (03) : 24 - 31
  • [3] 基于DOP的汉语句法分析技术
    张玥杰
    朱靖波
    张跃
    姚天顺
    [J]. 中文信息学报, 2000, (01) : 13 - 21
  • [4] 汉语结构优先关系的自动获取
    周强
    黄昌宁
    [J]. 软件学报, 1999, (02) : 38 - 43
  • [5] 自然语言理解[M]. 清华大学出版社 , 姚天顺等编著, 2002
  • [6] 人工智能原理[M]. 清华大学出版社 , 石纯一等编著, 1993
  • [7] Head-Driven Statistical Models for Natural Language Parsing .2 M.Collins. The University of Pennsylvania . 1999