正则表达式及其在信息抽取中的应用

被引:42
作者
张静
张妍
机构
[1] 唐山师范学院教务处
关键词
正则表达式; 信息抽取;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化];
摘要
正则表达式是对一类字符串共性描述的规则,提供了一种从字符集合中搜寻特定字符串的机制。信息抽取的主要功能是从文本中抽取出特定的事实信息(factual information)。该文利用正则表示式快速匹配文本的特点,以抽取电子文档的主要信息为例,介绍了正则表达式理论以及在信息抽取中的应用。
引用
收藏
页码:3867 / 3868
页数:2
相关论文
共 3 条
[1]
编译程序设计原理.[M].金成植; 金英; 编著.高等教育出版社.2007,
[2]
C#字符串和正则表达式参考手册.[M].[法]FrancoisLiger等著;刘乐亭译;.清华大学出版社.2003,
[3]
计算理论基础.[M].(美)[H.R.刘易斯]HarryR.Lewis;(美)[C.H.帕帕季米特里乌]ChristosH.Papadimitriou著;张立昂;刘田译;.清华大学出版社.2000,