python中通过预先编译正则表达式提高效率
(编辑:jimmy 日期: 2024/11/20 浏览:3 次 )
前言
在re的正则表达式模块里,可以通过模块的方式来访问正则表达式,但是如果重复多次地使用正则表达式,最好是使用compile函数把正则表达式编译成对象RegexObject,这样会大大地提高搜索的效率,因为基于非编译方式访问时,是使用模块里的一小块缓冲来进行的。
如下面的例子:
import re # Precompile the patterns regexes = [ re.compile(p) for p in ['this', 'that'] ] text = 'http://blog.csdn.net/caimouse is great blog, this is my blog.' print('Text: {!r}\n'.format(text)) for regex in regexes: print('Seeking "{}" ->'.format(regex.pattern), end=' ') if regex.search(text): print('match!') else: print('no match')
结果输出如下:
Text: 'http://blog.csdn.net/caimouse is great blog, this is my blog.' Seeking "this" -> match! Seeking "that" -> no match
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对的支持。
下一篇:Python开发中爬虫使用代理proxy抓取网页的方法示例