PHP 正则表达式效率贪婪、非贪婪与回溯分析(推荐)

(编辑：jimmy 日期: 2026/6/16 浏览：3 次 )

先扫盲一下什么是正则表达式的贪婪，什么是非贪婪？或者说什么是匹配优先量词，什么是忽略优先量词？

好吧，我也不知道概念是什么，来举个例子吧。

某同学想过滤之间的内容，那是这么写正则以及程序的。

$str = preg_replace('%<script>.+"htmlcode">

$str = '<script<script>alert(document.cookie)</scriptalert(document.cookie)</script>'; 


那么经过上面的程序处理，其结果为


$str = '<script<script>alert(document.cookie)</scriptalert(document.cookie)</script>'; 
$str = preg_replace('%<script>.+"htmlcode">

$str = '<script<script>alert(document.cookie)</scriptalert(document.cookie)</script>'; 
$str = preg_replace('%<script>.+</script>%i','',$str);//非贪婪 
print_r($str); 
//$str 输出为 <script 只有这些了，好像还是不太合适，哈，您知道如何重写那个正则吗？


以上为贪婪，非贪婪的区别介绍。下面，聊下贪婪、非贪婪引起的回溯问题。先看个小例子。
正则表达式为\w*(\d+)，字符串为cfc456n，那么，这个正则匹配的$1是多少？？
如果您回答是 456,那么，恭喜你，回答错了，其结果不是456，而是6，您知道为什么吗？
CFC4N来解释一下，当正则引擎用正则\w*(\d+)去匹配字符串cfc456n时，会先用\w*去匹配字符串cfc456n，首先，\w*会匹配字符串cfc456n的所有字符，然后再交给\d+去匹配剩下的字符串，而剩下的没了，这时，\w*规则会不情愿的吐出一个字符，给\d+去匹配，同时，在吐出字符之前，记录一个点，这个点，就是用于回溯的点，然后\d+去匹配n，发现并不能匹配成功，会再次要求\w*再吐出一个字符，\w*会先再次记录一个回溯的点，再吐出一个字符。这时，\w* 匹配的结果只有cfc45了，已经吐出6n了，\d+再去匹配6，发现匹配成功，则会通知引擎，匹配成功了，就直接显示出来了。所以，(\d+)的结果是6，而不是456。
当上面的正则表达式改为 \w*"htmlcode">

$reg = "/<script>.*"; 
$str = "<script>********</script>"; //长度大于100014 
$ret = preg_repalce($reg, "", $str); //返回NULL 


其原因就是回溯太多了，直到造成耗尽栈空间爆栈。
再来看个例子。
字符串


$str = '<script>123456</script>'; 


正则表达式为


$strRegex1 = '%<script>.+<\/script>%'; 
$strRegex2 = '%<script>.+?<\/script>%'; 
$strRegex3 = '%<script>(?:(?!<\/script>).)+<\/script>%'; 


以上所述是小编给大家介绍的PHP 正则表达式效率 贪婪、非贪婪与回溯分析，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对网站的支持！

上一篇：详解基于Linux下正则表达式（基本正则和扩展正则命令使用实例）
下一篇：jQuery正则表达式的使用方法步骤详解

一句话新闻

一文看懂荣耀MagicBook Pro 16

荣耀猎人回归！七大亮点看懂不只是轻薄本，更是游戏本的MagicBook Pro 16.
人们对于笔记本电脑有一个固有印象：要么轻薄但性能一般，要么性能强劲但笨重臃肿。然而，今年荣耀新推出的MagicBook Pro 16刷新了人们的认知——发布会上，荣耀宣布猎人游戏本正式回归，称其继承了荣耀 HUNTER 基因，并自信地为其打出“轻薄本，更是游戏本”的口号。
众所周知，寻求轻薄本的用户普遍更看重便携性、外观造型、静谧性和打字办公等用机体验，而寻求游戏本的用户则普遍更看重硬件配置、性能释放等硬核指标。把两个看似难以相干的产品融合到一起，我们不禁对它产生了强烈的好奇：作为代表荣耀猎人游戏本的跨界新物种，它究竟做了哪些平衡以兼顾不同人群的各类需求呢？

友情链接:杰晶网络 DDR爱好者之家南强小屋黑松山资源网白云城资源网 SiteMap

PHP 正则表达式效率 贪婪、非贪婪与回溯分析(推荐)

PHP 正则表达式效率贪婪、非贪婪与回溯分析(推荐)