脚本专栏 
首页 > 脚本专栏 > 浏览文章

python使用自定义user-agent抓取网页的方法

(编辑:jimmy 日期: 2024/11/18 浏览:3 次 )

本文实例讲述了python使用自定义user-agent抓取网页的方法。分享给大家供大家参考。具体如下:

下面python代码通过urllib2抓取指定的url的内容,并且使用自定义的user-agent,可防止网站屏蔽采集器

import urllib2
req = urllib2.Request('http://192.168.1.2/')
req.add_header('User-agent', 'Mozilla 5.10')
res = urllib2.urlopen(req)
html = res.read()

希望本文所述对大家的Python程序设计有所帮助。

上一篇:使用Python的Twisted框架编写简单的网络客户端
下一篇:python使用urlparse分析网址中域名的方法