Python读取网页内容的方法

(编辑：jimmy 日期: 2024/11/18 浏览：3 次 )

本文实例讲述了Python读取网页内容的方法。分享给大家供大家参考。具体如下：

import urllib2
#encoding = utf-8
class Crawler:
  def main(self):
    #req = urllib2.Request('http://www.baidu.com/')
    #req.add_header('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:5.0)')
    #urllib2.socket.setdefaulttimeout(10) # 超时10秒
    #page = urllib2.urlopen(req)
    page = urllib2.urlopen('http://www.google.com', timeout=10)
    data = page.read()
    print data
    print len(data) #计算字节长度
if __name__ == '__main__':
  me=Crawler()
  me.main()

希望本文所述对大家的Python程序设计有所帮助。

上一篇：Python统计文件中去重后uuid个数的方法
下一篇：Python利用正则表达式匹配并截取指定子串及去重的方法