脚本专栏 
首页 > 脚本专栏 > 浏览文章

python urllib中的编码处理示例

(编辑:jimmy 日期: 2024/11/16 浏览:3 次 )

复制代码 代码如下:
> import urllib
> data = '丽江'
> print data
丽江
> data
'\xe4\xb8\xbd\xe6\xb1\x9f'
> urllib.quote(data)
'%E4%B8%BD%E6%B1%9F'

那我们想转回去呢?
复制代码 代码如下:
> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
丽江

不同的编码格式对urllib的结果页是有影响的,百度的是gbk,其他的一般网站比如google就是utf8的。所以可以用下列语句实现。
复制代码 代码如下:
> import sys,urllib
> s = '丽江'
> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>

这里的 sys.stdin.encoding 是读取当前环境的编码,这样写的话可移植性高,winnt和xunix都可以用。当然你如果看不惯,也可以替换为自己的环境编码如utf8等。

上一篇:在EditPlus中配置Perl开发编译环境
下一篇:Perl List::Util模块使用实例
一句话新闻
微软与英特尔等合作伙伴联合定义“AI PC”:键盘需配有Copilot物理按键
几个月来,英特尔、微软、AMD和其它厂商都在共同推动“AI PC”的想法,朝着更多的AI功能迈进。在近日,英特尔在台北举行的开发者活动中,也宣布了关于AI PC加速计划、新的PC开发者计划和独立硬件供应商计划。
在此次发布会上,英特尔还发布了全新的全新的酷睿Ultra Meteor Lake NUC开发套件,以及联合微软等合作伙伴联合定义“AI PC”的定义标准。