20150113073827 guodepei

概念

unicode是内部编码，utf8、gb2312是外部编码

encode 和 decode

输出、网络传输、打印，要把unicode encode成某种编码方式

print s.encode('utf8')
content.encode('utf-8')

unicode(str,'gb2312')与str.decode('gb2312')是一样的，都是将gb2312编码的str转为unicode编码

代码中字符串的默认编码与代码文件本身的编码一致。如：s='中文' 如果是在utf8的文件中，该字符串就是utf8编码，如果是在gb2312的文件中，则其编码为gb2312。

如果字符串是这样定义：s=u'中文' 则该字符串的编码就被指定为unicode了，即python的内部编码，而与代码文件本身的编码无关。

# coding=utf-8
# -*- coding: utf-8 -*-

当你在py文件的第一行中，写了这句话，并确实按照这个编码保存了文本的话，那么这句话有以下几个功能。

外部进来的字符串，尽可能第一时间转成unicode。

把Unicode应用到实际中注意一下四点：