Python 3.0 有什么新变化

作者

Guido van Rossum

This article explains the new features in Python 3.0, compared to 2.6. Python 3.0, also known as "Python 3000" or "Py3K", is the first ever intentionally backwards incompatible Python release. There are more changes than in a typical release, and more that are important for all Python users. Nevertheless, after digesting the changes, you'll find that Python really hasn't changed all that much -- by and large, we're mostly fixing well-known annoyances and warts, and removing a lot of old cruft.

本文并不试图提供所有新特性的完整规范,而是试图提供一个方便的概述。 要了解完整的细节,您应该参考 Python 3.0 的文档和/或文中引用的许多 PEP。 如果您想了解某个特性的完整实现和设计原理,PEP 通常比常规文档有更多的细节;但要注意的是,一旦某个特性被完全实现,PEP 通常不会保持更新。

由于时间有限,本文档不够完整。 对于新发布的版本,源代码发行版中的 Misc/NEWS 文件总是包含大量关于每一个细小改动的详细信息。

常见的绊脚石

本节列出了在你已习惯了 Python 2.5 的情况下最有可能让您感到困惑的几处更改。

用视图和迭代器取代列表

某些知名的 API 将不再返回列表:

  • dict 方法 dict.keys()dict.items()dict.values() 返回 “视图” 而不是列表。 例如,这个写法不再有效: k = d.keys(); k.sort()。 请使用 k = sorted(d) 代替(这在 Python 2.5 中也有效,而且同样高效)。

  • 此外,不再支持 dict.iterkeys()dict.iteritems()dict.itervalues() 方法。

  • map()filter() 均返回迭代器。 如果你确实需要一个列表并且所有输入序列的长度相等,简单的解决办法是将 map() 包装在 list() 中,例如 list(map(...)),但更好的办法通常是使用列表推导式(特别是当原始代码使用了 lambda 的时候),或是重写代码使得它完全不需要列表。 还有一种特殊技巧是将 map() 作为函数的附带影响被唤起;正确的转换方式是使用一个常规的 for 循环(因为创建列表会浪费资源)。

    如果输入序列的长度不相等,map() 将在最短序列的终点停止。 为了与 Python 2.x 中的 map() 完全兼容,也可将序列包装在 itertools.zip_longest() 中,例如将 map(func, *sequences) 变成 list(map(func, itertools.zip_longest(*sequences)))

  • 现在 range() 的行为与过去 xrange() 的行为类似,区别在于它可以处理任意大小的值。 后者已不复存在。

  • zip() 现在将返回一个迭代器。

排序比较

Python 3.0 简化了排序比较的规则:

  • 当操作数不存在有意义的自然排序时,排序比较操作符 (<, <=, >=, >) 会引发 TypeError 异常。 因此,像 1 < '', 0 > Nonelen <= len 这样的表达式不再有效,例如 None < None 会引发 TypeError 而不是返回 False。 由此推论,对异构列表进行排序不再有意义 —— 所有元素必须相互可比。 请注意,这不适用于 ==!= 操作符:不同的不可比类型的对象总是互不相等的。

  • builtin.sorted()list.sort() 不再接受提供比较函数的 cmp 参数。 请使用 key 参数。 注意 keyreverse 参数现在是“仅限关键字”参数。

  • cmp() 函数应视为已不复存在,而 __cmp__() 特殊方法也不再支持。 请使用 __lt__() 进行排序,使用 __eq__()__hash__() 进行比较,并根据需要使用其他的丰富比较方法。 (如果确实需要 cmp() 功能,可以使用表达式 (a > b) - (a < b) 以实现 cmp(a, b)。)

整数

  • PEP 237: 在实质上,long 已被重命名为 int。 也就是说,现在只有一种内置整数类型,叫做 int;但其行为更像是旧的 long 类型。

  • PEP 238: 像 1/2 这样的表达式将返回一个浮点数。 请使用 1//2 来得到取整的行为。 (后面这种语法已存在多年,至少从 Python 2.2 起就有了。)

  • sys.maxint 常量已被删除,因为整数值不再有限制。 不过,sys.maxsize 仍可用作大于任何实际列表或字符串索引的整数。 它符合实现的“自然”整数大小,通常与同一平台上以前版本中的 sys.maxint 相同(假设使用相同的构建选项)。

  • 长整数的 repr() 不再包括尾部的 L,因此无条件地删除该字符的代码会删除最后一位数字。 (请使用 str() 代替。)

  • 八进制数字面值不再是 0720 的形式;而是改用 0o720 的形式。

文本与数据而不是 Unicode 与 8 比特位

你对二进制数据和 Unicode 的所有认知都已改变。

  • Python 3.0 使用 文本 和 (二进制) 数据 等概念来替代 Unicode 字符串和 8 位字符串。 所有文本均使用 Unicode;不过 已编码 Unicode 是以二进制数据来表示的。 用于存放文本的类型是 str,用于存放数据的类型是 bytes。 与 2.x 场景的最大区别是在 Python 3.0 中任何混用文本和数据的尝试都将引发 TypeError,而当你在 Python 2.x 中混用 Unicode 和 8 位字符串时,如果 8 位字符串恰好仅包含 7 位 (ASCII) 字节数据那就没有问题,但是如果包含非 ASCII 值则将引发 UnicodeDecodeError。 这种依赖于特定值的行为多年来造成了无数的苦恼。

  • As a consequence of this change in philosophy, pretty much all code that uses Unicode, encodings or binary data most likely has to change. The change is for the better, as in the 2.x world there were numerous bugs having to do with mixing encoded and unencoded text. To be prepared in Python 2.x, start using unicode for all unencoded text, and str for binary or encoded data only. Then the 2to3 tool will do most of the work for you.

  • 你不能再使用 u"..." 字面值来表示 Unicode 文本。 不过,你必须使用 b"..." 字面值来表示二进制数据。

  • 由于 strbytes 类型无法混用,你必须始终在它们之间执行显式转换。 使用 str.encode()str 转为 bytes,并使用 bytes.decode()bytes 转为 str。 你也可以分别使用 bytes(s, encoding=...)str(b, encoding=...)

  • str 一样,bytes 类型是不可变的。 还有一个单独的 mutable 类型用于保存缓冲二进制数据,即 bytearray。 几乎所有接受 bytes 的应用程序接口也接受 bytearray。 可变 API 基于 collections.MutableSequence

  • 原始字符串字面中的所有反斜线均按字面解释。 这意味着原始字符串中的 '\U''\u' 转义符不会被特殊处理。 例如,在 Python 3.0 中,r'\u20ac' 是一个包含 6 个字符的字符串,而在 2.6 中,ur'\u20ac' 是一个 “欧元” 字符。 (当然,这种变化只影响原始字符串的字面意义;在 Python 3.0 中,欧元字符是 '\u20ac'。)

  • 内置的 basestring 抽象类型已被移除,请使用 str 代替。 strbytes 类型在功能上没有足够的共通性,因此不需要共享基类。 2to3 工具(见下文)用 str 替换了每一个 basestring

  • 作为文本文件打开的文件(仍然是 open() 的默认模式)总是会使用一个编码格式在(内存中的)字符串和(磁盘中的)字节串之间建立映射。 二进制文件(将 mode 参数设为 b 来打开)在内存中总是会使用数字串。 这意味着如果一个文件是使用不正确的模式或编码格式打开的,I/O 操作很可能会报告失败,而不是静默地产生不正确的数据。 这也意味着即使是 Unix 用户在打开文件时也必须指定正确的模式(文本或二进制)。 存在一个依赖于具体平台的默认编码格式,在类 Unix 平台上可以通过 LANG 环境变量来设置(有时也会使用其他一些平台专属的语言区域相关的环境变量)。 在多数情况下,系统默认使用 UTF-8,但并非全都如此;你绝不应该依赖这个默认值。 任何读写超出纯 ASCII 文本范围的内容的应用程序都应该提供重写编码格式的选项。 现在已不再需要使用 codecs 模块中可感知编码格式的流。

  • sys.stdinsys.stdoutsys.stderr 的初始值现在是仅 Unicode 的文本文件(即它们是 io.TextIOBase 的实例)。 要使用这些数据流读写字节数据,需要使用它们的 io.TextIOBase.buffer 属性。

  • 文件名是以(Unicode)字符串的形式传给 API 并返回的。 这可能产生特定平台专属的问题因为在某些平台上文件名强制使用字节串。 (另一方面,在 Windows 上文件名则原生存储为 Unicode。) 为绕过此问题,多数接受文件名的 API(例如 open()os 模块中的许多函数)都同时接受 bytes 对象和字符串,而少数 API 会发出要求 bytes 返回值的提示。 因而,当参数为 bytes 的实例时 os.listdir() 会返回由 bytes 实例组成的列表,os.getcwdb() 则会将当前工作目录作为 bytes 实例返回。 请注意当 os.listdir() 返回字符串的列表时,无法被正确解码的文件名会被忽略而不是引发 UnicodeError

  • 当系统提供的字节无法使用默认编码进行解释时,一些系统 API,如 os.environsys.argv,也会出现问题。 最好的办法可能是设置 LANG 变量并重新运行程序。

  • PEP 3138: 字符串的 repr() 将不再转义非 ASCII 字符。 不过,它仍然会转义控制字符和在 Unicode 标准中具有不可打印状态的码位。

  • PEP 3120:现在默认的源码编码格式是UTF-8。

  • PEP 3131: 现在允许在标识符中使用非 ASCII 字符(不过,标准库中的异常和注释中的贡献者名字仍然只使用 ASCII 字符)。

  • The StringIO and cStringIO modules are gone. Instead, import the io module and use io.StringIO or io.BytesIO for text and data respectively.

  • 另请参阅 Unicode 指南,其内容已针对 Python 3.0 进行更新。

语法变化概述

本节提供了 Python 3.0 中每个 语法 变化的简要说明。

新语法

  • PEP 3107: Function argument and return value annotations. This provides a standardized way of annotating a function's parameters and return value. There are no semantics attached to such annotations except that they can be introspected at runtime using the __annotations__ attribute. The intent is to encourage experimentation through metaclasses, decorators or frameworks.

  • PEP 3102:仅限关键字参数。在参数列表``*args`` 之后出现的命名参数 必须 在调用中使用关键字语法指定。也可以在参数列表中使用``*``来表示不接受长度可变的参数列表,但可以使用只包含关键字的参数。

  • 类定义中的基类列表后允许使用关键字参数。 这是用于指定元类的新约定(见下一节),但也可用于其他目的,只要元类支持它。

  • PEP 3104: nonlocal 语句。 现在你可以使用 nonlocal x 直接赋值到一个外层(但非全局)作用域。 nonlocal 是新的保留字。

  • PEP 3132: 扩展可迭代对象解包。 你现在可以编写像 a, b, *rest = some_sequence 这样的代码。 甚至 *rest, a = stuffrest 对象将总是为一个(可能为空的)列表;右侧的对象可以是任意可迭代对象。 例如:

    (a, *rest, b) = range(5)
    

    这会将 a 设为 0b 设为 4,而将 rest 设为 [1, 2, 3]

  • 新增字典推导式: {k: v for k, v in stuff} 的含义与 dict(stuff) 相同但是更为灵活。 (对此特性的解释见 PEP 274。 :-)

  • 新增集合字面值,例如 {1, 2}。 请注意 {} 是空字典;要用 set() 表示空集合。 集合推导式也受到支持;例如 {x for x in stuff} 的含义与 set(stuff) 相同但是更为灵活。

  • 新增八进制字面值,例如 0o720 (已存在于 2.6 中)。 旧的八进制字面值 (0720) 已不复存在。

  • 新增二进制字面值,例如 0b1010 (已存在于 2.6 中),还有对应的新增内置函数 bin()

  • 引入了带有 bB 前缀的字节串字面值,还有对应的新增内置函数 bytes()

语法变化

  • PEP 3109PEP 3134: 新增 raise 语句的语法: raise [expr [from expr]]。 见下文。

  • 现在 aswith 是保留关键字。 (实际是从 2.6 开始。)

  • True, FalseNone 已成为保留关键字。 (2.6 已经对 None 部分强制应用限制。)

  • except exc, var 改为 except exc as var。 参见 PEP 3110

  • PEP 3115: 新的元类语法。 替换:

    class C:
        __metaclass__ = M
        ...
    

    你现在需要使用:

    class C(metaclass=M):
        ...
    

    不再支持全局模块变量 __metaclass__。 (它是一个“拐杖”,可以使默认使用新风格类变得更容易,而无需从 object 派生每个类。)

  • 列表推导式不再支持 [... for var in item1, item2, ...] 这样的语法形式。 请改用 [... for var in (item1, item2, ...)]。 还要注意列表推导式具有不同的句法:它们更像是 list() 构造器内部用于生成器表达式的语法糖,具体来说就是循环控制变量将不会再泄漏到外层作用域中。

  • ellipsis (...) 可以在任何地方作为原子表达式使用。(以前只允许在片段中使用。)另外,现在 必须 拼写为``...`` 。(以前也可以拼写为``. . .`` ,这只是一个偶然的语法。)

移除的语法

  • PEP 3113: 元组形参解包已被移除。 你不能再使用 def foo(a, (b, c)): ... 的写法。 请改用 def foo(a, b_c): b, c = b_c

  • 移除了反引号(请使用 repr() 代替)。

  • 移除了 <> (请改用 !=)。

  • 移除的关键字: exec() 不再是一个关键字;它仍是一个函数。 (幸运的是该函数语法也在 2.x 中被接受。) 还要注意 exec() 将不再接受流作为参数;你可以将原来的 exec(f) 改为使用 exec(f.read())

  • 整数字面值不再支持 lL 后缀。

  • 字符串字面值不再支持 uU 前缀。

  • from module import * 语法仅允许在模块层级使用,不再允许出现于函数内部。

  • 唯一可接受的相对导入语法为 from .[module] import name。 所有不以 . 开头的 import 形式都将被解读为绝对导入。 (PEP 328)

  • 经典类已不复存在。

已存在于 Python 2.6 中的改变

由于许多用户可能会直接从 Python 2.5 跳到 Python 3.0,因此本节提醒读者注意最初为 Python 3.0 设计但后来移植到 Python 2.6 的新特性。 如需更详细的说明请参阅 Python 2.6 有什么新变化 中的相应章节。

库的修改

由于时间有限,本文档并未完全覆盖标准库的所有变化内容。 PEP 3108 提供了对标准库主要修改的引用列表。 以下是精简版的预览:

  • Many old modules were removed. Some, like gopherlib (no longer used) and md5 (replaced by hashlib), were already deprecated by PEP 4. Others were removed as a result of the removal of support for various platforms such as Irix, BeOS and Mac OS 9 (see PEP 11). Some modules were also selected for removal in Python 3.0 due to lack of use or because a better replacement exists. See PEP 3108 for an exhaustive list.

  • The bsddb3 package was removed because its presence in the core standard library has proved over time to be a particular burden for the core developers due to testing instability and Berkeley DB's release schedule. However, the package is alive and well, externally maintained at https://www.jcea.es/programacion/pybsddb.htm.

  • 一些模块名称已被修改因为它们的旧名称不符合 PEP 8,或是出于各种其他理由。 具体列表如下:

    旧名称

    新名称

    _winreg

    winreg

    ConfigParser

    configparser

    copy_reg

    copyreg

    Queue

    queue

    SocketServer

    socketserver

    markupbase

    _markupbase

    repr

    reprlib

    test.test_support

    test.support

  • A common pattern in Python 2.x is to have one version of a module implemented in pure Python, with an optional accelerated version implemented as a C extension; for example, pickle and cPickle. This places the burden of importing the accelerated version and falling back on the pure Python version on each user of these modules. In Python 3.0, the accelerated versions are considered implementation details of the pure Python versions. Users should always import the standard version, which attempts to import the accelerated version and falls back to the pure Python version. The pickle / cPickle pair received this treatment. The profile module is on the list for 3.1. The StringIO module has been turned into a class in the io module.

  • 一些有关联的模块已被组织为包,通常其子模块名也得到了简化。 这样产生的新包有:

    • dbm (anydbm, dbhash, dbm, dumbdbm, gdbm, whichdb).

    • html (HTMLParser, htmlentitydefs).

    • http (httplib, BaseHTTPServer, CGIHTTPServer, SimpleHTTPServer, Cookie, cookielib).

    • tkinter (all Tkinter-related modules except turtle). The target audience of turtle doesn't really care about tkinter. Also note that as of Python 2.6, the functionality of turtle has been greatly enhanced.

    • urllib (urllib, urllib2, urlparse, robotparse).

    • xmlrpc (xmlrpclib, DocXMLRPCServer, SimpleXMLRPCServer).

其他一些针对标准库模块的改变,未被 PEP 3108 覆盖:

  • Killed sets. Use the built-in set() class.

  • Cleanup of the sys module: removed sys.exitfunc(), sys.exc_clear(), sys.exc_type, sys.exc_value, sys.exc_traceback. (Note that sys.last_type etc. remain.)

  • Cleanup of the array.array type: the read() and write() methods are gone; use fromfile() and tofile() instead. Also, the 'c' typecode for array is gone -- use either 'b' for bytes or 'u' for Unicode characters.

  • Cleanup of the operator module: removed sequenceIncludes() and isCallable().

  • Cleanup of the thread module: acquire_lock() and release_lock() are gone; use acquire() and release() instead.

  • Cleanup of the random module: removed the jumpahead() API.

  • The new module is gone.

  • The functions os.tmpnam(), os.tempnam() and os.tmpfile() have been removed in favor of the tempfile module.

  • tokenize 模块已被修改以适用于字节串。 主入口点现在是 tokenize.tokenize(),而不是 generate_tokens。

  • string.letters and its friends (string.lowercase and string.uppercase) are gone. Use string.ascii_letters etc. instead. (The reason for the removal is that string.letters and friends had locale-specific behavior, which is a bad idea for such attractively-named global "constants".)

  • Renamed module __builtin__ to builtins (removing the underscores, adding an 's'). The __builtins__ variable found in most global namespaces is unchanged. To modify a builtin, you should use builtins, not __builtins__!

PEP 3101: 字符串格式化的新方式

  • 一种针对内置字符串格式化操作的新系统替代了 % 字符串格式化运算符。 (不过,% 运算符仍然受到支持;它将在 Python 3.1 中被弃用并在今后某一时刻从语言特性中移除。) 请参阅 PEP 3101 了解详情。

对异常的修改

用于引发和捕获异常的 API 已经过清理并增加了强大的新特性:

  • PEP 352: 所有异常都必须(直接或间接地)派生自 BaseException。 这是异常层级结构的根对象。 作为推荐方式这并不是新的变化,但 必须BaseException 继承是新的变化。 (Python 2.6 仍然允许引发经典类,并且不限制你能捕获的异常。) 作为此变化的结果,字符串异常终于真正彻底地死亡了。

  • 几乎所有异常实际上都应当派生自 ExceptionBaseException 仅应当被用作那些仅应当在最高层级中处理的异常的基类,如 SystemExitKeyboardInterrupt。 处理除了后面这一类之外的所有异常的推荐写法是使用 except Exception

  • StandardError was removed.

  • Exceptions no longer behave as sequences. Use the args attribute instead.

  • PEP 3109: Raising exceptions. You must now use raise Exception(args) instead of raise Exception, args. Additionally, you can no longer explicitly specify a traceback; instead, if you have to do this, you can assign directly to the __traceback__ attribute (see below).

  • PEP 3110: 捕获异常。 你现在必须使用 except SomeException as variable 而不是 except SomeException, variable。 此外,variable 会在离开 except 代码块时被显式地删除。

  • PEP 3134: Exception chaining. There are two cases: implicit chaining and explicit chaining. Implicit chaining happens when an exception is raised in an except or finally handler block. This usually happens due to a bug in the handler block; we call this a secondary exception. In this case, the original exception (that was being handled) is saved as the __context__ attribute of the secondary exception. Explicit chaining is invoked with this syntax:

    raise SecondaryException() from primary_exception
    

    (where primary_exception is any expression that produces an exception object, probably an exception that was previously caught). In this case, the primary exception is stored on the __cause__ attribute of the secondary exception. The traceback printed when an unhandled exception occurs walks the chain of __cause__ and __context__ attributes and prints a separate traceback for each component of the chain, with the primary exception at the top. (Java users may recognize this behavior.)

  • PEP 3134: Exception objects now store their traceback as the __traceback__ attribute. This means that an exception object now contains all the information pertaining to an exception, and there are fewer reasons to use sys.exc_info() (though the latter is not removed).

  • 一些提示 Windows 载入扩展模块失败的异常消息得到了改进。 例如,error code 193 现在是 %1 is not a valid Win32 application。 字符串现在可处理非英语的语言区域。

其他杂项修改

运算符与特殊方法

  • 现在 != 将返回与 == 相反的结果,除非 == 是返回 NotImplemented

  • “未绑定方法”的概念已从语言中移除。 现在当把一个方法作为类属性来引用时,你将得到一个基本函数对象。

  • __getslice__(), __setslice__() and __delslice__() were killed. The syntax a[i:j] now translates to a.__getitem__(slice(i, j)) (or __setitem__() or __delitem__(), when used as an assignment or deletion target, respectively).

  • PEP 3114: 标准的 next() 方法已被重命名为 __next__()

  • The __oct__() and __hex__() special methods are removed -- oct() and hex() use __index__() now to convert the argument to an integer.

  • Removed support for __members__ and __methods__.

  • The function attributes named func_X have been renamed to use the __X__ form, freeing up these names in the function attribute namespace for user-defined attributes. To wit, func_closure, func_code, func_defaults, func_dict, func_doc, func_globals, func_name were renamed to __closure__, __code__, __defaults__, __dict__, __doc__, __globals__, __name__, respectively.

  • __nonzero__() is now __bool__().

内置对象

  • PEP 3135: 新的 super()。 现在你可以不带参数地唤起 super() 这样(假定这发生在定义于 class 语句内部的常规实例方法中)将会自动选择正确的类和实例。 附带参数时,super() 的行为保持不变。

  • PEP 3111: raw_input() was renamed to input(). That is, the new input() function reads a line from sys.stdin and returns it with the trailing newline stripped. It raises EOFError if the input is terminated prematurely. To get the old behavior of input(), use eval(input()).

  • 新增内置函数 next() 用于在对象上调用 __next__() 方法。

  • round() 函数的舍入策略和返回类型已有改变。 对于两边差值相同的情况现在将会舍入到最接近的偶数结果而不是远离零值的结果。 (例如,round(2.5) 现在将返回 2 而不是 3。) 现在 round(x[, n]) 将委托给 x.__round__([n]) 而不是始终返回一个浮点数。 它通常会在附带一个参数调用时返回整数而在附带两个参数调用时返回与 x 相同类型的值。

  • Moved intern() to sys.intern().

  • Removed: apply(). Instead of apply(f, args) use f(*args).

  • Removed callable(). Instead of callable(f) you can use isinstance(f, collections.Callable). The operator.isCallable() function is also gone.

  • Removed coerce(). This function no longer serves a purpose now that classic classes are gone.

  • Removed execfile(). Instead of execfile(fn) use exec(open(fn).read()).

  • Removed the file type. Use open(). There are now several different kinds of streams that open can return in the io module.

  • Removed reduce(). Use functools.reduce() if you really need it; however, 99 percent of the time an explicit for loop is more readable.

  • Removed reload(). Use imp.reload().

  • Removed. dict.has_key() -- use the in operator instead.

构建和 C API 的改变

由于时间约束,下面 C API 的变化列表 非常 不完整。

  • 已放弃对某些平台的支持,包括但不限于 Mac OS 9, BeOS, RISCOS, Irix 和 Tru64。

  • PEP 3118: 新的缓冲区 API。

  • PEP 3121: 扩展模块初始化与最终化。

  • PEP 3123: 使 PyObject_HEAD 与标准 C 一致。

  • 已去除对受限执行的 C API 支持。

  • PyNumber_Coerce(), PyNumber_CoerceEx(), PyMember_Get(), and PyMember_Set() C API 已被移除。

  • 新的 C API PyImport_ImportModuleNoBlock(),类似于 PyImport_ImportModule() 但不会因导入锁而阻塞(改为返回错误)。

  • 重命名布尔转换的 C 层级槽位和方法: nb_nonzero 现在改为 nb_bool

  • 从 C API 中移除 METH_OLDARGSWITH_CYCLE_GC

性能

综合而言 3.0 的改变使得 Python 3.0 运行 pystone 基准测试的速度比 Python 2.5 慢了约 10%。 其中最大的原因可能是移除了针对小整数的特别场景的处理。 虽然存在改进空间,但这将在 3.0 发布之后再进行!

移植到 Python 3.0

对于将现有 Python 2.5 或 2.6 源代码移植到 Python 3.0,最佳的策略如下:

  1. (必要前提:)启动良好的测试覆盖。

  2. 移植到 Python 2.6。 这应该不会比从 Python 2.x 到 Python 2.(x+1) 的正常移植更麻烦。 请确保所有的测试均能通过。

  3. (仍然使用 2.6:) 打开 -3 命令行开关。 这将启用针对将在 3.0 中被移除(或修改)的特性的警告。 再次运行你的测试套件,并修复你收到相关警告的代码直至不再有任何警告,并且所有的测试仍然能通过。

  4. Run the 2to3 source-to-source translator over your source code tree. (See 2to3 - 自動將 Python 2的程式碼轉成 Python 3 for more on this tool.) Run the result of the translation under Python 3.0. Manually fix up any remaining issues, fixing problems until all tests pass again.

不建议尝试编写可不加修改地同时运行于 Python 2.6 和 3.0 的源代码;你将不得不使用一种非常扭曲的代码风格,例如避免 print 语句、元类和许多其他特性。 如果你正在维护需要同时支持 Python 2.6 和 Python 3.0 的库,最佳做法是将上述的步骤 3 修改为编辑源代码的 2.6 版本并再次运行 2to3 翻译器,而不是修改源代码的 3.0 版本。

有关如何将 C 扩展移植到 Python 3.0,请参阅 遷移延伸模組到 Python 3