Python 2.1 有什么新变化

作者

A.M. Kuchling

概述

本文介绍了 Python 2.1 的新增特性。 虽然 2.1 的改变没有 Python 2.0 那么多,但是仍然有一些令人惊喜的东西。 2.1 是第一个使用 Python 增强提议,即 PEP 来进行引导的发行版,因此大部分重要的改变都有相应的 PEP 来提供有关改变的更完整文档和设计思路。 本文并未试图完整记录所有的新特性,而是为 Python 程序员提供新特性的简单概览。 请参阅 Python 2.1 文档,或特定的 PEP,获取针对你感兴趣的任何新特性的更多细节。

Python 开发团队的一个近期目标是加速新发行版的步调,使得每 6 到 9 个月就有一个新发行版。 2.1 是基于这个新步调推出的第一个发行版,第一个内测版将于一月发布,即 2.0 最终版发布 3 个月之后。

Python 2.1 的最终版本于2001年4月17日发布。

PEP 227: 嵌套的作用域

Python 2.1 中的最大改变是 Python 的作用域规则。 在 Python 2.0 中,任意给定的时刻至多使用三个命名空间来查找变量名称:局部、模块和内置命名空间。 这往往会导致令人吃惊的结果因为它与人们直觉上的预期不相匹配。 例如,一个嵌套的递归函数将不起作用:

def f():
    ...
    def g(value):
        ...
        return g(value-1) + 1
    ...

函数 g() 将总是引发 NameError 异常,因为名称 g 的绑定既不在局部命名空间中也不在模块级命名空间中。 这在实践上不会有太大问题(你会经常这样递归地定义内部函数吗?),但是这也会让 lambda 表达式的使用更为笨拙,这在实践上是有问题的。 在使用了 lambda 的代码中你经常能发现局部变量通过作为参数的默认值被拷贝。

def find(self, name):
    "Return list of any entries equal to 'name'"
    L = filter(lambda x, name=name: x == name,
               self.list_attribute)
    return L

结果将会严重损害以高度函数式风格编写的 Python 代码的可读性。

Python 2.1 最显著的改变是增加了静态作用域这一语言特征来解决此问题。 作为它的第一项影响,在上述示例中的 name=name 默认参数现在将不再必要。 简单地说,当一个函数内部的给定变量名没有被赋值时(通过赋值语句,或者 def, classimport 语句),对该变量的引用将在外层作用域的局部命名空间中查找。 对于该规则的更详细解释,以及具体实现的分析,请参阅相应的 PEP。

对于同时在模块层级和包含下层函数定义的函数内部局部变量使用了相同变量名的代码来说这项改变可能会导致一些兼容性问题。 不过这看来不太可能发生,因为阅读这样的代码本来就会相当令人困惑。

此项改变的一个附带影响是在特定条件下函数作用域内部 from module import *exec 语句将不允许使用。 Python 参考手册已经写明 from module import * 仅在模块最高层级上是可用的,但此前 CPython 解释器从未强制实施此规则。 作为嵌套作用域具体实现的一部分,将 Python 源码转为字节码的编译器会生成不同的代码来访问某个包含作用域内的变量。 from module import *exec 会使得编译器无法正确执行,因为它们会向局部命名空间添加在编译时还不存在的名称。 为此,如果一个函数包含带有自由变量的函数定义或 lambda 表达式,编译器将通过引发 SyntaxError 异常来提示。

为了使前面的解释更清楚,下面是一个例子:

x = 1
def f():
    # The next line is a syntax error
    exec 'x=2'
    def g():
        return x

包含 exec 语句的第 4 行有语法错误,因为 exec 将定义一个名为 x 的新局部变量,它的值应当被 g() 访问。

这应该不会是太大的限制,因为 exec 在多数 Python 代码中都极少被使用(而当它被使用时,往往也是个存在糟糕设计的信号)。

由于兼容性问题,嵌套作用域被逐步引入;在 Python 2.1 中,它们默认未启用,但可以通过在模块中使用 future 语句来开启,如 PEP 236 所述。 (参见下一节对 PEP 236 的进一步讨论。) 在 Python 2.2 中,嵌套作用域将成为默认设置,并且无法关闭,但用户将有整个 2.1 版本的生命周期来修复因引入嵌套作用域而导致的任何问题。

参见

PEP 227 - 静态嵌套作用域

由 Jeremy Hylton 撰写并实现。

PEP 236: __future__ 指令

对嵌套作用域的反应引起了广泛关注,人们担心在 Python 2.1 版本发布时会破坏现有代码,强烈的反应促使 Python 开发者采取了更保守的策略。这个策略包括引入一种约定,在版本 N 中启用可选功能,该功能将在版本 N+1 中成为强制功能。

语法使用 from...import 语句,使用保留模块名 __future__。可以通过以下语句启用嵌套作用域:

from __future__ import nested_scopes

虽然它看起来像一个普通的 import 语句,但实际上并不是;关于此类 future 语句的位置有严格的规定。它们只能放在模块的顶部,必须位于任何 Python 代码或常规 import 语句之前。这是因为这样的语句会影响 Python 字节码编译器解析代码和生成字节码的方式,因此它们必须在任何会生成字节码的语句之前出现。

参见

PEP 236 - 回到 __future__

由 Tim Peters 撰写,主要由 Jeremy Hylton 实现。

PEP 207: 富比较

In earlier versions, Python's support for implementing comparisons on user-defined classes and extension types was quite simple. Classes could implement a __cmp__() method that was given two instances of a class, and could only return 0 if they were equal or +1 or -1 if they weren't; the method couldn't raise an exception or return anything other than a Boolean value. Users of Numeric Python often found this model too weak and restrictive, because in the number-crunching programs that numeric Python is used for, it would be more useful to be able to perform elementwise comparisons of two matrices, returning a matrix containing the results of a given comparison for each element. If the two matrices are of different sizes, then the compare has to be able to raise an exception to signal the error.

在 Python 2.1 中增加了富比较操作以支持这一需求。 Python 类现在可以单独重载 <, <=, >, >=, ==!= 中的每个操作。 新的魔术方法名称如下:

运算

方法名称

<

__lt__()

<=

__le__()

>

__gt__()

>=

__ge__()

==

__eq__()

!=

__ne__()

(这些魔术方法是以对应的 Fortran 操作符命名的,如 .LT..LE. 等。 数值程序员几乎肯定对这些名称非常熟悉,并且会发现它们易于记忆。)

每个这样的魔术方法的形式都是 method(self, other),其中 self 是操作符左侧的对象,而 other 是操作符右侧的对象。 例如,表达式 A < B 会调用 A.__lt__(B)

这些魔术方法可以返回任何类型的值:布尔值、矩阵、列表或任何其他 Python 对象。或者,如果比较是不可能的、不一致的或没有意义的,它们也可以引发异常。

The built-in cmp(A,B) function can use the rich comparison machinery, and now accepts an optional argument specifying which comparison operation to use; this is given as one of the strings "<", "<=", ">", ">=", "==", or "!=". If called without the optional third argument, cmp() will only return -1, 0, or +1 as in previous versions of Python; otherwise it will call the appropriate method and can return any Python object.

对于 C 程序员来说,也有相应的变更;类型对象中有一个新的槽位 tp_richcmp 以及一个用于执行指定富比较的 API。 这里我不会涉及 C API 的具体内容,完整的相关函数列表请参阅 PEP 207 或 2.1 的 C API 文档。

参见

PEP 207 - 富比较

由 Guido van Rossum 编写,大量参考 David Ascher 的先期工作,并由 Guido van Rossum 实现。

PEP 230: 警告框架

在过去的 10 年中,Python 积累了一定数量的过时模块和功能。 由于无法确切知道某个功能被使用的程度:可能没有程序依赖该功能,也可能有很多程序依赖,因此很难确定何时可以安全地移除某个功能,为了以更结构化的方式移除旧功能,添加了一个警告框架。 当 Python 开发者想要废弃某个功能时,它会在下一个 Python 版本中首先触发一个警告。 然后,在随后的Python版本中可以移除该功能,这样用户将有一个完整的发布周期来删除对旧功能的使用。

Python 2.1 增加了警告框架以用于此方案。 它增加了一个 warnings 模块,该模块提供了发出警告的函数,以及过滤掉不想显示的警告的功能。 第三方模块也可以使用这个框架来弃用它们不再希望支持的旧功能。

例如,在 Python 2.1 中 regex 模块已被弃用,因此导入它时会打印一条警告信息:

>>> import regex
__main__:1: DeprecationWarning: the regex module
         is deprecated; please use the re module
>>>

警告可以通过调用 warnings.warn() 函数来发出:

warnings.warn("feature X no longer supported")

第一个形参是警告消息;额外的可选形参可被用来指定一个专门的警告类别。

Filters can be added to disable certain warnings; a regular expression pattern can be applied to the message or to the module name in order to suppress a warning. For example, you may have a program that uses the regex module and not want to spare the time to convert it to use the re module right now. The warning can be suppressed by calling

import warnings
warnings.filterwarnings(action = 'ignore',
                        message='.*regex module is deprecated',
                        category=DeprecationWarning,
                        module = '__main__')

This adds a filter that will apply only to warnings of the class DeprecationWarning triggered in the __main__ module, and applies a regular expression to only match the message about the regex module being deprecated, and will cause such warnings to be ignored. Warnings can also be printed only once, printed every time the offending code is executed, or turned into exceptions that will cause the program to stop (unless the exceptions are caught in the usual way, of course).

Python 的 C API 也增加了用于发出警告的函数;详情请参阅 PEP 230 或 Python 的 API 文档。

参见

PEP 5 - 语言演化的准则

该文档由 Paul Prescod 撰写,旨在规定移除 Python 旧功能时应遵循的程序。 尽管本文描述的政策尚未被正式采纳,但最终的政策可能不会与 Prescod 的提议有太大不同。

PEP 230 - 警告框架

由 Guido van Rossum 撰写并实现。

PEP 229: 新的构建系统

在编译 Python 时,用户必须进入并编辑 Modules/Setup 文件以启用各种附加模块;默认集相对较小,并且仅限于在大多数 Unix 平台上编译的模块。这意味着在具有更多功能的 Unix 平台上,特别是 Linux,Python 安装通常不包含所有可能有用的模块。

Python 2.0 添加了 Distutils,一组用于分发和安装扩展模块的模块。在 Python 2.1 中,Distutils 被用于编译大部分标准库扩展模块,自动检测当前机器上支持哪些模块。希望这将使 Python 的安装更加容易并具有更多功能。

不再需要编辑 Modules/Setup 文件来启用模块,而是在 Python 源代码分发包的顶层目录运行一个 setup.py 脚本,该脚本在构建时尝试通过检查系统上的模块和头文件来发现可以启用那些模块。 如果某个模块已在 Modules/Setup 中配置,则 setup.py 脚本不会尝试编译该模块,并会遵从 Modules/Setup 文件中的内容。 这提供了一种方式来指定特定平台所需的任何奇怪的命令行旗标或库。

在对构建机制的另一项重大更改中,Neil Schemenauer 对其进行了重组,现在 Python 使用单一的非递归 makefile,而不是在顶层目录和 Python/Parser/Objects/`和 :file:`Modules/ 子目录中的多个 makefile。这使得构建 Python 更快,同时也使修改 Makefile 更加清晰和简单。

参见

PEP 229 - 使用 Distutils 来构建 Python

由 A.M. Kuchling 撰写并实现。

PEP 205: 弱引用

弱引用,通过 weakref 模块提供,是 Python 程序员工具箱中一种较小但有用的新数据类型。

存储一个指向对象的引用(例如,在字典或列表中)会导致该对象永久存活。 在某些特定情况下,这种行为是不符合需要的,最常见的是对象缓存,另一个是像树这样的数据结构中的循环引用。

例如,考虑一个记忆化函数,它通过将函数的参数及其结果存储在字典中来缓存另一个函数 f(x) 的结果:

_cache = {}
def memoize(x):
    if _cache.has_key(x):
        return _cache[x]

    retval = f(x)

    # Cache the returned object
    _cache[x] = retval

    return retval

This version works for simple things such as integers, but it has a side effect; the _cache dictionary holds a reference to the return values, so they'll never be deallocated until the Python process exits and cleans up. This isn't very noticeable for integers, but if f() returns an object, or a data structure that takes up a lot of memory, this can be a problem.

弱引用提供了一种实现缓存的方法,不会让对象在其生命周期结束后仍然存活。 如果一个对象仅通过弱引用访问,该对象将被释放,并且弱引用将指示它所引用的对象不再存在。 通过调用 wr = weakref.ref(obj) 来创建对对象 obj 的弱引用。 通过调用弱引用,就像调用函数一样,可以返回被引用的对象: wr()。 如果对象仍然存在,它将返回被引用的对象;如果对象不再存在,则返回 None

This makes it possible to write a memoize() function whose cache doesn't keep objects alive, by storing weak references in the cache.

_cache = {}
def memoize(x):
    if _cache.has_key(x):
        obj = _cache[x]()
        # If weak reference object still exists,
        # return it
        if obj is not None: return obj

    retval = f(x)

    # Cache a weak reference
    _cache[x] = weakref.ref(retval)

    return retval

The weakref module also allows creating proxy objects which behave like weak references --- an object referenced only by proxy objects is deallocated -- but instead of requiring an explicit call to retrieve the object, the proxy transparently forwards all operations to the object as long as the object still exists. If the object is deallocated, attempting to use a proxy will cause a weakref.ReferenceError exception to be raised.

proxy = weakref.proxy(obj)
proxy.attr   # Equivalent to obj.attr
proxy.meth() # Equivalent to obj.meth()
del obj
proxy.attr   # raises weakref.ReferenceError

参见

PEP 205 - 弱引用

由 Fred L. Drake, Jr 撰写并实现。

PEP 232: 函数属性

In Python 2.1, functions can now have arbitrary information attached to them. People were often using docstrings to hold information about functions and methods, because the __doc__ attribute was the only way of attaching any information to a function. For example, in the Zope Web application server, functions are marked as safe for public access by having a docstring, and in John Aycock's SPARK parsing framework, docstrings hold parts of the BNF grammar to be parsed. This overloading is unfortunate, since docstrings are really intended to hold a function's documentation; for example, it means you can't properly document functions intended for private use in Zope.

现在可以使用常规的 Python 语法在函数上设置和检索任意属性:

def f(): pass

f.publish = 1
f.secure = 1
f.grammar = "A ::= B (C D)*"

The dictionary containing attributes can be accessed as the function's __dict__. Unlike the __dict__ attribute of class instances, in functions you can actually assign a new dictionary to __dict__, though the new value is restricted to a regular Python dictionary; you can't be tricky and set it to a UserDict instance, or any other random object that behaves like a mapping.

参见

PEP 232 - 函数属性

由 Barry Warsaw 撰写并实现

PEP 235: 在大小写不敏感的平台上导入模块

一些操作系统的文件系统是大小写不敏感的,MacOS 和 Windows 是主要的例子;在这些系统上,无法区分文件名 FILE.PYfile.py,尽管它们确实以原始大小写存储文件名(它们也是保留大小写的)。

在 Python 2.1 中,import 语句可以在不区分大小写的平台上模拟大小写敏感性。 现在,Python 默认搜索第一个大小写敏感匹配的文件,如果找不到这样的文件,就会引发 ImportError,因此 import file 不会导入名为 FILE.PY 的模块。 在启动 Python 解释器之前,可以通过设置 PYTHONCASEOK 环境变量来请求大小写不敏感匹配。

PEP 217: 交互模式显示钩子

在交互模式下使用 Python 解释器时,命令的输出是通过内置的 repr() 函数显示的。 在 Python 2.1 中,可以将变量 sys.displayhook() 设置为一个可调用对象,该对象将在代替 repr() 函数被调用。 例如,你可以将其设置为一个特殊的美化打印函数:

>>> # Create a recursive data structure
... L = [1,2,3]
>>> L.append(L)
>>> L # Show Python's default output
[1, 2, 3, [...]]
>>> # Use pprint.pprint() as the display function
... import sys, pprint
>>> sys.displayhook = pprint.pprint
>>> L
[1, 2, 3,  <Recursion on list with id=135143996>]
>>>

参见

PEP 217 - 用于交互模式的显示钩子

由 Moshe Zadka 撰写并实现

PEP 208: 新的强制转换模型

在 C 级别上的数值类型转换方法进行了重大修改。 这只会影响编写 Python C 扩展的作者,使他们在编写支持数值运算的扩展类型时有更多的灵活性。

扩展类型现在可以在其 PyTypeObject 结构中设置类型标志 Py_TPFLAGS_CHECKTYPES,以表明它们支持新的强制模型。 在此类扩展类型中,数字槽函数不再假定它们将得到两个相同类型的参数;相反,它们可能会得到两个不同类型的参数,然后可以执行自己的内部强制。如果槽函数传递给它一个无法处理的类型,它可以通过返回一个指向 Py_NotImplemented 单一值的引用来表示失败。 然后将尝试其他类型的数值函数,也许它们可以处理该操作;如果其他类型也返回 Py_NotImplemented,那么将引发 TypeError。 用 Python 写的数值方法也可以返回 Py_NotImplemented,导致解释器当作该方法不存在(也许会引发 TypeError,也许会尝试另一个对象的数值方法)。

参见

PEP 208 - 改写强制转换模型

由 Neil Schemenauer 编写和实现,基于 Marc-André Lemburg 的早期工作。阅读这部分内容可以了解数值运算在 C 级别上现在如何处理的细节。

PEP 241: Python 包中的元数据

A common complaint from Python users is that there's no single catalog of all the Python modules in existence. T. Middleton's Vaults of Parnassus at http://www.vex.net/parnassus/ are the largest catalog of Python modules, but registering software at the Vaults is optional, and many people don't bother.

作为解决这个问题的第一步,使用 Distutils sdist 命令打包的 Python 软件将包含一个名为 PKG-INFO 的文件,其中包含有关包的信息,如名称、版本和作者(在目录编制术语中称为元数据)。PKG-INFO 文件可以包含的字段的完整列表见 PEP 241。随着人们开始使用 Python 2.1 打包他们的软件,越来越多的包将包含元数据,从而使得构建自动化目录系统并进行实验成为可能。通过积累经验,也许有可能设计一个真正好的目录系统,然后在 Python 2.2 中支持它。例如,Distutils 的 sdistbdist_* 命令可以支持一个 upload 选项,自动将你的包上传到目录服务器。

即使你不使用 Python 2.1,你也可以开始创建包含 PKG-INFO 的包,因为 Distutils 的新版本将为早期 Python 版本的用户发布。Distutils 1.0.2 版本包含了 PEP 241 所描述的更改,以及各种错误修复和增强功能。可以从 Distutils SIG 上获取该版本 https://www.python.org/community/sigs/current/distutils-sig/

参见

PEP 241 - 针对 Python 软件包的元数据

由 A.M. Kuchling 撰写并实现。

PEP 243 - 模块仓库上传机制

由 Sean Reifschneider 撰写,这个 PEP 草案描述了用于将 Python 软件包上传到一个中心服务器的建议机制。

新增和改进的模块

  • Ka-Ping Yee contributed two new modules: inspect.py, a module for getting information about live Python code, and pydoc.py, a module for interactively converting docstrings to HTML or text. As a bonus, Tools/scripts/pydoc, which is now automatically installed, uses pydoc.py to display documentation given a Python module, package, or class name. For example, pydoc xml.dom displays the following:

    Python Library Documentation: package xml.dom in xml
    
    NAME
        xml.dom - W3C Document Object Model implementation for Python.
    
    FILE
        /usr/local/lib/python2.1/xml/dom/__init__.pyc
    
    DESCRIPTION
        The Python mapping of the Document Object Model is documented in the
        Python Library Reference in the section on the xml.dom package.
    
        This package contains the following modules:
          ...
    

    pydoc 还包括一个基于 Tk 的交互式帮助浏览器。pydoc 很快会让人上瘾;试试看!

  • Two different modules for unit testing were added to the standard library. The doctest module, contributed by Tim Peters, provides a testing framework based on running embedded examples in docstrings and comparing the results against the expected output. PyUnit, contributed by Steve Purcell, is a unit testing framework inspired by JUnit, which was in turn an adaptation of Kent Beck's Smalltalk testing framework. See http://pyunit.sourceforge.net/ for more information about PyUnit.

  • The difflib module contains a class, SequenceMatcher, which compares two sequences and computes the changes required to transform one sequence into the other. For example, this module can be used to write a tool similar to the Unix diff program, and in fact the sample program Tools/scripts/ndiff.py demonstrates how to write such a script.

  • curses.panel,是 ncurses 和 SYSV curses 一部分的 panel 库的包装器,由 Thomas Gellekum 贡献。panel 库为窗口提供了深度特性。窗口可以在深度顺序中向上或向下移动,panel 库会计算出面板的重叠位置和哪些部分是可见的。

  • The PyXML package has gone through a few releases since Python 2.0, and Python 2.1 includes an updated version of the xml package. Some of the noteworthy changes include support for Expat 1.2 and later versions, the ability for Expat parsers to handle files in any encoding supported by Python, and various bugfixes for SAX, DOM, and the minidom module.

  • Ka-Ping Yee 还贡献了另一个用于处理未捕获异常的钩子。sys.excepthook() 可以设置为一个可调用对象。当异常未被任何 try...except 块捕获时,异常将传递给 sys.excepthook(),它可以执行任何需要的操作。在第九届 Python 会议上,他演示了这个钩子的一个应用:打印扩展的回溯信息,不仅列出堆栈帧,还列出每个帧的函数参数和局部变量。

  • Various functions in the time module, such as asctime() and localtime(), require a floating point argument containing the time in seconds since the epoch. The most common use of these functions is to work with the current time, so the floating point argument has been made optional; when a value isn't provided, the current time will be used. For example, log file entries usually need a string containing the current time; in Python 2.1, time.asctime() can be used, instead of the lengthier time.asctime(time.localtime(time.time())) that was previously required.

    此更改由 Thomas Wouters 提出并实现。

  • ftplib 模块现在默认以被动模式检索文件,因为被动模式在防火墙后面更可能正常工作。这一请求来自 Debian 错误跟踪系统,因为其他 Debian 包使用 ftplib 来检索文件,但在防火墙后面无法正常工作。由于 Netscape 默认使用被动模式且几乎没有人抱怨,因此认为这不太可能会对任何人造成问题。但如果被动模式不适合你的应用程序或网络设置,可以调用 FTP 对象的 set_pasv(0) 来禁用被动模式。

  • 对原始套接字访问的支持已添加到 socket 模块中,由 Grant Edwards 贡献。

  • pstats 模块现在包含一个简单的交互式统计浏览器,用于显示 Python 程序的时间分析结果,当该模块作为脚本运行时调用。此功能由 Eric S. Raymond 贡献。

  • 新增了一个依赖于实现的函数 sys._getframe([depth]),用于从当前调用堆栈中返回给定的帧对象。sys._getframe`返回调用堆栈顶部的帧对象;如果提供了可选的整数参数 depth,则该函数返回堆栈顶部以下 depth 层的帧。例如,``sys._getframe(1)`() 返回调用者的帧对象。

    这个函数仅存在于 CPython 中,不存在于 Jython 或 .NET 实现中。请将其用于调试,并避免将其放入生产代码中。

其他的改变和修正

由于较短的发布周期,Python 2.1 中的较小更改相对较少。通过搜索 CVS 更改日志,发现应用了 117 个补丁并修复了 136 个错误;这两个数字都可能是低估的。一些较为显著的更改包括:

  • A specialized object allocator is now optionally available, that should be faster than the system malloc() and have less memory overhead. The allocator uses C's malloc() function to get large pools of memory, and then fulfills smaller memory requests from these pools. It can be enabled by providing the --with-pymalloc option to the configure script; see Objects/obmalloc.c for the implementation details.

    Authors of C extension modules should test their code with the object allocator enabled, because some incorrect code may break, causing core dumps at runtime. There are a bunch of memory allocation functions in Python's C API that have previously been just aliases for the C library's malloc() and free(), meaning that if you accidentally called mismatched functions, the error wouldn't be noticeable. When the object allocator is enabled, these functions aren't aliases of malloc() and free() any more, and calling the wrong function to free memory will get you a core dump. For example, if memory was allocated using PyMem_New(), it has to be freed using PyMem_Del(), not free(). A few modules included with Python fell afoul of this and had to be fixed; doubtless there are more third-party modules that will have the same problem.

    对象分配器由 Vladimir Marangozov 贡献。

  • The speed of line-oriented file I/O has been improved because people often complain about its lack of speed, and because it's often been used as a naïve benchmark. The readline() method of file objects has therefore been rewritten to be much faster. The exact amount of the speedup will vary from platform to platform depending on how slow the C library's getc() was, but is around 66%, and potentially much faster on some particular operating systems. Tim Peters did much of the benchmarking and coding for this change, motivated by a discussion in comp.lang.python.

    A new module and method for file objects was also added, contributed by Jeff Epler. The new method, xreadlines(), is similar to the existing xrange() built-in. xreadlines() returns an opaque sequence object that only supports being iterated over, reading a line on every iteration but not reading the entire file into memory as the existing readlines() method does. You'd use it like this:

    for line in sys.stdin.xreadlines():
        # ... do something for each line ...
        ...
    

    有关行 I/O 更改的更详细讨论,请参阅 2001 年 1 月 1 日至 15 日的 python-dev 摘要 https://mail.python.org/pipermail/python-dev/2001-January/

  • A new method, popitem(), was added to dictionaries to enable destructively iterating through the contents of a dictionary; this can be faster for large dictionaries because there's no need to construct a list containing all the keys or values. D.popitem() removes a random (key, value) pair from the dictionary D and returns it as a 2-tuple. This was implemented mostly by Tim Peters and Guido van Rossum, after a suggestion and preliminary patch by Moshe Zadka.

  • 模块现在可以通过定义一个 __all__ 属性来控制使用 from module import * 时导入的名称。 一个常见的抱怨是,如果模块导入了其他模块,例如 sysstring,使用 from module import * 会将它们添加到导入模块的命名空间中。 为了解决这个问题,只需在 __all__ 模块中列出公共名称即可:

    # List public names
    __all__ = ['Database', 'open']
    

    此补丁的更严格版本最初由 Ben Wolfson 提出并实现,但在经过一些 python-dev 讨论后,最终版本被修改为较弱的版本并提交。

  • 以前对字符串应用 repr() 时,对于不可打印字符使用八进制转义符;例如,换行符表示为 '\012'。这是 Python 从 C 语言继承而来的遗留特性,但如今八进制的实际用途非常有限。Ka-Ping Yee 建议使用十六进制转义符代替八进制,并使用 \n\t\r 等转义符表示适当的字符,并实现了这种新的格式。

  • 在编译时检测到的语法错误现在可以引发包含错误文件名和行号的异常,这是 Jeremy Hylton 进行的编译器重组的一个令人愉快的副作用。

  • C extensions which import other modules have been changed to use PyImport_ImportModule(), which means that they will use any import hooks that have been installed. This is also encouraged for third-party extensions that need to import some other module from C code.

  • 由于 Fredrik Lundh 的努力,Unicode 字符数据库的大小又减少了 340K。

  • 一些新移植版本被贡献:MacOS X(由 Steven Majewski 贡献),Cygwin(由 Jason Tishler 贡献),RISCOS(由 Dietmar Schwertberger 贡献),以及 Unixware 7(由 Billy G. Allie 贡献)。

此外还有一份由次要的程序错误修复、次要的内存泄漏、文档字符串编辑和其他调整组成的常规清单,因过于冗长而不值得逐项列出;如果你想了解完整细节请参阅 CVS 日志。

致谢

作者感谢以下人员对本文的各种草案提出建议: Graeme Cross, David Goodger, Jay Graves, Michael Hudson, Marc-André Lemburg, Fredrik Lundh, Neil Schemenauer, Thomas Wouters.