What’s New In Python 3.2

Author:Raymond Hettinger

この記事では 3.1 と比較した Python 3.2 の新機能を解説します。 幾つかの新機能と例にフォ-カスしています。全詳細については Misc/NEWS をご覧ください。

参考

PEP 392 - Python 3.2 リリーススケジュール

PEP 384: 安定 ABI の定義

かつて、ある Python バージョンでビルドされた拡張モジュールは、ほかの Python バージョンでは使えないことがありました。特に Windows では、全ての Python 公式リリースごとに、使いたい全ての拡張モジュールを再ビルドする必要がありました。これは、拡張モジュールが Python インタプリタの内部実装に自由にアクセス出来たことからの結果でした。

Python 3.2 より、このことに関する別のアプローチが利用可能になりました。(Py_LIMITED_API を定義することで) 制限された API のみ使うようにする拡張モジュールは、数多くの内部実装を利用出来ない代わりに将来のいくつものリリースで安定であることを約束された API 集合だけ使うことになります。結果として、このモードで 3.2 のためにビルドされた拡張モジュールは 3.3、3.4、…でも動作するでしょう。なお、メモリ構造の詳細を曝すような拡張モジュールでは、相変わらず全ての Python 公式リリースごとに再ビルドする必要があるでしょう。

参考

PEP 384 - 安定 ABI の定義
PEP written by Martin von Löwis.

PEP 389: argparse コマンドライン解析モジュール

コマンドライン解析のために、新たに argparse モジュールが optparse の制限を克服するものとして導入されました。optparse には (オプションだけでなく) 位置引数のサポートはなく、サブコマンドも作れず、必須のオプションやその他オプション指定と検証に共通するパターンについてのサポートもありませんでした。

このモジュールはコミュニティにおいて既に広く行き渡っていたサードパーティのモジュールでした。その先駆者たちよりももっと完全な機能性を持ったことで、 argparse モジュールは今ではコマンドライン解析での推奨モジュールとなりました。古いモジュールは、それに依存しているレガシーなコードが大量にあるため、今後も利用可能なまま保たれます。

以下に注釈付きで示したパーサは、有限個の選択肢から選ばせ、 metavar でヘルプ表示を指定し、一つ以上の位置引数があるかを検証し、必須オプションを設けている実例になっています:

import argparse
parser = argparse.ArgumentParser(
            description = 'Manage servers',         # main description for help
            epilog = 'Tested on Solaris and Linux') # displayed after help
parser.add_argument('action',                       # argument name
            choices = ['deploy', 'start', 'stop'],  # three allowed values
            help = 'action on each target')         # help msg
parser.add_argument('targets',
            metavar = 'HOSTNAME',                   # var name used in help msg
            nargs = '+',                            # require one or more targets
            help = 'url for target machines')       # help msg explanation
parser.add_argument('-u', '--user',                 # -u or --user option
            required = True,                        # make it a required argument
            help = 'login as user')

コマンド文字列とともにこのパーサを呼び出してみます:

>>> cmd = 'deploy sneezy.example.com sleepy.example.com -u skycaptain'
>>> result = parser.parse_args(cmd.split())
>>> result.action
'deploy'
>>> result.targets
['sneezy.example.com', 'sleepy.example.com']
>>> result.user
'skycaptain'

このパーサが自動的に作り出したヘルプはこのようになります:

>>> parser.parse_args('-h'.split())

usage: manage_cloud.py [-h] -u USER
                       {deploy,start,stop} HOSTNAME [HOSTNAME ...]

Manage servers

positional arguments:
  {deploy,start,stop}   action on each target
  HOSTNAME              url for target machines

optional arguments:
  -h, --help            show this help message and exit
  -u USER, --user USER  login as user

Tested on Solaris and Linux

argparse 機能でとりわけ素晴らしいのはサブパーサを定義出来ることです。それらはそれぞれ自身固有の引数パターンを持ち、ヘルプ表示をします:

import argparse
parser = argparse.ArgumentParser(prog='HELM')
subparsers = parser.add_subparsers()

parser_l = subparsers.add_parser('launch', help='Launch Control')   # first subgroup
parser_l.add_argument('-m', '--missiles', action='store_true')
parser_l.add_argument('-t', '--torpedos', action='store_true')

parser_m = subparsers.add_parser('move', help='Move Vessel',        # second subgroup
                                 aliases=('steer', 'turn'))         # equivalent names
parser_m.add_argument('-c', '--course', type=int, required=True)
parser_m.add_argument('-s', '--speed', type=int, default=0)
$ ./helm.py --help                         # top level help (launch and move)
$ ./helm.py launch --help                  # help for launch options
$ ./helm.py launch --missiles              # set missiles=True and torpedos=False
$ ./helm.py steer --course 180 --speed 5   # set movement parameters

参考

PEP 389 - 新しいコマンドライン解析モジュール
PEP written by Steven Bethard.

optparse からのアップグレードoptparse との違いが詳しく書かれています。

PEP 391: logging の辞書ベースの設定

logging モジュールではこれまで 2 つの設定手段がありました。一つはそれぞれのオプションごとに関数呼び出しをするスタイルで、もう一つは configparser フォーマットで保存された外部ファイル駆動のスタイルです。これらには JSON や YAML ファイルといったものから設定したりする柔軟性はなく、あるいはコマンドラインからロガーのオプションを指定するのに必要とされる、インクリメンタルな設定をサポートする柔軟性もありませんでした。

もっと柔軟な設定をサポートするために、新たに logging.config.dictConfig() が追加されました。これはロギングの設定を通常の Python 辞書で指定します。設定オプションにはフォーマッタ、ハンドラ、フィルタ、そしてロガーが含まれます。以下は設定辞書の動作する実例です:

{"version": 1,
 "formatters": {"brief": {"format": "%(levelname)-8s: %(name)-15s: %(message)s"},
                "full": {"format": "%(asctime)s %(name)-15s %(levelname)-8s %(message)s"}
                },
 "handlers": {"console": {
                   "class": "logging.StreamHandler",
                   "formatter": "brief",
                   "level": "INFO",
                   "stream": "ext://sys.stdout"},
              "console_priority": {
                   "class": "logging.StreamHandler",
                   "formatter": "full",
                   "level": "ERROR",
                   "stream": "ext://sys.stderr"}
              },
 "root": {"level": "DEBUG", "handlers": ["console", "console_priority"]}}

その辞書が conf.json ファイルに格納されているのであれば、コードからこのように呼び出してロード出来ます:

>>> import json, logging.config
>>> with open('conf.json') as f:
...     conf = json.load(f)
...
>>> logging.config.dictConfig(conf)
>>> logging.info("Transaction completed normally")
INFO    : root           : Transaction completed normally
>>> logging.critical("Abnormal termination")
2011-02-17 11:14:36,694 root            CRITICAL Abnormal termination

参考

PEP 391 - logging の辞書ベースの設定
PEP written by Vinay Sajip.

PEP 3148: concurrent.futures モジュール

同時並行性 (concurrency) を生成・管理するコードはトップレベルの新しい名前空間 concurrent に集められることになりました。その最初のメンバーが futures パッケージです。これはスレッドとプロセス管理の統一的な高水準インターフェイスを提供します。

concurrent.futures の設計は Java の java.util.concurrent パッケージに触発されました。そのモデルでは、実行する呼び出しとその結果は Future オブジェクトで表現され、これはスレッド、プロセス、遠隔手続呼び出しの共通的な側面を抽象化しています。そのオブジェクトはステータスのチェック (実行中あるいは完了かどうか)、タイムアウト、キャンセル、コールバックの追加、そして結果や例外へのアクセスをサポートします。

この新モジュールで提供される最も基本となるのが、呼び出しの実行と管理のための 2 つの executor クラスです。これら executor の目標は、これまでにもあった道具立てでの並列呼び出しを、もっと簡単にすることです。リソースプールをお膳立てしたり呼び出しを実行したり、結果のキューを作ったり、あるいはタイムアウトのハンドラを追加したり、スレッドやプロセスや遠隔手続呼び出しの総数を制限したり、といったことを、これらを使えば、その労力を小さく出来ます。

理想的にはそれぞれのアプリケーションは、プロセスとスレッドの制限が確実に管理されるように、複数コンポーネントをまたがって単一の executor を共有すべきです。そうしておけば、個々のコンポーネントがリソース管理についての競合する戦略を持つ場合に起こる設計の難題は解決出来ます。

どちらの executor クラスとも 3 つのメソッドを持つ共通インターフェイスを持ちます。 submit() メソッドは呼び出し可能オブジェクトをスケジュールし、 Future オブジェクトを返します。 map() メソッドは一気に複数の非同期呼び出しをスケジュールします。 shutdown() メソッドはリソースを解放します。これらクラスは context manager なので with 文とともに使うことが出来、現時点で保留中の future が実行を終えた際にリソースが自動的に解放されることを保障出来ます。

以下はファイルコピーを行う 4 つの並列スレッドを実行する、 ThreadPoolExecutor の単純な使用例です:

import concurrent.futures, shutil
with concurrent.futures.ThreadPoolExecutor(max_workers=4) as e:
    e.submit(shutil.copy, 'src1.txt', 'dest1.txt')
    e.submit(shutil.copy, 'src2.txt', 'dest2.txt')
    e.submit(shutil.copy, 'src3.txt', 'dest3.txt')
    e.submit(shutil.copy, 'src3.txt', 'dest4.txt')

参考

PEP 3148 - Futures – 計算の非同期な実行
PEP written by Brian Quinlan.

threadpoolexecutor-example はスレッド並列でウェブページを取得する実例コードです。

ProcessPoolExecutor の実例を 並列で素数計算するコード例 として挙げています。

PEP 3147: PYC リポジトリーディレクトリ

バイトコードを .pyc ファイルとしてキャッシュする Python の方法は、複数の Python インタプリタ環境ではうまく働きませんでした。一つのインタプリタがもう一つのインタプリタによって作られたキャッシュファイルに出会うと、そのインタプリタはソースを再コンパイルしてキャッシュファイルを上書きするわけですから、これではキャッシュの価値は台無しです。

「pyc ファイト」問題は、複数バージョンの Python を載せる Linux ディストリビューションにありふれたこととなったよりももっと表立って来ました。これら衝突は Unladen Swallow のような CPython 以外の実装でも起こります。

この問題を解決するために、Python のインポート機構はそれぞれのインタプリタごとに区別された名前を使うように拡張されました。Python 3.2、Python 3.3、 Unladen Swallow でそれぞれ競合するファイル名 「mymodule.pyc」 を使うのではなく、それぞれ 「mymodule.cpython-32.pyc」, 「mymodule.cpython-33.pyc」, 「mymodule.unladen10.pyc」 を使うようになりました。同時にこれらの新しいファイルがソースディレクトリを散らかすのを防ぐために、 pyc ファイルはパッケージディレクトリの下の 「__pycache__」 ディレクトリに収集するようになりました。

ファイル名と格納先ディレクトリは別にして、この新方式にはプログラマ目線での目に見える変化が少しあります:

  • インポートされたモジュールには属性 __cached__ が追加されて、これにはインポートされたファイルの実際のファイル名を記憶しています:

    >>> import collections
    >>> collections.__cached__ 
    'c:/py32/lib/__pycache__/collections.cpython-32.pyc'
    
  • キャッシュファイル名を一意にするためのインタプリタ実装ごとのタグは imp モジュールからアクセス出来ます:

    >>> import imp
    >>> imp.get_tag() 
    'cpython-32'
    
  • インポートされたファイルからソースファイル名を推測しようとするスクリプトは、以前より賢くなる必要があります。もはや 「.pyc」 ファイル名から末尾の 「c」 を取り除くだけでは不十分です。そうではなくて imp モジュール内の新規関数を使いましょう:

    >>> imp.source_from_cache('c:/py32/lib/__pycache__/collections.cpython-32.pyc')
    'c:/py32/lib/collections.py'
    >>> imp.cache_from_source('c:/py32/lib/collections.py') 
    'c:/py32/lib/__pycache__/collections.cpython-32.pyc'
    
  • py_compilecompileall モジュールはこの新命名規則とターゲットディレクトリを反映するよう更新されました。 compileall のコマンドラインからの起動には新しいオプションが追加されました。 -i はコンパイルするファイルとディレクトリのリストを指定します。 -b はバイトコードファイルを __pycache__ ではなく伝統的な場所に書き出します。

  • importlib.abc モジュールはバイトコードファイルのロードのための新しい 抽象基底クラス で更新されました。古くなった ABC PyLoaderPyPycLoader は非推奨となりました (Python 3.1 との互換性を保つための方法はドキュメントに含まれています)。

参考

PEP 3147 - PYC リポジトリーディレクトリー
PEP written by Barry Warsaw.

PEP 3149: ABI バージョンでタグ付けされた .so ファイル

PYC レポジトリーディレクトリでは複数バイトコードのキャッシュファイルを共存できます。この PEP は共有オブジェクトについての同じようなメカニズムを実装します。それには共通のディレクトリを使い、個々のバージョンごとの名前の区別をします。

共通ディレクトリは 「pyshared」 です。また、ファイル名は Python 実装 (例えば CPython、PyPy、Jython など)、メジャー・マイナーバージョン番号やオプショナルなビルドフラグ (例えばデバッグビルドでの 「d」、 pymalloc ビルドの 「m」、ワイド幅 Unicode の 「u」) を特定することで区別するように命名されます。任意のパッケージ 「foo」 について、配布パッケージがインストールされるとこれらファイルは例えばこのような具合でしょう:

/usr/share/pyshared/foo.cpython-32m.so
/usr/share/pyshared/foo.cpython-33md.so

Python 自身からこのタグに、 sysconfig モジュールにある関数でアクセス出来ます:

>>> import sysconfig
>>> sysconfig.get_config_var('SOABI')       # find the version tag
'cpython-32mu'
>>> sysconfig.get_config_var('EXT_SUFFIX')  # find the full filename extension
'.cpython-32mu.so'

参考

PEP 3149 - ABI バージョンでタグ付けされた .so ファイル
PEP written by Barry Warsaw.

PEP 3333: Python Web Server Gateway Interface v1.0.1

この情報 PEP は、 WSGI プロトコルによってどのようにバイト列/テキストの問題が処理されるべきかを明確化しています。HTTP プロトコルそのものはバイト列指向であっても、Python 3 にあってほとんど str 型で便利に文字列処理出来るようにすることが挑戦でした。

この PEP では、リクエスト/レスポンスヘッダとメタデータに使われるいわゆる ネイティブ文字列(native strings) と、リクエストとレスポンスのボディに使われる バイト列文字列(byte strings) を区別します。

ネイティブ文字列 は常に str 型ですが、コードポイント U+0000 から U+00FF までの間に制限され、これは Latin-1 エンコーディングを使ったバイト列に変換可能です。これら文字列は環境変数辞書のキーと値や、 start_response() 関数内でのレスポンスヘッダとステータスで使われます。これらはエンコーディングに関して RFC 2616 に従わなければなりません。つまりこれらは ISO-8859-1 文字であるか、 RFC 2047 MIME エンコーディングを使わなければなりません。

WSGI アプリケーションを Python 2 から移植する開発者は、とりわけ以下に注意してください:

  • Python 2 でヘッダとしてネイティブ文字列を既に使っているアプリケーションは変更の必要はありません。(—訳注: 原文は「If the app already used strings for headers …」。native strings としないと意味が通りません。 —)
  • そうではなくアプリケーションが出力ヘッダをエンコードしていたり、入力ヘッダをデコードしていたのであれば、ヘッダは Latin-1 に再エンコードする必要があります。たとえば h.encode('utf-8') により utf-8 でエンコードされた出力ヘッダは、バイト列からネイティブ文字列に h.encode('utf-8').decode('latin-1') で変換する必要があります。(—訳注: この原文は h が元々 latin-1 で表現出来る文字セットであることを暗黙で仮定しているようです。—)
  • アプリケーションから生み出される値と write() メソッドで送信される値は、バイト列文字列でなければなりません。 start_response() 関数と環境変数はネイティブ文字列を使わなければなりません。これら 2 つは混ぜこぜには出来ません。

CGI-to-WSGI 経路やほかの CGI スタイルのプロトコルへの経路を書くサーバ実装者にとっては、彼らのユーザは前提としているプラットフォームの慣習がどうであれネイティブ文字列を使って環境変数にアクセス出来なければなりません。この溝への橋渡しのために、 wsgiref モジュールに新規関数 wsgiref.handlers.read_environ() が追加されました。これは CGI 変数を os.environ からネイティブ文字列に変換して、新しい辞書として返します。

参考

PEP 3333 - Python Web Server Gateway Interface v1.0.1
PEP written by Phillip Eby.

その他の言語変更

Python 言語コアに小さな変更がいくつか行われました:

  • format()str.format() のフォーマット文字 # が拡張されました。以前から二進、八進、十六進整数に対して順にそれぞれ 『0b』, 『0o』, 『0x』 を冠する出力をしていましたが、これは浮動小数点数、複素数、 Decimal に対しても処理するようになり、これはあとに続く桁がなくても必ず小数点を出力します。

    >>> format(20, '#o')
    '0o24'
    >>> format(12.34, '#5.0f')
    '  12.'
    

    (Suggested by Mark Dickinson and implemented by Eric Smith in bpo-7094.)

  • 新たに追加された str.format_map() メソッドも既存の str.format() メソッドの能力を拡大します。これは任意の mapping を受け付けます。この新規メソッドは Python の数多くの「辞書的な」オブジェクトとともに文字列書式化を使うことを可能にします。たとえば defaultdict, Shelf, ConfigParser, あるいは dbm などで使えるということです。カスタムな dict のサブクラスと一緒に使うのも便利で、例えばルックアップの前にキーを正規化してみたり、未知のキーを __missing__() メソッドで補ってみたりなど出来ます:

    >>> import shelve
    >>> d = shelve.open('tmp.shl')
    >>> 'The {project_name} status is {status} as of {date}'.format_map(d)
    'The testing project status is green as of February 15, 2011'
    
    >>> class LowerCasedDict(dict):
    ...     def __getitem__(self, key):
    ...         return dict.__getitem__(self, key.lower())
    >>> lcd = LowerCasedDict(part='widgets', quantity=10)
    >>> 'There are {QUANTITY} {Part} in stock'.format_map(lcd)
    'There are 10 widgets in stock'
    
    >>> class PlaceholderDict(dict):
    ...     def __missing__(self, key):
    ...         return '<{}>'.format(key)
    >>> 'Hello {name}, welcome to {location}'.format_map(PlaceholderDict())
    'Hello <name>, welcome to <location>'
    
(Suggested by Raymond Hettinger and implemented by Eric Smith in bpo-6081.)
  • The interpreter can now be started with a quiet option, -q, to prevent the copyright and version information from being displayed in the interactive mode. The option can be introspected using the sys.flags attribute:

    $ python -q
    >>> sys.flags
    sys.flags(debug=0, division_warning=0, inspect=0, interactive=0,
    optimize=0, dont_write_bytecode=0, no_user_site=0, no_site=0,
    ignore_environment=0, verbose=0, bytes_warning=0, quiet=1)
    

    (Contributed by Marcin Wojdyr in bpo-1772833).

  • hasattr() 関数は getattr() を呼び出して例外が起こるかどうかをみることで実現しています。このテクニックは、クラス辞書にない何かを __getattr__() あるいは __getattribute__() で動的に作るようなメソッドを検出するのに必要なものです。ですが以前は hasattr はあらゆる例外を捕捉してしまっていて、本物の誤りを隠してしまう可能性がありました。 hasattrAttributeError だけを捕捉するように改められ、ほかの例外はそのままにするようにしました:

    >>> class A:
    ...     @property
    ...     def f(self):
    ...         return 1 // 0
    ...
    >>> a = A()
    >>> hasattr(a, 'f')
    Traceback (most recent call last):
      ...
    ZeroDivisionError: integer division or modulo by zero
    

    (Discovered by Yury Selivanov and fixed by Benjamin Peterson; bpo-9666.)

  • 浮動小数点数または複素数に対する str()repr() 表現と同じになりました。以前は str() 形式のほうが短い表現になっていましたがこれは単に困惑させるものでした。 repr() がデフォルトで可能ななかでの一番短い表現をするようになったので、 str() があえて短い表現を取ろうとする必要性がなくなりました。

    >>> import math
    >>> repr(math.pi)
    '3.141592653589793'
    >>> str(math.pi)
    '3.141592653589793'
    

    (Proposed and implemented by Mark Dickinson; bpo-9337.)

  • memoryview オブジェクトに release() メソッドが追加され、また、これは今ではコンテクストマネージャプロトコルをサポートします。このことにより、オリジナルのオブジェクトからバッファを要求した際に獲得した任意のリソースを、適切な時点で解放できます。

    >>> with memoryview(b'abcdefgh') as v:
    ...     print(v.tolist())
    [97, 98, 99, 100, 101, 102, 103, 104]
    

    (Added by Antoine Pitrou; bpo-9757.)

  • 以前は、入れ子になったブロック内である名前が自由変数として現れる場合、局所名前空間からその名前を削除することは不正でした。

    def outer(x):
        def inner():
            return x
        inner()
        del x
    

    これは可能になりました。 except 節の対象が消去されることを思い出せば、 Python 2.6 では動き、Python 3.1 では SyntaxError を送出するこのコードは再び動きます:

    def f():
        def print_error():
            print(e)
        try:
            something
        except Exception as e:
            print_error()
            # implicit "del e" here
    

    (bpo-4617 を参照してください。)

  • 内部実装に使っている structsequence がタプルのサブタイプを作るようになっています。これが何を意味するかと言えば、 os.stat(), time.gmtime(), sys.version_info が返すような C 構造体が named tuple のように働き、またこれはタプルを期待する関数やメソッドに渡せる、ということです。これは C 構造体に、対応するピュア Python に等しい柔軟性をもたらす大きな前進です:

    >>> import sys
    >>> isinstance(sys.version_info, tuple)
    True
    >>> 'Version %d.%d.%d %s(%d)' % sys.version_info 
    'Version 3.2.0 final(0)'
    

    (Suggested by Arfrever Frehtes Taifersar Arahesis and implemented by Benjamin Peterson in bpo-8413.)

  • Warnings are now easier to control using the PYTHONWARNINGS environment variable as an alternative to using -W at the command line:

    $ export PYTHONWARNINGS='ignore::RuntimeWarning::,once::UnicodeWarning::'
    

    (Suggested by Barry Warsaw and implemented by Philip Jenvey in bpo-7301.)

  • 新たな警告カテゴリ ResourceWarning が追加されました。これはリソース消費やクリーンアップについての潜在的な問題が検出されると発行されます。これは通常のリリースビルドではデフォルトでは黙殺しますが、 warnings モジュールで意味付けを変更 (訳注: 警告フィルタ 参照) するかコマンドラインオプションで有効に出来ます。

    ResourceWarning はインタプリタがシャットダウンする時点で gc.garbage リストが空でない場合に発行されます。その際に gc.DEBUG_UNCOLLECTABLE がセットされていれば、全ての回収不能オブジェクトが印字されます。このことによりプログラマは、自身のコードがオブジェクトのファイナライズに問題を抱えていることに気付くことが出来ます。

    A ResourceWarning is also issued when a file object is destroyed without having been explicitly closed. While the deallocator for such object ensures it closes the underlying operating system resource (usually, a file descriptor), the delay in deallocating the object could produce various issues, especially under Windows. Here is an example of enabling the warning from the command line:

    $ python -q -Wdefault
    >>> f = open("foo", "wb")
    >>> del f
    __main__:1: ResourceWarning: unclosed file <_io.BufferedWriter name='foo'>
    

    (Added by Antoine Pitrou and Georg Brandl in bpo-10093 and bpo-477863.)

  • range オブジェクトが index メソッド、 count メソッドをサポートするようになりました。これは、もっと多くのオブジェクトに 抽象基底クラス collections.Sequence を完全に実装しようとする取り組みの一環です。結果として言語はより統一的な API を持つようになりました。加えて range オブジェクトは今やスライシングをサポートし、負のインデクス、 sys.maxsize を超えるインデクスもサポートします。このことは range とリストの相互運用性を高めます。

    >>> range(0, 100, 2).count(10)
    1
    >>> range(0, 100, 2).index(10)
    5
    >>> range(0, 100, 2)[5]
    10
    >>> range(0, 100, 2)[0:5]
    range(0, 10, 2)
    

    (Contributed by Daniel Stutzbach in bpo-9213, by Alexander Belopolsky in bpo-2690, and by Nick Coghlan in bpo-10889.)

  • Py2.x から callable() 組み込み関数が復活しました。 この関数は isinstance(x, collections.Callable) のように式内で 抽象基底クラス を使用するよりも、簡潔で可読性の高い手段を提供します:

    >>> callable(max)
    True
    >>> callable(20)
    False
    

    (bpo-10518 を参照してください。)

  • Python のインポート機構が、パス名に非 ASCII 文字を含むディレクトリにインストールされたモジュールをロードできるようになりました。これはユーザ名に非 ASCII 文字を含むユーザにとっての、ホームディレクトリにまつわる腹立たしい問題を解決しました。

(Required extensive work by Victor Stinner in bpo-9425.)

新たなモジュール、改良されたモジュール、非推奨のモジュール

Python の標準ライブラリは保守の努力と質の向上を大きく受けています。

Python 3.2 での最大のニュースは、 email パッケージ、 mailbox モジュール、 nntplib モジュールが Python 3 の bytes/text モデルで正しく動作するようになったことです。エンコーディングが色々混ざったメッセージを正しく処理出来るようになったのは初めてのことです。

標準ライブラリ全体を通じて、エンコーディング問題とテキスト対バイト列問題に関してより注意深い配慮がなされました。とりわけオペレーティングシステムとの連携では、Windows の MBCS エンコーディングやロケールに配慮するエンコーディング、あるいは UTF-8 を使う非 ASCII のデータ交換はより良く行えるようになりました。

もうひとつの目覚しい勝利は、 SSL 接続とセキュリティ証明書サポートの大幅な改善です。

さらに、以前よりももっと多くのクラスが今では context manager を実装し、 with 文を使った便利で信頼出来るリソースのクリーンアップをサポートしています。

email

R. David Murray による多大なる尽力により、Python 3 における email パッケージの適応可能性の問題は、ほとんど修正されました。問題は、email が典型的には str テキストよりも bytes 形式で格納され、読まれることであり、一つの email の中に複数のエンコーディングを含みうることでした。ですから email パッケージは email メッセージの解析と生成を bytes フォーマットで拡張される必要がありました。

  • 新規関数 message_from_bytes(), message_from_binary_file() 、それに新規クラス BytesFeedParser, BytesParser が、バイナリメッセージデータをパースしてモデルオブジェクトに読み込みます。

  • bytes の入力をモデルに与えると get_payload() は、デフォルトでは 8 ビットContent-Transfer-Encoding MIME ヘッダをもったメッセージボディをそのヘッダで指定された文字セットを使い、デコードして結果文字列を返します。

  • bytes の入力をモデルに与えると Generator は、 8 ビットContent-Transfer-Encoding MIME ヘッダをもったメッセージボディを、 7 ビットContent-Transfer-Encoding を持つものに変換します。

    エンコードされていない非 ASCII バイト列を持つヘッダは 未知の 8 ビット 文字セットを使った RFC 2047 エンコードであると見做されます。

  • 新規クラス BytesGenerator は出力としてバイト列を生成します。これはモデルを構築するのに使った入力にあった非 ASCII データをそのままにし、 8ビットの Content-Transfer-Encoding を持つメッセージボディに含めます。

  • smtplib モジュールの SMTP クラスが sendmail() メソッドの msg 引数としてバイト列文字列を受け付けるようになりました。新しく追加されたメソッド send_message()msg 引数に Message オブジェクトを受け付けます。このメソッドは msg にあたえたオブジェクトから from_addr アドレスと to_addrs アドレスを直接取ることが出来ます。

(Proposed and implemented by R. David Murray, bpo-4661 and bpo-10321.)

elementtree

xml.etree.ElementTree パッケージと xml.etree.cElementTree の対応するものがバージョン 1.3 にアップデートしました。

有用な関数とメソッドが幾つか新たに追加されました:

2つのメソッドが非推奨になりました:

  • xml.etree.ElementTree.getchildren() 代わりに list(elem) を使用してください。
  • xml.etree.ElementTree.getiterator() 代わりに Element.iter を使用してください。

アップデートの詳細については Fredrik Lundh のウェブサイト にある Introducing ElementTree を参照してください。

(Contributed by Florent Xicluna and Fredrik Lundh, bpo-6472.)

functools

  • functools モジュールに関数呼び出しをキャッシュするデコレータが追加されています。 functools.lru_cache() を使うと、同じ結果が期待される場合の外部リソースへの問い合わせ繰り返しを防ぐことができます。

    たとえばデータベース問い合わせ関数をキャッシュするデコレータで修飾すれば、人気の検索のデータベースアクセスを省けます:

    >>> import functools
    >>> @functools.lru_cache(maxsize=300)
    ... def get_phone_number(name):
    ...     c = conn.cursor()
    ...     c.execute('SELECT phonenumber FROM phonelist WHERE name=?', (name,))
    ...     return c.fetchone()[0]
    
    >>> for name in user_requests:        
    ...     get_phone_number(name)        # cached lookup
    

    効果的なキャッシュサイズを選択する助けとなるよう、ラップされた関数はキャッシュの統計を追跡する道具にもなっています:

    >>> get_phone_number.cache_info()     
    CacheInfo(hits=4805, misses=980, maxsize=300, currsize=300)
    

    テーブル phonelist が更新されたのであれば、内容が古くなったキャッシュをクリアできます:

    >>> get_phone_number.cache_clear()
    

    (Contributed by Raymond Hettinger and incorporating design ideas from Jim Baker, Miki Tebeka, and Nick Coghlan; see recipe 498245, recipe 577479, bpo-10586, and bpo-10593.)

  • functools.wraps() デコレータが元の callable 関数を指し示す __wrapped__ 属性を追加するようになりました。これにより包まれた関数を調べることができます。定義されていれば __annotations__ もコピーされます。また、元の callable に定義されていないかもしれない __doc__ のような欠けた属性を潔くスキップするようにしました。

    上の例の場合、キャッシュは元の関数を復元することで削除できます:

    >>> get_phone_number = get_phone_number.__wrapped__    # uncached function
    

    (By Nick Coghlan and Terrence Cole; bpo-9567, bpo-3445, and bpo-8814.)

  • 拡張比較 (rich comparison) メソッドを持つクラスを書く助けとなるよう、新たなデコレータ functools.total_ordering() が追加されました。これは既存の等式と不等式メソッドを使って残りのメソッドを埋めます。

    例えば __eq____lt__ を与えると、 total_ordering()__le__, __gt__, __ge__ を補います:

    @total_ordering
    class Student:
        def __eq__(self, other):
            return ((self.lastname.lower(), self.firstname.lower()) ==
                    (other.lastname.lower(), other.firstname.lower()))
    
        def __lt__(self, other):
            return ((self.lastname.lower(), self.firstname.lower()) <
                    (other.lastname.lower(), other.firstname.lower()))
    

    total_ordering デコレータが残りの比較メソッドを自動的に補います。

    (Contributed by Raymond Hettinger.)

  • Python 2 からのプログラムの移植のために使える、 functools.cmp_to_key() 関数が追加されました。これは旧式の比較関数をモダンな key function に変換します:

    >>> # locale-aware sort order
    >>> sorted(iterable, key=cmp_to_key(locale.strcoll)) 
    

    ソートの例と簡単なチュートリアルは ソート HOW TO を参照して下さい。

    (Contributed by Raymond Hettinger.)

itertools

  • itertools モジュールに、 APLscan 演算子や NumPyaccumulate 関数をモデルにした accumulate() が新しく追加されました:

    >>> from itertools import accumulate
    >>> list(accumulate([8, 2, 50]))
    [8, 10, 60]
    
    >>> prob_dist = [0.1, 0.4, 0.2, 0.3]
    >>> list(accumulate(prob_dist))      # cumulative probability distribution
    [0.1, 0.5, 0.7, 1.0]
    

    accumulate() の使用例が examples for the random module にあります。

    (Contributed by Raymond Hettinger and incorporating design suggestions from Mark Dickinson.)

collections

  • collections.Counter クラスに 2 つの形式のインプレイス減算が追加されました。 saturating subtraction (訳注: 結果を [min, max] に収める演算) を行う既存の -= 演算子に加え、新しく追加された subtract() メソッドは通常の減算を行います。前者は要素数に正しか持たない 多重集合 に用いるのに適していて、後者は要素数に負を許容するユースケースにより適しています。

    >>> from collections import Counter
    >>> tally = Counter(dogs=5, cats=3)
    >>> tally -= Counter(dogs=2, cats=8)    # saturating subtraction
    >>> tally
    Counter({'dogs': 3})
    
    >>> tally = Counter(dogs=5, cats=3)
    >>> tally.subtract(dogs=2, cats=8)      # regular subtraction
    >>> tally
    Counter({'dogs': 3, 'cats': -5})
    

    (Contributed by Raymond Hettinger.)

  • collections.OrderedDict クラスに move_to_end() メソッド (訳注: 「end」は「端」) が追加されました。これは既存のキーを受け取って、順序付けされたシーケンスの最初の位置か最後の位置に移動します。

    デフォルトでは要素は最後の位置に移動します。これはエントリを od[k] = od.pop(k) で入れ替えるのと同じです。

    高速な端への移動操作はエントリの並べなおしに便利です。例えば、最も最近使った順序でエントリを年齢付けすることによってアクセス順を追跡するのに、順序付けされた辞書を使えます。

    >>> from collections import OrderedDict
    >>> d = OrderedDict.fromkeys(['a', 'b', 'X', 'd', 'e'])
    >>> list(d)
    ['a', 'b', 'X', 'd', 'e']
    >>> d.move_to_end('X')
    >>> list(d)
    ['a', 'b', 'd', 'e', 'X']
    

    (Contributed by Raymond Hettinger.)

  • collections.deque クラスに 2 つのメソッド count()reverse() が追加されました。これでさらに list との置換可能性が増しました:

    >>> from collections import deque
    >>> d = deque('simsalabim')
    >>> d.count('s')
    2
    >>> d.reverse()
    >>> d
    deque(['m', 'i', 'b', 'a', 'l', 'a', 's', 'm', 'i', 's'])
    

    (Contributed by Raymond Hettinger.)

threading

threading モジュールに新たに同期クラス Barrier が追加されました。これは多重のスレッドに、それら全てが共通のバリアポイントに到達するまで待たせます。バリアは、複数の事前条件を持ったタスクを、その前任タスクの全てが完了するまで走らせたくない場合に有用です。

バリアは任意の数のスレッドに対して使えます。これは Rendezvous を一般化したもので、それは 2 つのスレッドに対してのみに定義されていました。

二段階の周期バリアとしての実装なので、 Barrier オブジェクトはループ内での利用に適しています。分けられた filling (満杯にする) 段階と draining (排出する) 段階は、スレッドのどれか一つが元に戻ってバリアに再び入る前に、全てのスレッドが解放 (排出) されることを保障します。バリアはそれぞれの周期のあとに完全にリセットされます。

バリアは例えばこのように使います:

from threading import Barrier, Thread

def get_votes(site):
    ballots = conduct_election(site)
    all_polls_closed.wait()        # do not count until all polls are closed
    totals = summarize(ballots)
    publish(site, totals)

all_polls_closed = Barrier(len(sites))
for site in sites:
    Thread(target=get_votes, args=(site,)).start()

この例ではバリアは、全ての投票所が閉じるまではどの投票サイトでも得票を数えないルールを強制しています。バリアを使ったソリューションが threading.Thread.join() でのそれといかに似ているか気付くと思います。ですがバリアポイントを通過した後に、スレッドは生き続けて (投票を集計する (summarizing ballots) という) 仕事を続けます。

いずれかの前任タスクがハングしたり遅延したりしうるのであれば、バリアを timeout 付きで作ることができます。全ての前任タスクがバリアポイントに到達する前にタイムアウトの期間が経過すると、全ての待機スレッドは解放されて BrokenBarrierError 例外が発生します:

def get_votes(site):
    ballots = conduct_election(site)
    try:
        all_polls_closed.wait(timeout=midnight - time.now())
    except BrokenBarrierError:
        lockbox = seal_ballots(ballots)
        queue.put(lockbox)
    else:
        totals = summarize(ballots)
        publish(site, totals)

この例ではバリアは、もっと手堅いルールを強制しています。選挙サイトのどれかが午前零時前に終了しなかった場合バリアがタイムアウトし、投票用紙は密封されて後の処理のためのキューに預けられます。

See Barrier Synchronization Patterns for more examples of how barriers can be used in parallel computing. Also, there is a simple but thorough explanation of barriers in The Little Book of Semaphores, section 3.6.

(Contributed by Kristján Valur Jónsson with an API review by Jeffrey Yasskin in bpo-8777.)

datetime と time

  • datetime モジュールに新たに timezone 型が追加されています。これは tzinfo インターフェイスを実装し、UTC からの固定オフセットとタイムゾーン名を返します。これによりタイムゾーンを意識する (timezone-aware な) datetime オブジェクトを容易に作れます:

    >>> from datetime import datetime, timezone
    
    >>> datetime.now(timezone.utc)
    datetime.datetime(2010, 12, 8, 21, 4, 2, 923754, tzinfo=datetime.timezone.utc)
    
    >>> datetime.strptime("01/01/2000 12:00 +0000", "%m/%d/%Y %H:%M %z")
    datetime.datetime(2000, 1, 1, 12, 0, tzinfo=datetime.timezone.utc)
    
  • さらに、 timedelta オブジェクトは今では float を掛けることができ、 floatint で割ることができます。また、 timedelta オブジェクトは別の timedelta で割ることが出来ます。

  • datetime.date.strftime() メソッドにはもう 1900 年以降という制限はありません。新しくサポートされる年の範囲は 1000 以上 9999 以下です。

  • Whenever a two-digit year is used in a time tuple, the interpretation has been governed by time.accept2dyear. The default is True which means that for a two-digit year, the century is guessed according to the POSIX rules governing the %y strptime format.

    Starting with Py3.2, use of the century guessing heuristic will emit a DeprecationWarning. Instead, it is recommended that time.accept2dyear be set to False so that large date ranges can be used without guesswork:

    >>> import time, warnings
    >>> warnings.resetwarnings()      # remove the default warning filters
    
    >>> time.accept2dyear = True      # guess whether 11 means 11 or 2011
    >>> time.asctime((11, 1, 1, 12, 34, 56, 4, 1, 0))
    Warning (from warnings module):
      ...
    DeprecationWarning: Century info guessed for a 2-digit year.
    'Fri Jan  1 12:34:56 2011'
    
    >>> time.accept2dyear = False     # use the full range of allowable dates
    >>> time.asctime((11, 1, 1, 12, 34, 56, 4, 1, 0))
    'Fri Jan  1 12:34:56 11'
    

    いくつもの関数が今では日付範囲を大きく拡張しています。 time.accept2dyear が偽である場合、 time.asctime() 関数は C int の任意の整数を年として受け付け、 time.mktime()time.strftime() は対応する OS 関数でサポートされる完全な範囲を受け付けます。(—訳注: 「全ての」と言っていない通りです。たとえば time.asctime(time.localtime(32535304320)) がたとえ使えなくても time.asctime((3002, 1, 1, 9, 32, 0, 3, 1, 0)) は許されます。—)

(Contributed by Alexander Belopolsky and Victor Stinner in bpo-1289118, bpo-5094, bpo-6641, bpo-2706, bpo-1777412, bpo-8013, and bpo-10827.)

math

math モジュールがアップデートされ、C99 標準に触発されて6つの新たな関数が追加されました。

The isfinite() function provides a reliable and fast way to detect special values. It returns True for regular numbers and False for Nan or Infinity:

>>> from math import isfinite
>>> [isfinite(x) for x in (123, 4.56, float('Nan'), float('Inf'))]
[True, True, False, False]

expm1() 関数は小さな x に対しても精度を失うこと (訳注: 桁落ち) なく e**x-1 を計算します。 通常、桁落ちは非常に近い数の引き算で起こります。

>>> from math import expm1
>>> expm1(0.013671875)   # more accurate way to compute e**x-1 for a small x
0.013765762467652909

erf() 関数は確率積分、すなわち 誤差関数 を返します。 相補誤差関数 erfc()1 - erf(x) です:

>>> from math import erf, erfc, sqrt
>>> erf(1.0/sqrt(2.0))   # portion of normal distribution within 1 standard deviation
0.682689492137086
>>> erfc(1.0/sqrt(2.0))  # portion of normal distribution outside 1 standard deviation
0.31731050786291404
>>> erf(1.0/sqrt(2.0)) + erfc(1.0/sqrt(2.0))
1.0

gamma() 関数は階乗を連続的に拡張したものです。詳細は ガンマ関数 を参照してください。ガンマ関数は階乗に関係しているため、小さな x でも大きくなります。そのため、ガンマ関数の自然対数を計算する lgamma() 関数があります。

>>> from math import gamma, lgamma
>>> gamma(7.0)           # six factorial
720.0
>>> lgamma(801.0)        # log(800 factorial)
4551.950730698041

(Contributed by Mark Dickinson.)

abc

abc モジュールは abstractclassmethod()abstractstaticmethod() をサポートしました。

これらのツールによって特定の classmethod()staticmethod() を実装する必要のある 抽象基底クラス を定義することが出来ます。

class Temperature(metaclass=abc.ABCMeta):
    @abc.abstractclassmethod
    def from_fahrenheit(cls, t):
        ...
    @abc.abstractclassmethod
    def from_celsius(cls, t):
        ...

(Patch submitted by Daniel Urban; bpo-5867.)

io

io.BytesIOmemoryview() と同様の機能を提供する新たなメソッド getbuffer() が追加されました。 このメソッドはコピーせずにデータの編集可能なビューを作成します。 バッファのランダムアクセスとスライス記法のサポートはインプレースな編集に適しています:

>>> REC_LEN, LOC_START, LOC_LEN = 34, 7, 11

>>> def change_location(buffer, record_number, location):
...     start = record_number * REC_LEN + LOC_START
...     buffer[start: start+LOC_LEN] = location

>>> import io

>>> byte_stream = io.BytesIO(
...     b'G3805  storeroom  Main chassis    '
...     b'X7899  shipping   Reserve cog     '
...     b'L6988  receiving  Primary sprocket'
... )
>>> buffer = byte_stream.getbuffer()
>>> change_location(buffer, 1, b'warehouse  ')
>>> change_location(buffer, 0, b'showroom   ')
>>> print(byte_stream.getvalue())
b'G3805  showroom   Main chassis    '
b'X7899  warehouse  Reserve cog     '
b'L6988  receiving  Primary sprocket'

(Contributed by Antoine Pitrou in bpo-5506.)

reprlib

カスタムコンテナの __repr__() メソッドを書く際には、メンバがそのコンテナ自身を参照するケースを処理し忘れやすいものです。 listset といったPython の組み込みオブジェクトでは、表現文字列の再帰部分内で自己参照を 「…」 と表示することで処理しています。

そうした __repr__() メソッドを書く助けとなるように、 reprlib モジュールに新規デコレータ recursive_repr() が追加されました。これは __repr__() の再帰呼び出しを検出してプレイスホルダ文字列に置換します:

>>> class MyList(list):
...     @recursive_repr()
...     def __repr__(self):
...         return '<' + '|'.join(map(repr, self)) + '>'
...
>>> m = MyList('abc')
>>> m.append(m)
>>> m.append('x')
>>> print(m)
<'a'|'b'|'c'|...|'x'>

(Contributed by Raymond Hettinger in bpo-9826 and bpo-9840.)

logging

上記の辞書ベースの設定に加え、logging パッケージには他にも多くの改良があります。

ロギングのドキュメントは 基本チュートリアル上級チュートリアルクックブック により増強されてきました。ロギングについて学習するにはこれらのドキュメントが最速の方法です。

セットアップ関数 logging.basicConfig()style 引数が追加され、これにより異なる 3 つのタイプの文字列書式化がサポートされます。デフォルトは伝統的な % 書式化を使う 「%」 で、 str.format() スタイルの 「{」 、 string.Template で提供されるシェルスタイルの 「$」 をセット出来ます。以下の 3 つの設定は等価です:

>>> from logging import basicConfig
>>> basicConfig(style='%', format="%(name)s -> %(levelname)s: %(message)s")
>>> basicConfig(style='{', format="{name} -> {levelname} {message}")
>>> basicConfig(style='$', format="$name -> $levelname: $message")

ロギングイベントが発生する前に設定がセットアップされていない場合は、 WARNING レベル以上について sys.stderr に向けられた StreamHandler をデフォルトで使うようになりました。以前はこの場合は logging.raiseExceptions 属性の設定に従って、例外が発生するか黙って捨てられるかのいずれかでした。この新しいデフォルトの振る舞いは、ハンドラを属性 logging.lastResort にセットすることで実現しています。

The use of filters has been simplified. Instead of creating a Filter object, the predicate can be any Python callable that returns True or False.

ほかにも柔軟性を高め、設定を単純化する数多くの改善がありました。Python 3.2 での全ての変更についてはモジュールのドキュメントを参照してください。

csv

csv モジュールは新たな方言 unix_dialect をサポートしました。 この方言は全フィールドをクォートし、行末を伝統的な Unix 形式の '\n' にします。 登録された方言名は unix です。

csv.DictWriter に新たなメソッド writeheader() が追加されました。 最初の列をドキュメントのフィールド名に書き出すのに使用します:

>>> import csv, sys
>>> w = csv.DictWriter(sys.stdout, ['name', 'dept'], dialect='unix')
>>> w.writeheader()
"name","dept"
>>> w.writerows([
...     {'name': 'tom', 'dept': 'accounting'},
...     {'name': 'susan', 'dept': 'Salesl'}])
"tom","accounting"
"susan","sales"

(New dialect suggested by Jay Talbot in bpo-5975, and the new method suggested by Ed Abraham in bpo-1537721.)

contextlib

新しく追加され、そして少しばかりハートを揺さぶるツール ContextDecorator は、関数デコレータとしての任務も果たす context manager を作るのに役立つものです。

利便性のためにこの新機能は contextmanager() で使われているので、両方の役割をサポートするのにことさら労力は要しません。

基本的なアイディアは、コンテクストマネージャも関数デコレータも、ともに事前アクション・事後アクションラッパーとして使うことが出来るというものです。コンテクストマネージャは with 文を使ったステートメント (文) のグループを包みますし、関数デコレータは関数に取り囲まれたステートメントのグループを包みます。そうです、どちらかの役割で使える事前アクションあるいは事後アクションラッパーを書く必要性は、しばしば起こることです。

たとえば関数やステートメントのグループをロガーで包んで、開始時刻と終了時刻を追跡できるようにするとしばしば便利です。このタスクをこなすために関数デコレータとコンテクストマネージャの両方を書く代わりに、 contextmanager() が単一の定義に両方の能力をもたらしてくれます:

from contextlib import contextmanager
import logging

logging.basicConfig(level=logging.INFO)

@contextmanager
def track_entry_and_exit(name):
    logging.info('Entering: %s', name)
    yield
    logging.info('Exiting: %s', name)

ContextDecorator が使われる前の 3.1 までの contextmanager() では、これはコンテクストマネージャとして使えるだけでした:

with track_entry_and_exit('widget loader'):
    print('Some time consuming activity goes here')
    load_widget()

今ではこれはデコレータとしても使えます:

@track_entry_and_exit('widget loader')
def activity():
    print('Some time consuming activity goes here')
    load_widget()

一つの場所に二重の責務を持たせることには普通ある種の制約を持ち込みます。コンテクストマネージャには普通は with 文で使える値を返せる柔軟性を持ちますが、関数デコレータにはそれに匹敵するものはありません。

上の例の場合は、track_entry_and_exit コンテクストマネージャが、取り囲まれたステートメント本体で使えるロギングのインスタンスを返す綺麗な方法はありません。

(Contributed by Michael Foord in bpo-9110.)

decimal と fractions

Mark Dickinson は、異なる数値データの型が実際の値が等しい場合は常に同じハッシュ値を持つことを保証する、エレガントで効率的なスキームを作り上げました (bpo-8188):

assert hash(Fraction(3, 2)) == hash(1.5) == \
       hash(Decimal("1.5")) == hash(complex(1.5, 0))

いくつかのハッシュ化の詳細が、新規属性 sys.hash_info で公開されました。これはハッシュ値のビット幅、数値ハッシュ計算に利用される素数の法 (prime modulus)、 infinity (無限大)nan (非数) に対して返されるハッシュ値、複素数の虚部を表すための乗数について記述しています:

>>> sys.hash_info 
sys.hash_info(width=64, modulus=2305843009213693951, inf=314159, nan=0, imag=1000003)

種々の数値型の相互操作性についての制限の初期の決断は緩和されました。 Decimal('1.1') + float('1.1') のように、算術式内で暗黙に混合することは、今でもサポートされません (そして賢明でもありません)。これは後者 (float('1.1')) は二進浮動小数点数を構築する過程で情報を損失するからです。しかしながら既存の浮動小数点数値は損失なく十進もしくは有理数表現のどちらかに変換出来るので、それらのコンストラクタに浮動小数点数を渡せるようにして型違いの比較をサポートすることは理に適います。

同じ変更が fractions.Fraction にもなされたので、 from_float()from_decimal() も、もはや必要ありません (bpo-8294):

>>> from decimal import Decimal
>>> from fractions import Fraction
>>> Decimal(1.1)
Decimal('1.100000000000000088817841970012523233890533447265625')
>>> Fraction(1.1)
Fraction(2476979795053773, 2251799813685248)

decimal モジュールへのもう一つの有用な変更は Context.clamp 属性がいまではパブリックになったことです。これは IEEE 754 で規定された固定幅十進交換形式に対応するコンテキストを作成するのに有用です。 (see bpo-8540).

(Contributed by Mark Dickinson and Raymond Hettinger.)

ftp

ftplib.FTP クラスがコンテキスト管理プロトコルをサポートするようになりました。with ブロックを抜ける際に無条件に FTP 接続をクローズします (クローズ処理で発生する socket.error は無視されます)。:

>>> from ftplib import FTP
>>> with FTP("ftp1.at.proftpd.org") as ftp:
        ftp.login()
        ftp.dir()

'230 Anonymous login ok, restrictions apply.'
dr-xr-xr-x   9 ftp      ftp           154 May  6 10:43 .
dr-xr-xr-x   9 ftp      ftp           154 May  6 10:43 ..
dr-xr-xr-x   5 ftp      ftp          4096 May  6 10:43 CentOS
dr-xr-xr-x   3 ftp      ftp            18 Jul 10  2008 Fedora

ちなみに mmap.mmapfileinput.input() のようなほかのファイルライクなオブジェクトも自動クローズするコンテキスト管理プロトコルをサポートするようになっていたりします:

with fileinput.input(files=('log1.txt', 'log2.txt')) as f:
    for line in f:
        process(line)

(Contributed by Tarek Ziadé and Giampaolo Rodolà in bpo-4972, and by Georg Brandl in bpo-8046 and bpo-1286.)

FTP_TLS クラスが context パラメータを受け取れるようになりました。これには ssl.SSLContext オブジェクトを渡します。これは SSL コンフィグレーションオプション、証明書、秘密鍵を単一の (たぶん長生きの) 構造にまとめあげてくれるものです。

(Contributed by Giampaolo Rodolà; bpo-8806.)

popen

os.popen() ならびに subprocess.Popen() 関数が自動的にファイル記述子を閉じる with 文をサポートしました。

(Contributed by Antoine Pitrou and Brian Curtin in bpo-7461 and bpo-10554.)

select

select モジュールに新規定数属性 PIPE_BUF が公開されました。これは select.select() がパイプが書き込み準備が出来ていると主張した場合に、操作がブロックされないことが保障される最小バイト数です。

>>> import select
>>> select.PIPE_BUF
512

(Available on Unix systems. Patch by Sébastien Sablé in bpo-9862)

gzip と zipfile

gzip.GzipFileio.BufferedIOBase 抽象基底クラス を継承しました (truncate() をのぞく)。 peek() メソッドが追加され、シーク不能なファイルオブジェクトならびにゼロ埋めされたファイルオブジェクトをサポートしました。

また、gzip モジュールにより簡便でインメモリな圧縮および解凍を行う compress() ならびに decompress() 関数が追加されました。 圧縮や解凍の前に bytes としてエンコードしなければならない点に注意してください:

>>> import gzip
>>> s = 'Three shall be the number thou shalt count, '
>>> s += 'and the number of the counting shall be three'
>>> b = s.encode()                        # convert to utf-8
>>> len(b)
89
>>> c = gzip.compress(b)
>>> len(c)
77
>>> gzip.decompress(c).decode()[:42]      # decompress and convert to text
'Three shall be the number thou shalt count'

(Contributed by Anand B. Pillai in bpo-3488; and by Antoine Pitrou, Nir Aides and Brian Curtin in bpo-9962, bpo-1675951, bpo-7471 and bpo-2846.)

さらに zipfile.ZipExtFile はアーカイブ内に格納されるファイルを表現するように内部的に書き換えられました。その新しい実装は顕著に高速となり、また io.BufferedReader 内に包めばさらにスピードアップ出来ます。またこれは、 readreadline 呼び出しを挟み込むと誤った結果となっていた問題も解決します。

(Patch submitted by Nir Aides in bpo-7610.)

tarfile

TarFile クラスは今ではコンテキストマネージャとして使えます。加えて、その add() メソッドに新しいオプション filter が追加されました。これはファイルをアーカイブに追加するかどうかを制御し、また、ファイルのメタデータを編集するのにも使えます。

The new filter option replaces the older, less flexible exclude parameter which is now deprecated. If specified, the optional filter parameter needs to be a keyword argument. The user-supplied filter function accepts a TarInfo object and returns an updated TarInfo object, or if it wants the file to be excluded, the function can return None:

>>> import tarfile, glob

>>> def myfilter(tarinfo):
...     if tarinfo.isfile():             # only save real files
...         tarinfo.uname = 'monty'      # redact the user name
...         return tarinfo

>>> with tarfile.open(name='myarchive.tar.gz', mode='w:gz') as tf:
...     for filename in glob.glob('*.txt'):
...         tf.add(filename, filter=myfilter)
...     tf.list()
-rw-r--r-- monty/501        902 2011-01-26 17:59:11 annotations.txt
-rw-r--r-- monty/501        123 2011-01-26 17:59:11 general_questions.txt
-rw-r--r-- monty/501       3514 2011-01-26 17:59:11 prion.txt
-rw-r--r-- monty/501        124 2011-01-26 17:59:11 py_todo.txt
-rw-r--r-- monty/501       1399 2011-01-26 17:59:11 semaphore_notes.txt

(Proposed by Tarek Ziadé and implemented by Lars Gustäbel in bpo-6856.)

hashlib

hashlib モジュールに、2 つの定数属性が追加されました。全ての実装で利用可能であることが保障されているハッシュアルゴリズムのリストと、現在の実装で利用可能なそれらリストの 2 つです:

>>> import hashlib

>>> hashlib.algorithms_guaranteed
{'sha1', 'sha224', 'sha384', 'sha256', 'sha512', 'md5'}

>>> hashlib.algorithms_available
{'md2', 'SHA256', 'SHA512', 'dsaWithSHA', 'mdc2', 'SHA224', 'MD4', 'sha256',
'sha512', 'ripemd160', 'SHA1', 'MDC2', 'SHA', 'SHA384', 'MD2',
'ecdsa-with-SHA1','md4', 'md5', 'sha1', 'DSA-SHA', 'sha224',
'dsaEncryption', 'DSA', 'RIPEMD160', 'sha', 'MD5', 'sha384'}

(Suggested by Carl Chenet in bpo-7418.)

ast

The ast module has a wonderful a general-purpose tool for safely evaluating expression strings using the Python literal syntax. The ast.literal_eval() function serves as a secure alternative to the builtin eval() function which is easily abused. Python 3.2 adds bytes and set literals to the list of supported types: strings, bytes, numbers, tuples, lists, dicts, sets, booleans, and None.

>>> from ast import literal_eval

>>> request = "{'req': 3, 'func': 'pow', 'args': (2, 0.5)}"
>>> literal_eval(request)
{'args': (2, 0.5), 'req': 3, 'func': 'pow'}

>>> request = "os.system('do something harmful')"
>>> literal_eval(request)
Traceback (most recent call last):
  ...
ValueError: malformed node or string: <_ast.Call object at 0x101739a10>

(Implemented by Benjamin Peterson and Georg Brandl.)

os

ファイル名と環境変数に使われるエンコーディングは OS ごとに様々です。 os モジュールは新たに 2 つの関数 fsencode()fsdecode() を追加しました。それぞれファイル名のエンコード、デコードを行います:

>>> import os
>>> filename = 'Sehenswürdigkeiten'
>>> os.fsencode(filename)
b'Sehensw\xc3\xbcrdigkeiten'

いくつかの OS では環境変数内のエンコードされたバイト列に直接アクセス出来ます。もしそうであれば os.supports_bytes_environ 定数は真です。

エンコードされた環境変数への直接アクセス (可能な場合) には、新規関数 os.getenvb() または os.environb を使ってください。これは os.environ のバイト列バージョンです。

(Contributed by Victor Stinner.)

shutil

shutil.copytree() 関数に新たに 2 つのオプションが追加されました:

  • ignore_dangling_symlinks: symlinks=False とするとこの関数は、ファイルがシンボリックリンクだった場合にリンクそのものではなくそれが指しているファイルをコピーします。 ignore_dangling_symlinks を真にすると、そのファイルが存在しない場合のエラーを無視します。
  • copy_function: これはファイルをコピーするのに使われる呼び出し可能オブジェクトです。デフォルトでは shutil.copy2() が使われます。

(Contributed by Tarek Ziadé.)

これらに加え、 shutil モジュールは ZIP ファイル、未圧縮の tar ファイル、gzip 圧縮の tar、 bzip 圧縮の tar のための archiving operations を新たにサポートします。また、追加のアーカイブファイルフォーマットを登録する関数もあります (例えば xz 圧縮の tar やカスタムフォーマット)。

そのメインとなるのが make_archive()unpack_archive() です。デフォルトではカレントディレクトリ (os.chdir() で変えれます) とそのサブディレクトリの両方を処理します。アーカイブファイル名はフルパス名で指定しなければなりません(訳注: これの真偽不明。リファレンスに対応する記述なし)。アーカイブするステップは非破壊的です (つまりオリジナルのファイルは変更されずにそのままにされます)。

>>> import shutil, pprint

>>> os.chdir('mydata')  # change to the source directory
>>> f = shutil.make_archive('/var/backup/mydata',
...                         'zip')      # archive the current directory
>>> f                                   # show the name of archive
'/var/backup/mydata.zip'
>>> os.chdir('tmp')                     # change to an unpacking
>>> shutil.unpack_archive('/var/backup/mydata.zip')  # recover the data

>>> pprint.pprint(shutil.get_archive_formats())  # display known formats
[('bztar', "bzip2'ed tar-file"),
 ('gztar', "gzip'ed tar-file"),
 ('tar', 'uncompressed tar file'),
 ('zip', 'ZIP file')]

>>> shutil.register_archive_format(     # register a new archive format
...     name='xz',
...     function=xz.compress,           # callable archiving function
...     extra_args=[('level', 8)],      # arguments to the function
...     description='xz compression'
... )

(Contributed by Tarek Ziadé.)

sqlite3

sqlite3 モジュールが pysqlite バージョン 2.6.0 に更新されました。これには 2 つの新機能があります。

  • sqlite3.Connection.in_transit 属性は、未コミットの変更のためのアクティブなトランザクションがあると真になります。
  • sqlite3.Connection.enable_load_extension() メソッドと sqlite3.Connection.load_extension() メソッドにより 「.so」 ファイルから SQLite 拡張をロードできます。良く知られた拡張の一つとして、SQLite と一緒に配布されている全文検索拡張があります。

(Contributed by R. David Murray and Shashwat Anand; bpo-8845.)

html

ただ一つの関数 escape() が提供される、新しい html モジュールが導入されました。これは HTML マークアップから予約されている文字をエスケープするのに使います:

>>> import html
>>> html.escape('x > 2 && x < 7')
'x &gt; 2 &amp;&amp; x &lt; 7'

socket

socket モジュールに新たに二つの改善がありました。

  • ソケットオブジェクトに detach() メソッドが追加されました。これは背後のファイル記述子を閉じることなくソケットをクローズ状態にします。これによりファイル記述子は他の目的に再利用出来ます。 (Added by Antoine Pitrou; bpo-8524.)
  • socket.create_connection() がコンテキスト管理プロトコルをサポートするようになりました。with ブロックを抜ける際に無条件にソケットをクローズします (クローズ処理で発生する socket.error は無視されます)。 (Contributed by Giampaolo Rodolà; bpo-9794.) (—訳注: リファレンスもそうなのですが、「 socket.create_connection() が with をサポート」というのは実態とは違うんじゃないかと思います(この関数のユーザからは同じにみえたとしても)。実際には socket.socket がコンテキストマネージャをサポートしています。 socket.py 参照。–)

ssl

ssl モジュールは、セキュアな (暗号化され、認証された) インターネット接続のために共通の要求を満足するための数多くの機能を追加しています:

  • 新規クラス SSLContext は、プロトコル設定や証明書、秘密鍵やそのた色々なオプションのような、永続的 SSL データの容器として働きます。その中のメソッド wrap_socket() を使うと、 SSL コンテキストから SSL ソケットを作れます。
  • 新規関数 ssl.match_hostname() はより高水準なプロトコルのためのサーバの身元検証を、HTTPS のルール (RFC 2818 より) を実装することでサポートします。これはほかのプロトコルにも適切なものです。
  • The ssl.wrap_socket() constructor function now takes a ciphers argument. The ciphers string lists the allowed encryption algorithms using the format described in the OpenSSL documentation.
  • 最新版の OpenSSL にリンクしていれば、 ssl モジュールは TLS プロトコルに対する Server Name Indication 拡張 (訳注: SNI, RFC 4366) をサポートします。これは単一の IP ポートで異なった証明書を使った複数「バーチャルホスト」をもたらすものです。この拡張はクライアントモードでのみサポートされ、 ssl.SSLContext.wrap_socket()server_hostname を渡すことで活性化されます。
  • ssl モジュールに色々オプションが追加されました。例えば OP_NO_SSLv2 は安全でなく時代遅れの SSLv2 を無効にします。
  • 拡張はOpenSSL の全ての暗号とメッセージダイジェストアルゴリズムをロードします。SSL 証明書の中に検証できないものがある場合、」unknown algorithm」 エラーを報告します。
  • 使われている OpenSSL のバージョンを、モジュール属性 ssl.OPENSSL_VERSION (文字列)、 ssl.OPENSSL_VERSION_INFO (5-タプル)、および ssl.OPENSSL_VERSION_NUMBER (整数) から取れるようになりました。

(Contributed by Antoine Pitrou in bpo-8850, bpo-1589, bpo-8322, bpo-5639, bpo-4870, bpo-8484, and bpo-8321.)

nntp

nntplib モジュールが改造されて、より良い bytes とテキストについての意味付けを行うようになり、またより実用的な API になりました。これら実装は nntplib の Python 3.1 版との互換性を破壊しますが、もともとそれら自身にいくぶん機能不全がありました。

セキュアな接続のサポートも追加されています。(nntplib.NNTP_SSL を使う) 暗黙の TLS、(nntplib.NNTP.starttls() を使う) 明示的な TLS ともにサポートされます。

(Contributed by Antoine Pitrou in bpo-9360 and Andrew Vant in bpo-1926.)

certificates

http.client.HTTPSConnection, urllib.request.HTTPSHandler urllib.request.urlopen() はサーバ証明書を証明書認証局 (Certification Authority (CA)) セットと照合するためのオプショナル引数を取るようになりました。これは HTTPS の公共利用で推奨されるものです。(—訳注: これは check_hostname パラメータのことを指していますが、3.4.3 でこれの扱いが変わっているのでリファレンスを注意深く読んで下さい。–)

(Added by Antoine Pitrou, bpo-9003.)

imaplib

標準 IMAP4 接続での明示的な TLS 使用を新規メソッド imaplib.IMAP4.starttls で出来るようになりました。

(Contributed by Lorenzo M. Catucci and Antoine Pitrou, bpo-4471.)

http.client

http.client モジュールに数多くの小さな API 改善がなされています。旧式 HTTP 0.9 の単純な応答 (HTTP 0.9 simple responses) はもうサポートされず、また、 strict パラメータは全てのクラスで非推奨となりました。

HTTPConnection クラスと HTTPSConnection クラスが source_address パラメータを取るようになりました。これには HTTP(S) 接続の接続元を表す (host, port) のタプルを渡します。

HTTPSConnection に、証明書検証と HTTPS バーチャルホストのサポートが追加されました。

接続オブジェクトの request() メソッドのオプショナルな body 引数には、リクエストのコンテンツを与えるために file object を渡すことが出来ました。便利のためにこれに iterable も渡すことが出来るようになりました。ただしこの場合は明示的に Content-Length ヘッダを加えなければなりません。この拡張されたインターフェイスは以前よりも遥かに柔軟です。

プロキシサーバ経由で HTTPS 接続を確立するために、新規メソッド set_tunnel() が追加されています。これにより HTTP 接続トンネリングのためのホストとポートをセットします。

http.server の振る舞いと合わせ、HTTP クライアントライブラリもヘッダを ISO-8859-1 (Latin-1) エンコーディングでエンコードするようになりました。これは既に incoming (外から来る方) ヘッダに対して行われていますが、今ではこの振る舞いは incoming、outgoing (外へ向かう方) トラフィックの両方で一貫しています (bpo-10980 内の Armin Ronacher による仕事を参照)。

unittest

unittest モジュールに数多くの改善がありました。パッケージに対する test discovery のサポートが追加され、対話プロンプトから実験しやすくなり、新しいメソッドが追加され、テスト失敗時の診断メッセージが改善され、そしてメソッド名がより良いものになりました。

  • The command-line call python -m unittest can now accept file paths instead of module names for running specific tests (bpo-10620). The new test discovery can find tests within packages, locating any test importable from the top-level directory. The top-level directory can be specified with the -t option, a pattern for matching files with -p, and a directory to start discovery with -s:

    $ python -m unittest discover -s my_proj_dir -p _test.py
    

    (Contributed by Michael Foord.)

  • unittest.case.TestCase クラスが引数なしでインスタンス化できるようになったので、対話プロンプトからお試ししてみるのが以前より簡単です。

    >>> from unittest import TestCase
    >>> TestCase().assertEqual(pow(2, 3), 8)
    

    (Contributed by Michael Foord.)

  • unittest モジュールは 2 つの新メソッド assertWarns()assertWarnsRegex() を持ちます。これらはテストのもとでコードによって所与の警告が発行されるかどうかを検証します:

    with self.assertWarns(DeprecationWarning):
        legacy_function('XYZ')
    

    (Contributed by Antoine Pitrou, bpo-9754.)

    もう一つの新メソッド assertCountEqual() は 2 つのイテラブルを比較して、要素の出現回数が同じか (順序に関わらず同じ要素が同じ数だけ出現するかどうか) をテストします:

    def test_anagram(self):
        self.assertCountEqual('algorithm', 'logarithm')
    

    (Contributed by Raymond Hettinger.)

  • unittest モジュールの大事な特長は、テスト失敗時の有意義な診断を生成するよう腐心してくれることです。可能ならば失敗は期待値と実際の出力との差分と一緒に記録されます。これは失敗したテスト実行の解析に特に役に立ちますが、差分は時々とてつもなく大きくもなりますので、新たに追加した属性 maxDiff に差分の最大長をセットすることで表示を制御できるようになりました。

  • さらにモジュールのメソッド名に数多くのクリーンアップを行いました。

    たとえば assertRegexpMatches() は看板を偽っていて本当は re.match() など呼び出したりはせず re.search() でテストしていたので、 assertRegex() にリネームされました。なおほかの正規表現を使うメソッドも今では 「Regexp」 ではなく短い様式 「Regex」 で命名されています。 – これはほかの unittest 実装で使われている命名と合致し、Python re モジュールの古い命名に合致し、また、曖昧さのないキャメルケースです。

    (Contributed by Raymond Hettinger and implemented by Ezio Melotti.)

  • 一貫性を向上させるために、長年使用されたメソッドエイリアスが推奨名に対し非推奨になりました:

    以前の名前 推奨名
    assert_() assertTrue()
    assertEquals() assertEqual()
    assertNotEquals() assertNotEqual()
    assertAlmostEquals() assertAlmostEqual()
    assertNotAlmostEquals() assertNotAlmostEqual()

    同様に、Python 3.1 で非推奨になった TestCase.fail* メソッドは Python 3.3 で削除されるはずです。 unittest ドキュメント 非推奨のエイリアス を参照してください。

    (Contributed by Ezio Melotti; bpo-9424.)

  • assertDictContainsSubset() メソッドは非推奨となりました。というのもこれは引数順を誤って実装されていたからです。これは TestCase().assertDictContainsSubset({'a':1, 'b':2}, {'a':1}) のようなテストが失敗した場合に、デバッグを困難にする見間違いを起こしやすいものでした。

    (Contributed by Raymond Hettinger.)

random

random モジュールの整数メソッドの一様分布の生成が改善されました。 以前は int(n*random()) を計算していました。 この方法では n が2の冪乗でない限り僅かにバイアスがあります。 現在の方法では次の2の冪乗の範囲まで複数の選択肢を作成し、0 <= x < n の範囲に入ったもののみを保持します。 影響を受ける関数やメソッドは randrange()randint()choice()shuffle() ならびに sample() です。

(Contributed by Raymond Hettinger; bpo-9025.)

poplib

POP3_SSL クラスが context パラメータを受け取れるようになりました。これには ssl.SSLContext オブジェクトを渡します。これは SSL コンフィグレーションオプション、証明書、秘密鍵を単一の (たぶん長生きの) 構造にまとめあげてくれるものです。

(Contributed by Giampaolo Rodolà; bpo-8807.)

asyncore

asyncore.dispatcherhandle_accepted() が追加されています。これは新しくリモート側の端点との接続が実際に確立した際に (sock, addr) ペアを伴って呼び出されます。これは古い handle_accept() を置き換えるものとして使われるでしょう。またユーザが直接 accept() を呼び出す必要もなくなります。

(Contributed by Giampaolo Rodolà; bpo-6706.)

tempfile

tempfile モジュールに新たなコンテクストマネージャ TemporaryDirectory が追加されました。一時ディレクトリの確実な後片付けを容易に行えます:

with tempfile.TemporaryDirectory() as tmpdirname:
    print('created temporary dir:', tmpdirname)

(Contributed by Neil Schemenauer and Nick Coghlan; bpo-5178.)

inspect

  • inspect モジュールに新たな関数 getgeneratorstate() が追加されました。これで簡単にジェネレータイテレータの現在状態を識別出来ます (—訳注: generator-iterator という用語を使っている箇所は Python ドキュメント全体通して多くはないのですが 2.x の yield 文 説明中に登場します。ジェネレータと同じ意味です。なお getgeneratorstate はジェネレータでないイテレータには使えません。—):

    >>> from inspect import getgeneratorstate
    >>> def gen():
    ...     yield 'demo'
    >>> g = gen()
    >>> getgeneratorstate(g)
    'GEN_CREATED'
    >>> next(g)
    'demo'
    >>> getgeneratorstate(g)
    'GEN_SUSPENDED'
    >>> next(g, None)
    >>> getgeneratorstate(g)
    'GEN_CLOSED'
    

    (Contributed by Rodolpho Eckhardt and Nick Coghlan, bpo-10220.)

  • 動的な属性を活性化することなく検索するのをサポートするために、 inspect モジュールに getattr_static() 関数が追加されました。 hasattr() とは違ってこれは本当に読み取りのみの検索であり、検索中に状態変更しないことが保障されています:

    >>> class A:
    ...     @property
    ...     def f(self):
    ...         print('Running')
    ...         return 10
    ...
    >>> a = A()
    >>> getattr(a, 'f')
    Running
    10
    >>> inspect.getattr_static(a, 'f')
    <property object at 0x1022bd788>
    
(Contributed by Michael Foord.)

pydoc

The pydoc module now provides a much-improved Web server interface, as well as a new command-line option -b to automatically open a browser window to display that server:

$ pydoc3.2 -b

(Contributed by Ron Adam; bpo-2001.)

dis

dis モジュールに、コードを調べるための 2 つの新しい関数 code_info()show_code() が追加されました。ともに、与えられた関数、メソッド、ソースコード文字列、コードオブジェクトについての詳細なコードオブジェクト情報を提供します。前者はそれを文字列で返し、後者は印字します:

>>> import dis, random
>>> dis.show_code(random.choice)
Name:              choice
Filename:          /Library/Frameworks/Python.framework/Versions/3.2/lib/python3.2/random.py
Argument count:    2
Kw-only arguments: 0
Number of locals:  3
Stack size:        11
Flags:             OPTIMIZED, NEWLOCALS, NOFREE
Constants:
   0: 'Choose a random element from a non-empty sequence.'
   1: 'Cannot choose from an empty sequence'
Names:
   0: _randbelow
   1: len
   2: ValueError
   3: IndexError
Variable names:
   0: self
   1: seq
   2: i

また、 dis() 関数が文字列引数を取れるようになり、これによって、よくあるイディオム dis(compile(s, '', 'eval'))dis(s) で一撃です:

>>> dis('3*x+1 if x%2==1 else x//2')
  1           0 LOAD_NAME                0 (x)
              3 LOAD_CONST               0 (2)
              6 BINARY_MODULO
              7 LOAD_CONST               1 (1)
             10 COMPARE_OP               2 (==)
             13 POP_JUMP_IF_FALSE       28
             16 LOAD_CONST               2 (3)
             19 LOAD_NAME                0 (x)
             22 BINARY_MULTIPLY
             23 LOAD_CONST               1 (1)
             26 BINARY_ADD
             27 RETURN_VALUE
        >>   28 LOAD_NAME                0 (x)
             31 LOAD_CONST               0 (2)
             34 BINARY_FLOOR_DIVIDE
             35 RETURN_VALUE

要はこれらによって、CPython がどう実装されているか探索してみたり、言語構文が裏方で何をするのか見てみたりすることがより簡単になったということです。

(Contributed by Nick Coghlan in bpo-9147.)

dbm

全データベースモジュールが get()setdefault() メソッドをサポートしました。

(Suggested by Ray Allen in bpo-9523.)

ctypes

C ssize_t データ型を表現する新たな型 ctypes.c_ssize_t が追加されました。

site

site モジュールに、Python インストレーションの詳細を報告するのに有益な3つの新たな関数が追加されました。

  • getsitepackages() は全てのグローバルな site-packages ディレクトリを一覧します。
  • getuserbase() は、ユーザのデータを格納できるベースディレクトリを報告します。
  • getusersitepackages() はユーザ固有の site-packages ディレクトリのパスを明らかにします。
>>> import site
>>> site.getsitepackages()
['/Library/Frameworks/Python.framework/Versions/3.2/lib/python3.2/site-packages',
 '/Library/Frameworks/Python.framework/Versions/3.2/lib/site-python',
 '/Library/Python/3.2/site-packages']
>>> site.getuserbase()
'/Users/raymondhettinger/Library/Python/3.2'
>>> site.getusersitepackages()
'/Users/raymondhettinger/Library/Python/3.2/lib/python/site-packages'

Conveniently, some of site’s functionality is accessible directly from the command-line:

$ python -m site --user-base
/Users/raymondhettinger/.local
$ python -m site --user-site
/Users/raymondhettinger/.local/lib/python3.2/site-packages

(Contributed by Tarek Ziadé in bpo-6693.)

sysconfig

新しい sysconfig モジュールは、プラットフォームやインストレーションごとに変わるインストールパスや環境設定変数への、直接的なアクセスを提供します。

このモジュールはプラットフォームとバージョンの情報へのシンプルなアクセス関数を持っています:

  • get_platform()linux-i586macosx-10.6-ppc といった値を返します。
  • get_python_version() は Python バージョンを文字列で 「3.2」 のように返します。

また、 distutils で使われる、名前のついた 7 つのスキームのうちどれか一つに対応するパスと変数にもアクセス出来ます。それらには posix_prefix, posix_home, posix_user, nt, nt_user, os2, os2_home が含まれます:

  • get_paths() は現在のインストールスキームに関するインストールパスを含むディレクトリ名を作ります。
  • get_config_vars() はプラットフォーム依存変数の辞書を返します。

There is also a convenient command-line interface:

C:\Python32>python -m sysconfig
Platform: "win32"
Python version: "3.2"
Current installation scheme: "nt"

Paths:
        data = "C:\Python32"
        include = "C:\Python32\Include"
        platinclude = "C:\Python32\Include"
        platlib = "C:\Python32\Lib\site-packages"
        platstdlib = "C:\Python32\Lib"
        purelib = "C:\Python32\Lib\site-packages"
        scripts = "C:\Python32\Scripts"
        stdlib = "C:\Python32\Lib"

Variables:
        BINDIR = "C:\Python32"
        BINLIBDEST = "C:\Python32\Lib"
        EXE = ".exe"
        INCLUDEPY = "C:\Python32\Include"
        LIBDEST = "C:\Python32\Lib"
        SO = ".pyd"
        VERSION = "32"
        abiflags = ""
        base = "C:\Python32"
        exec_prefix = "C:\Python32"
        platbase = "C:\Python32"
        prefix = "C:\Python32"
        projectbase = "C:\Python32"
        py_version = "3.2"
        py_version_nodot = "32"
        py_version_short = "3.2"
        srcdir = "C:\Python32"
        userbase = "C:\Documents and Settings\Raymond\Application Data\Python"

(Moved out of Distutils by Tarek Ziadé.)

pdb

pdb デバッガモジュールに数多くのユーザビリティの改善がなされました:

  • pdb.py-c オプションで指定した .pdbrc スクリプトファイルを実行できるようになっています。
  • .pdbrc スクリプトファイルにはデバッグを継続する continue コマンドと next コマンドを含むことができます。
  • Pdb クラスのコンストラクタが nosigint 引数を取るようになっています。
  • 新コマンド: l(list), ll(long list), source はソースコードを出力します。
  • 新コマンド: display, undisplay は、変更があった場合の式の値の表示/非表示を切り替えます。
  • 新コマンド: interact は現在のスコープで見つかったグローバルおよびローカル名を含む対話型インタプリタを開始します。
  • ブレイクポイントをブレイクポイント番号指定でクリア出来ます。

(Contributed by Georg Brandl, Antonio Cuni and Ilya Sandler.)

configparser

configparser モジュールが、デフォルトパーサとそれがサポートする INI 構文の使い勝手とわかりやすさを改善するために修正されました。元のクラス ConfigParser が削除されて、代わりに昔から推奨だった SafeConfigParser が新しい ConfigParser になりました。インラインコメントはデフォルトでオフに変更され、また、単一の設定ソース内ではセクションとオプションの重複を禁止しています。

Config parsers はマッピングプロトコルにもとづく新しい API を獲得しました:

>>> parser = ConfigParser()
>>> parser.read_string("""
... [DEFAULT]
... location = upper left
... visible = yes
... editable = no
... color = blue
...
... [main]
... title = Main Menu
... color = green
...
... [options]
... title = Options
... """)
>>> parser['main']['color']
'green'
>>> parser['main']['editable']
'no'
>>> section = parser['options']
>>> section['title']
'Options'
>>> section['title'] = 'Options (editable: %(editable)s)'
>>> section['title']
'Options (editable: no)'

新しい API は旧式 API の上に実装されているので、カスタムなパーサーサブクラスは変更なしで使えるはずです。

config parser によって受け付けられる INI ファイルの構造は今ではカスタマイズ出来ます。ユーザは、オプションと値を区切る代替のデリミタやコメントのプレフィクスを指定でき、 DEFAULT セクションの名前を変えることができ、あるいは補間の構文を切り替えられます。

抜き挿し可能 (pluggable) な補間サポートがあって、これには追加の補間ハンドラ ExtendedInterpolation が含まれています:

>>> parser = ConfigParser(interpolation=ExtendedInterpolation())
>>> parser.read_dict({'buildout': {'directory': '/home/ambv/zope9'},
...                   'custom': {'prefix': '/usr/local'}})
>>> parser.read_string("""
... [buildout]
... parts =
...   zope9
...   instance
... find-links =
...   ${buildout:directory}/downloads/dist
...
... [zope9]
... recipe = plone.recipe.zope9install
... location = /opt/zope
...
... [instance]
... recipe = plone.recipe.zope9instance
... zope9-location = ${zope9:location}
... zope-conf = ${custom:prefix}/etc/zope.conf
... """)
>>> parser['buildout']['find-links']
'\n/home/ambv/zope9/downloads/dist'
>>> parser['instance']['zope-conf']
'/usr/local/etc/zope.conf'
>>> instance = parser['instance']
>>> instance['zope-conf']
'/usr/local/etc/zope.conf'
>>> instance['zope9-location']
'/opt/zope'

小さな機能もたくさん導入されています。例えば読み込み操作内でのエンコーディング指定のサポート、取得関数でのフォールバック値の指定、あるいは辞書や文字列から直接的に読むことなどです。

(All changes contributed by Łukasz Langa.)

urllib.parse

数多くのユーザビリティーの改善が urllib.parse モジュールになされました。

urlparse() 関数が RFC 2732 にて記述されている IPv6 アドレスをサポートするようになりました:

>>> import urllib.parse
>>> urllib.parse.urlparse('http://[dead:beef:cafe:5417:affe:8FA3:deaf:feed]/foo/') 
ParseResult(scheme='http',
            netloc='[dead:beef:cafe:5417:affe:8FA3:deaf:feed]',
            path='/foo/',
            params='',
            query='',
            fragment='')

urldefrag() 関数は、今や named tuple を返します:

>>> r = urllib.parse.urldefrag('http://python.org/about/#target')
>>> r
DefragResult(url='http://python.org/about/', fragment='target')
>>> r[0]
'http://python.org/about/'
>>> r.fragment
'target'

また、 urlencode() 関数はさらに柔軟になり、 query 引数としては文字列とバイト列のどちらも受け付けます。文字列で渡した場合、パラメータ safe, encoding, error がエンコードのために quote_plus() に送られます:

>>> urllib.parse.urlencode([
...      ('type', 'telenovela'),
...      ('name', '¿Dónde Está Elisa?')],
...      encoding='latin-1')
'type=telenovela&name=%BFD%F3nde+Est%E1+Elisa%3F'

ASCII エンコードバイト列の解析 に詳細に書きましたが、全ての urllib.parse 関数は今では ASCII エンコードされたバイト文字列を (通常の文字列と混ぜない限り) 入力として受け付けます。ASCII エンコードされたバイト文字列がパラメータとして与えられると、戻り値の型も ASCII エンコードされたバイト文字列になります:

>>> urllib.parse.urlparse(b'http://www.python.org:80/about/') 
ParseResultBytes(scheme=b'http', netloc=b'www.python.org:80',
                 path=b'/about/', params=b'', query=b'', fragment=b'')

(Work by Nick Coghlan, Dan Mahn, and Senthil Kumaran in bpo-2987, bpo-5468, and bpo-9873.)

mailbox

R. David Murray がコミュニティの調整に尽力したおかげで、 mailbox が Python 3.2 のために修正されました。闘いを挑んだ相手はもともとの mailbox 設計のテキストインターフェイスでした。ですが email メッセージは個々の異なるパートが異なるエンコーディングを持ち得ますから、 bytes が最良の表現です。

解決のためには任意の email メッセージをパースするために、 email パッケージのバイナリサポートが利用されました (—訳注: BytesGeneratormessage_from_bytes() など)。また、API の変更も必要となりました。

mailbox.Mailbox オブジェクトの add() メソッドは、今や期待通りにバイナリ入力を受け付けます。

StringIO とテキストファイルでの入力は非推奨となりました。また、文字列での入力は、非 ASCII 文字が使用されていると早々に失敗します。以前は後のほうのステップで email が処理される際にようやく失敗していました。

バイナリ出力のサポートもあります。 get_file() メソッドは今ではバイナリモードのファイルを返します (これまでは不適切にテキストモードが使われていました)。また、新しい get_bytes() メソッドは、指定した key に対応するメッセージの bytes 表現を返します。

今でも古い API の get_string() を使って非バイナリ出力は可能ですが、そのアプローチはあまり役に立ちません。そうではなく Message オブジェクトからメッセージを抽出するか、それらをバイナリ入力からロードするのが最善です。

(Contributed by R. David Murray, with efforts from Steffen Daode Nurpmeso and an initial patch by Victor Stinner in bpo-9124.)

turtledemo

The demonstration code for the turtle module was moved from the Demo directory to main library. It includes over a dozen sample scripts with lively displays. Being on sys.path, it can now be run directly from the command-line:

$ python -m turtledemo

(Moved from the Demo directory by Alexander Belopolsky in bpo-10199.)

マルチスレッディング

  • 並列に走る Python スレッドの直列実行のメカニズム (一般に GIL あるいは Global Interpreter Lock として知られるもの) が書き換えられました。取り立てて目標とされたのが、より予測可能なインターバルの切り替えと、ロックの競合と多数の続くシステムコールによるオーバヘッドを削減することでした。スレッド切り替えを許す 「check interval」 の考え方は捨て去られ、秒で表された絶対的時間間隔に置き換わりました。このパラメータは sys.setswitchinterval() で調整可能です。今のところこのデフォルトは 5 ミリ秒です。

    この実装に関するさらなる詳細は python-dev mailing-list message で読むことが出来ます (ただしこのメッセージで言っている 「priority requests」 は含められませんでした)。

    (Contributed by Antoine Pitrou.)

  • 通常のロックと再帰的なロックが、acquire() メソッドでオプションで timeout 引数を受け取るようになりました。 (Contributed by Antoine Pitrou; bpo-7316.)

  • 同様に、threading.Semaphore.acquire() にも timeout 引数が追加されました。 (Contributed by Torsten Landschoff; bpo-850728.)

  • 通常のロックと再帰的なロックの獲得に、 Pthreads を使用するプラットフォームでシグナルが割り込めるようになりました。これでロック獲得時にデッドロックしていた Python プログラムは、プロセスに SIGINT (ほとんどのシェルでは Ctrl+C で) を繰り返し送ることで殺せます。(Contributed by Reid Kleckner; bpo-8844.)

最適化

小さな性能向上が多く追加されました:

  • Python’s peephole optimizer now recognizes patterns such x in {1, 2, 3} as being a test for membership in a set of constants. The optimizer recasts the set as a frozenset and stores the pre-built constant.

    Now that the speed penalty is gone, it is practical to start writing membership tests using set-notation. This style is both semantically clear and operationally fast:

    extension = name.rpartition('.')[2]
    if extension in {'xml', 'html', 'xhtml', 'css'}:
        handle(name)
    

    (Patch and additional tests contributed by Dave Malcolm; bpo-6690).

  • pickle モジュールを用いたデータのシリアライズ・デシリアライズが数倍速くなりました。

    (Contributed by Alexandre Vassalotti, Antoine Pitrou and the Unladen Swallow team in bpo-9410 and bpo-3873.)

  • The Timsort algorithm used in list.sort() and sorted() now runs faster and uses less memory when called with a key function. Previously, every element of a list was wrapped with a temporary object that remembered the key value associated with each element. Now, two arrays of keys and values are sorted in parallel. This saves the memory consumed by the sort wrappers, and it saves time lost to delegating comparisons.

    (Patch by Daniel Stutzbach in bpo-9915.)

  • JSON decoding performance is improved and memory consumption is reduced whenever the same string is repeated for multiple keys. Also, JSON encoding now uses the C speedups when the sort_keys argument is true.

    (Contributed by Antoine Pitrou in bpo-7451 and by Raymond Hettinger and Antoine Pitrou in bpo-10314.)

  • 再帰的ロック (threading.RLock() API により生成) は C で実装されたことにより、以前の純粋な Python 実装より10から15倍速くなり、通常のロックと同じくらいになりました。

    (Contributed by Antoine Pitrou; bpo-3001.)

  • The fast-search algorithm in stringlib is now used by the split(), rsplit(), splitlines() and replace() methods on bytes, bytearray and str objects. Likewise, the algorithm is also used by rfind(), rindex(), rsplit() and rpartition().

    (Patch by Florent Xicluna in bpo-7622 and bpo-7462.)

  • Integer to string conversions now work two 「digits」 at a time, reducing the number of division and modulo operations.

    (bpo-6713 by Gawain Bolton, Mark Dickinson, and Victor Stinner.)

There were several other minor optimizations. Set differencing now runs faster when one operand is much larger than the other (patch by Andress Bennetts in bpo-8685). The array.repeat() method has a faster implementation (bpo-1569291 by Alexander Belopolsky). The BaseHTTPRequestHandler has more efficient buffering (bpo-3709 by Andrew Schaaf). The operator.attrgetter() function has been sped-up (bpo-10160 by Christos Georgiou). And ConfigParser loads multi-line arguments a bit faster (bpo-7113 by Łukasz Langa).

Unicode 文字列型

Python が Unicode 6.0.0 でアップデートされました。この更新は標準に 2,000 を超える新たな文字を追加し、これにはモバイルフォンにとって大事な 絵文字 記号も含まれます。

さらに、更新された標準は二つの Kannada 文字 (U+0CF1, U+0CF2) と一つの New Tai Lue 数値文字 (U+19DA) の文字特性を置き換えました。前者は識別子内での使用が適格となり、後者は不適格となります。さらに詳しい情報は Unicode Character Database Changes をみてください。

Codecs

cp720 アラビア DOS エンコードがサポートされました (bpo-1616979)。

MBCS エンコーディングはもうエラーハンドラ引数を無視することはありません。デフォルトの strict モードでは、デコード出来ないバイト列に対して UnicodeDecodeError を、エンコードできない文字に対して UnicodeEncodeError を投げます。

MBCS コーデックはエラーハンドラとして、デコードでの 'strict''ignore' 、エンコードでの 'strict''replace' をサポートします。

Python 3.1 での MBCS エンコーディングを模擬したければデコードでは 'ignore' ハンドラを、エンコードでは 'replace' ハンドラを選んでください。

Mac OS X では Python は、コマンドライン引数をロケールのエンコーディングではなく 'utf-8' でデコードします。

tarfile はデフォルトで、Windows では ('mbcs' ではなく) 'utf-8' エンコーディングを使い、また、全ての OS でエラーハンドラ 'surrogateescape' を使います。

ドキュメント

ドキュメントの改善が引き続き行われています。

  • 組み込み関数 のような長大なセクションには先頭にクイックリンクの表が追加されました。 itertools のようなケースでは cheatsheet スタイルの表からリンクが張られていて、これで要約がわかりますし、ドキュメント全体を読む必要なく記憶を呼び覚ますことが出来ます。

  • ある種のケースではピュア Python のソースコードが文書化の助手として便利に働いてくれますので、今では多くのモジュールがソースコードの最新バージョンへのクイックリンクを客演させています。例えば functools モジュールのドキュメントは先頭にこのようにクイックリンクを置いています:

    ソースコード Lib/functools.py.

    (Contributed by Raymond Hettinger; see rationale.)

  • ドキュメントには今ではもっと実例とレシピが含まれています。特に re モジュールのものには大掛かりなセクション 正規表現の例 があります。同じように itertools では新しい Itertools レシピ で更新され続けます。

  • datetime モジュールは今ではピュア Python による補助実装を持っています。機能に違いはありません。これは読みやすい代替の実装を提供するだけのものです。

    (Contributed by Alexander Belopolsky in bpo-9528.)

  • 保守されていなかった Demo ディレクトリは削除されました。いくつかのデモはドキュメントに統合され、いくつかは Tools/demo ディレクトリに移動し、ほかのものは一緒に削除されました。

    (Contributed by Georg Brandl in bpo-7962.)

IDLE

  • IDLE のフォーマットメニューに、ソースコードから末尾の空白を取り除くことが出来るオプションが追加されました。

    (Contributed by Raymond Hettinger; bpo-5150.)

  • Mac OS X 上の IDLE が Carbon AquaTk と Cocoa AquaTk の両方で動くようになりました。

    (Contributed by Kevin Walzer, Ned Deily, and Ronald Oussoren; bpo-6075.)

コードリポジトリ

http://svn.python.org 上の既存の Subversion コードリポジトリに加え、https://hg.python.org/Mercurial リポジトリが追加されました。

3.2 のリリース後に、主要なリポジトリを Mercurial に移行する計画があります。 この分散バージョン管理システムによってコミュニティメンバが容易に外部 changeset を作成したり共有したりすることが出来ます。 詳細は PEP 385 を参照してください。

新しいバージョン管理システムの使い方を学ぶには tutorial by Joel SpolskyGuide to Mercurial Workflows を参照してください。

ビルドならびに C API の変更

Python のビルド過程と C API の変更は以下の通りです:

  • スクリプト idle, pydoc, 2to3make altinstall 時にバージョン固有のサフィックスを付けてインストールされるようになりました (bpo-10679)。

  • Unicode データベースにアクセスする関数 (Py_UNICODE_TOLOWER, Py_UNICODE_ISDECIMAL, ほか) が、たとえ narrow Unicode ビルドであっても full Unicode 範囲を受け付け、返すようになりました。Python から目に見える違いとしては、大きなコードポイントについて unicodedata.numeric() が正しい値を返し、 repr() はより多くの文字を表示可能と考えるようになりました。

    (Reported by Bupjoe Lee and fixed by Amaury Forgeot D’Arc; bpo-5127.)

  • Computed gotos are now enabled by default on supported compilers (which are detected by the configure script). They can still be disabled selectively by specifying --without-computed-gotos.

    (Contributed by Antoine Pitrou; bpo-9203.)

  • オプション --with-wctype-functions は削除されました。今では組み込みの Unicode データベースが全ての関数のために使われます。

    (Contributed by Amaury Forgeot D’Arc; bpo-9210.)

  • ハッシュ値として新しい型 Py_hash_t を使うようになりました。これはポインタと同じサイズになるように定義されています。以前は long 型を使っていましたが、これはいくつかの 64 ビット OS でも 32 ビット長のままでした。この修正の結果、64 ビットポインタでビルドすれば setdict2**32 以上のエントリを持てるようになりました (以前もそのサイズを入れることは出来ましたが、悲劇的なパフォーマンス低下を起こしていました)。

    (Suggested by Raymond Hettinger and implemented by Benjamin Peterson; bpo-9778.)

  • 新規マクロ Py_VA_COPY は可変引数リストの状態をコピーします。これは C99 の va_copy と等価ですが、全ての Python プラットフォームで利用出来ます (bpo-2443)。(—訳注: 全ての Python プラットフォーム、というよりは、プラットフォームの C コンパイラに関係なく、ということ。—)

  • 新規 C API 関数 PySys_SetArgvEx() を使うと埋め込みインタプリタの sys.argv をセット出来ますが、既存の PySys_SetArgv() と違って sys.path を更新しないことも出来ます (bpo-5753)。

  • PyEval_CallObject はマクロ形式でのみ利用可能となりました。関数宣言は後方互換のために残されていましたが削除されました。 – マクロは 1997 年に導入されています (bpo-8276)。

  • PyLong_AsLongAndOverflow() の姉妹品の PyLong_AsLongLongAndOverflow() 関数が追加されました。両方とも Python int を C ネイティブの固定幅型に変換しますが、変換が幅に合わないことを検出します (bpo-7767)。

  • PyUnicode_CompareWithASCIIString() 関数が、Python 文字列が NUL 終端である場合に「 等しくない 」を返すようになりました。

  • 新しい関数 PyErr_NewExceptionWithDoc()PyErr_NewException() と似ていますが、ドキュメンテーション文字列を受け付けます。これは C 拡張に、対応するピュア Python と同じ自己文書化 (self-documenting) 能力を与えます (bpo-7033)。

  • --with-valgrind オプションとともにコンパイル時、 Valgrind のもとでの実行時に自動的に pymalloc アロケータが無効になるようになりました。ほかの状況では pymalloc は有利ですが、Valgrind 配下での実行時のメモリリーク検出では無効化したほうが良い結果が得られます (bpo-2422)。

  • PyArg_Parse 関数から書式文字列 O? が削除されました。これはもう使われていませんし、今まで一度も文書化されたことはありません (bpo-8837)。

ほかにも C API に対する小さな変更が多数行われました。完全なリストは Misc/NEWS ファイルにあります。

Also, there were a number of updates to the Mac OS X build, see Mac/BuildScript/README.txt for details. For users running a 32/64-bit build, there is a known problem with the default Tcl/Tk on Mac OS X 10.6. Accordingly, we recommend installing an updated alternative such as ActiveState Tcl/Tk 8.5.9. See https://www.python.org/download/mac/tcltk/ for additional details.

Python 3.2 への移植

このセクションでは前述の変更とバグフィックスにより必要となるかもしれないコードの変更を列挙します:

  • configparser モジュールに大掃除が行われました。最も大きな変更は、古い ConfigParser クラスを長年推奨の代替だった SafeConfigParser に置き換えたことです。加えて多くの小さな非互換があります:

    • 補間 (interpolation) の構文は今では get()set() の操作で検証されます。デフォルトの補間スキームでは、パーセント記号を使ったただ二つのトークンのみが正当です: %(name)s%% 、後者はエスケープされたパーセント記号自身。
    • set() メソッドと add_section() メソッドは今ではその値が実際に文字列かどうかを検証します。以前はサポートされない型が意図せず持ち込まれる可能性がありました。
    • 単一ソースからのセクションまたはオプションの複製 (重複) に対し、今では DuplicateSectionError もしくは DuplicateOptionError を投げます。以前は重複は黙って以前のエントリを上書きしていました。
    • インラインコメントは今ではデフォルトで無効なので、 ; 文字を安全に値のなかで使えます。
    • コメントを字下げ出来るようになっています。このことにより、値が継続行となる場合の後続行の字下げ開始位置に ; または # を置くには、補間を使う必要があります。こうすればコメントのプレフィクス文字が値内に現れて誤ってコメントと解釈されるのを防げます。
    • "" は今では合法な値なので、もはや自動的に空文字列に変換されることはありません。空文字列のためには行内で "option =" と書いてください。
  • nntplib モジュールが大幅に更新され、3.1 API とはしばしば互換性がありません。

  • bytearray オブジェクトはもうファイル名には使えません。代わりに bytes に変換しなければいけません。

  • array.tostring()array.fromstring() がそれぞれ array.tobytes()array.frombytes() に名称変更されました。言ってることとやってることを合わせるためです。古い名前は非推奨となりました。 (bpo-8990 参照。)

  • PyArg_Parse*() 系関数:

    • 書式文字列 「t#」 の削除: 代わりに 「s#」 もしくは 「s*」 を使ってください。
    • 書式文字列 「w」 および 「w#」 の削除: 代わりに 「w*」 を使ってください。
  • Python 3.1 で非推奨となった PyCObject が削除されました。不透明な C ポインタを Python オブジェクトにラップするには PyCapsule を代わりに使ってください。この新しい型は、型安全に情報を渡すための良く定義されたインターフェイスを持ち、また、デストラクタの呼び出しのシグネチャの複雑さが小さくなっています。

  • sys.setfilesystemencoding() 関数は削除されました。設計に欠陥があったからです。

  • random.seed() 関数とメソッドが、salt に文字列やバイト列を与えた場合に内部で sha512 ハッシュ関数を使うようになりました。Python 3.1 シーケンスを再現するのに以前のバージョンの seed が必要であれば、 version 引数を 1 にしてください。 random.seed(s, version=1) のように。

  • 以前にそれぞれの静的メソッド bytes.maketrans()bytearray.maketrans() に置き換えられたために非推奨となった string.maketrans() 関数が削除されました。この変更は、 string によってサポートされるのがどちらの型なのかにまつわる混乱を解決します。今や str, bytes, bytearray は、その適切な型の中間変換テーブルを持つそれぞれの maketranstranslate メソッドを持っています。

    (Contributed by Georg Brandl; bpo-5675.)

  • 以前に非推奨となった contextlib.nested() が削除されました。普通の with が複数のコンテクストマネージャを許容するように強化されたからです。これは (組み込みなので) 高速であり、複数コンテクストマネージャのうち一つが例外を送出した際にそれらのファイナライズをとても上手く処理します:

    with open('mylog.txt') as infile, open('a.out', 'w') as outfile:
        for line in infile:
            if '<critical>' in line:
                outfile.write(line)
    

    (Georg Brandl と Mattias Brändström の貢献; appspot issue 53094.)

  • struct.pack() は、文字列パックコード s で bytes のみを許容するようになりました。以前はテキスト引数を受け取って暗黙に UTF-8 でエンコードして bytes に変換していました。特定のエンコーディングを前提にするのは間違っていますし、可変長のエンコーディングは構造体の固定長セグメントへの書き込みで失敗しうるので、これは問題でした。

    例えば struct.pack('<6sHHBBB', 'GIF87a', x, y) としているならば、テキストではなく bytes を使うように struct.pack('<6sHHBBB', b'GIF87a', x, y) と書き換えなければなりません。

    (Discovered by David Beazley and fixed by Victor Stinner; bpo-10783.)

  • The xml.etree.ElementTree class now raises an xml.etree.ElementTree.ParseError when a parse fails. Previously it raised an xml.parsers.expat.ExpatError.

  • 浮動小数点数と複素数に対する str() が以前より長い表現をするようになったことで、古いフォーマットに依存する doctest は壊れるかもしれません。

  • subprocess.Popenclose_fds のデフォルトが、Unix では True になりました。Windows では 3 つの標準ストリームに None がセットされている場合には True 、以外の場合は False になりました。以前は close_fds のデフォルトはいつでも False でした。これは開いているファイル記述子が子プロセスに漏れた場合に解決が難しいバグや競合状態を生み出していました。

  • レガシーな HTTP 0.9 のサポートが urllib.requesthttp.client から削除されました。このサポートはサーバサイドではまだ健在です (http.server 内)。

    (Contributed by Antoine Pitrou, bpo-10711.)

  • タイムアウトモード時の SSL ソケットでタイムアウトした場合に、汎用の SSLError ではなく socket.timeout を投げるようになりました。

    (Contributed by Antoine Pitrou, bpo-10272.)

  • 紛らわしい関数 PyEval_AcquireLock()PyEval_ReleaseLock() が公式に非推奨となりました。スレッド状態に関知する API (例えば PyEval_SaveThread()PyEval_RestoreThread()) を代わりに使うべきです。

  • セキュリティリスクがあるので asyncore.handle_accept() は非推奨となり、それを置き換える新しい関数 asyncore.handle_accepted() が追加されました。

    (Contributed by Giampaolo Rodola in bpo-6706.)

  • 新しい GIL 実装によって、 Py_Initialize() の前に PyEval_InitThreads() を呼び出すことはもう出来なくなりました。