Python 3.11 有什麼新功能

編輯者:

Pablo Galindo Salgado

此文章解釋了 Python 3.11 和 3.10 相比多了哪些新特性。Python 3.11 於 2022 年 10 月 24 日發布。完整細節請見 Changelog(更動日誌)

發布重點摘要

  • Python 3.11 比 Python 3.10 快了 10-60%。我們使用了標準基準量測套裝軟體 (benchmark suite) 測得平均加速了 1.25x。細節請見更快的 CPython

新增語法特性:

新增內建特性:

新增標準函式庫模組:

直譯器的改進:

新增型別特性:

重要的棄用、移除與限制:

新增特性

PEP 657:回溯 (traceback) 中更細緻的錯誤位置

當要印出回溯,直譯器現在會指出造成錯誤的確切運算式,而非只說明是哪一行。例如:

Traceback (most recent call last):
  File "distance.py", line 11, in <module>
    print(manhattan_distance(p1, p2))
          ^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "distance.py", line 6, in manhattan_distance
    return abs(point_1.x - point_2.x) + abs(point_1.y - point_2.y)
                           ^^^^^^^^^
AttributeError: 'NoneType' object has no attribute 'x'

前一版本的直譯器只會標明是哪一行,無法辨認哪一個物件是 None。當處理多層的巢狀 dict 物件和多個函式呼叫時,這種強化錯誤提示也可能非常有用:

Traceback (most recent call last):
  File "query.py", line 37, in <module>
    magic_arithmetic('foo')
  File "query.py", line 18, in magic_arithmetic
    return add_counts(x) / 25
           ^^^^^^^^^^^^^
  File "query.py", line 24, in add_counts
    return 25 + query_user(user1) + query_user(user2)
                ^^^^^^^^^^^^^^^^^
  File "query.py", line 32, in query_user
    return 1 + query_count(db, response['a']['b']['c']['user'], retry=True)
                               ~~~~~~~~~~~~~~~~~~^^^^^
TypeError: 'NoneType' object is not subscriptable

在複雜的計算運算式中也是:

Traceback (most recent call last):
  File "calculation.py", line 54, in <module>
    result = (x / y / z) * (a / b / c)
              ~~~~~~^~~
ZeroDivisionError: division by zero

此外,強化回溯特性所使用的資訊可以透過一般的 API 來取得,以用來使 bytecode 指示 (instruction)與原始碼位置相互關聯。此項資訊可以用以下方式取得:

詳情請見 PEP 657。(由 Pablo Galindo、Batuhan Taskaya 與 Ammar Askar 於 bpo-43950 中所貢獻。)

備註

這個特性必須要將欄的位置 (column position) 儲存於 程式碼物件,這可能會導致直譯器用於編譯 Python 檔案的記憶體使用量與硬碟使用量增加。為了避免儲存多餘的資訊且停用印出多餘的回溯資訊,請用 -X no_debug_ranges 命令列選項或是 PYTHONNODEBUGRANGES 環境變數。

PEP 654:例外群組與 except*

PEP 654 引入了新的的語言特性,可讓程式同時引發並處理多個相互無關的例外。內建型別 ExceptionGroupBaseExceptionGroup 使得程式可為多個例外組成群組並同時引發,新的 except* 語法也將 except 泛用化、能夠比對例外群組的子群組。

詳情請見 PEP 654

(由 Irit Katriel 於 bpo-45292 中所貢獻。PEP 由 Irit Katriel、Yury Selivanov 與 Guido van Rossum 撰寫。)

PEP 678:運用例外註解使其更加詳盡

新增 add_note() 方法到 BaseException。當上下文資訊在例外被引發時無法被取得,這個方法就可以用來為例外添加更多資訊。被添加的註解會在預設回溯中出現。

詳情請見 PEP 678

(由 Irit Katriel 於 bpo-45607 中所貢獻。PEP 由 Zac Hatfield-Dodds 所撰寫)

Windows py.exe 啟動程式 (launcher) 的改進

Python 3.11 所包含的 Python Launcher for Windows 複製品有了顯著的改善。它現在支援 PEP 514 所定義的公司/標籤 (tag) 語法,可用 -V:<company>/<tag> 引數來取代受限的 -<major>.<minor>。這允許了 python.org 上的 PythonCore 以外的發行版本發布。

使用 -V: 選擇器時,可以省略公司或標籤,但會搜索所有安裝。例如,-V:OtherPython/ 將選擇 OtherPython 註冊的「最佳」標籤,而 -V:3.11-V:/3.11 將選擇帶有 3.11 標籤的「最佳」發行版。

當使用遺留的 -<major>-<major>.<minor>-<major>-<bitness>-<major>.<minor>-<bitness> 引數時,所有過去版本的行為都應該保留下來,且只有 PythonCore 中的發布版本會被選用。然而,-64 後綴現在暗示了「非 32-bit」(不用一定要是 x86-64),因為現在有多個支援 64-bit 的平台。32-bit 運行程式會在檢查運行程式之標籤是否帶有 -32 後綴時被偵測出來。所有 Python 3.5 以後發布版本的 32-bit 建置中都有這個行為。

其他語言更動

  • 新增了一個 -P 命令列選項和一個 PYTHONSAFEPATH 環境變數,它們禁用了當使用 -c-m 以在運行腳本或當前目錄時自動添加到腳本目錄的 sys.path。這確保只有 stdlib 和已安裝的模組會被 import 取用,以避免不小心或被惡意地將模組與本地(通常是使用者可寫入的)目錄中的模組重疊。(由 Victor Stinner 在 gh-57684 中貢獻。)

  • "z" 選項被新增到 格式規格 (Format Specification) 迷你語言,它會強迫負的 0 在進位到格式精度後成為正的。更多詳情請見 PEP 682。(由 John Belmonte 於 gh-90153 中貢獻。)

  • sys.path 不再接受位元組。支援已在 Python 3.2 和 3.6 之間的某個時間停止,直到 Python 3.10.0 發布後才引起人們的注意。此外,由於混合使用 strbytes 鍵時 -bsys.path_importer_cache 會出現的交互作用,恢復這項支援會出現問題。(由 Thomas Grainger 在 gh-91181 中貢獻。)

其他 CPython 實作更動

  • 為支援 typing.SupportsComplextyping.SupportsBytes 協定,實作了 complexbytes 的特殊方法 __complex__()__bytes__()。(由 Mark Dickinson 和 Donghee Na 於 bpo-24234 中所貢獻。)

  • 新增 siphash13 以作為內部的雜湊演算法,它有與 siphash24 相似的安全特性,但是在處理較長的輸入時會更快一些。現在是 strbytes 和一些其他型別的 hash() 預設演算法。PEP 552 基於雜湊的 .pyc 檔案 現在也使用 siphash13。(由 Inada Naoki 於 bpo-29410 中貢獻。)

  • 當一個仍有效的例外被 raise 陳述式在沒有參數的情況下重新引發,被附於該例外的追蹤資訊現在都會是 sys.exc_info()[1].__traceback__。這代表對於當前 except 子句的追蹤上做的改動會反映在被重複引發的例外上。(由 Irit Katriel 於 bpo-45711 中貢獻。)

  • 有被處理的例外在直譯器狀態的表示(也就是 exc_info_PyErr_StackItem)現在只會有 exc_value 欄位;exc_typeexc_traceback 已被移除,現在只能透過 exc_value 來取得它們。(由 Irit Katriel 於 bpo-45711 中貢獻。)

  • 新增命令列選項 AppendPath,已增加於 Windows 安裝程式。它的行為類似於 PrependPath,但在安裝和腳本目錄後面附加而非新增於它們前面。(由 Bastian Neuburger 在 bpo-44934 中貢獻。)

  • 初始化中若是要用 PyConfig.module_search_paths 來初始化 sys.path,則現在 PyConfig.module_search_paths_set 必須被設為 1。否則,初始化會重新計算路徑並取代所有被加到 module_search_paths 的值。

  • --help 選項的輸出現在會在 50 列、80 欄的大小之內,Python 環境變數-X 選項的資訊現在能夠分別透過 --help-env--help-xoptions 旗標與 --help-all 一起使用來取得。(由 Éric Araujo 於 bpo-46142 中貢獻。)

  • 在除 2(binary、二進制)、4、8(octal、八進制)、16(hexadecimal、十六進制)或 32 以外的基數中,例如以 10(decimal、十進制)為基數,進行 intstr 之間的轉換且字串形式的位數超過限制,現在會引發 ValueError,以避免由於演算法複雜性而導致的潛在阻斷服務攻擊 (denial of service attacks)。這是針對 CVE 2020-10735 的緩解措施,可以透過環境變數、命令列旗標或 sys API 來設定或禁用此限制。請參閱整數字串轉換長度限制 文件。預設限制為字串形式的 4300 位數字。

新增模組

改進的模組

asyncio

contextlib

  • 添加了非平行安全的 chdir() 情境管理器來更改當前工作目錄,然後在退出時恢復它。chdir() 的簡單包裝器。(由 Filipe Laíns 在 bpo-25625 中貢獻)

dataclasses

  • 更改欄位預設的可變性檢查 (mutability check),僅允許預設值是 hashable 而不是任何非 dictlistset 實例的物件。(由 Eric V. Smith 在 bpo-44674 中貢獻。)

datetime

enum

  • EnumMeta 更名為 EnumTypeEnumMeta 保留為別名)。

  • 增加 StrEnum,列舉 (enum) 內的成員必須是字串。

  • 新增 ReprEnum,它只修改成員的 __repr__(),同時回傳成員的文本值 (literal value)(而不是名稱),以用於(為 str()format()f-string 所使用的)__str__()__format__()

  • 改變了 Enum.__format__() (被 format()str.format()f-string 預設使用),以使其與 enum.Enum.__str__ 產生相同結果:對於繼承自 ReprEnum 的列舉,這會是成員之值;而其他的列舉會是列舉與成員名稱(例如 Color.RED)。

  • 新增 boundary 類別參數與其選項到 Flag 列舉和 FlagBoundary 列舉以控制處理超出範圍旗標數值的方法。

  • 新增了 verify() 列舉裝飾器和 EnumCheck 列舉及其選項,以根據幾個特定限制檢查列舉類別。

  • 新增 member()nonmember() 裝飾器以確保被裝飾的物件會/不會被轉換成一個列舉成員。

  • 新增 property() 裝飾器,它的作用類似 property() 但是是用於列舉,用以替代 types.DynamicClassAttribute()

  • 新增 global_enum() 列舉裝飾器,用來調整 __repr__()__str__() 以模組成員形式而非列舉類別來顯示值。例如,re.RegexFlagASCII 成員的 're.ASCII',而非 'RegexFlag.ASCII'

  • 強化 Flag 以支援使用 len()、疊代 (iteration) 和 in/not in 於其成員。例如,以下程式現在能夠作用了:len(AFlag(3)) == 2 and list(AFlag(3)) == (AFlag.ONE, AFlag.TWO)

  • 更改了 EnumFlag 以在呼叫 __init_subclass__() 之前就定義成員;dir() 現在包括來自混合資料型別的方法。

  • 更改 Flag 以僅考慮主要值(2 的次方)規範,而複合值(3610 等)被視為別名;倒置旗標 (inverted flags) 會被強制轉換為正等價的值。

fcntl

  • FreeBSD 上,F_DUP2FDF_DUP2FD_CLOEXEC 旗標分別有被支援,前者等同於 dup2 用法,而後者設定了 FD_CLOEXEC 旗標。

fractions

  • 支援有 PEP 515 風格的 Fraction 以字串初始化。(Sergey B Kirpichev 於 bpo-44258 中所貢獻。)

  • Fraction 現在有實作了一個 __int__ 方法,因此 isinstance(some_fraction, typing.SupportsInt) 的檢查會通過。(由 Mark Dickinson 在 bpo-44547 中貢獻。)

functools

  • functools.singledispatch() 現在支援 types.UnionTypetyping.Union 作為調度 (dispatch) 引數的標註。

    >>> from functools import singledispatch
    >>> @singledispatch
    ... def fun(arg, verbose=False):
    ...     if verbose:
    ...         print("Let me just say,", end=" ")
    ...     print(arg)
    ...
    >>> @fun.register
    ... def _(arg: int | float, verbose=False):
    ...     if verbose:
    ...         print("Strength in numbers, eh?", end=" ")
    ...     print(arg)
    ...
    >>> from typing import Union
    >>> @fun.register
    ... def _(arg: Union[list, set], verbose=False):
    ...     if verbose:
    ...         print("Enumerate this:")
    ...     for i, elem in enumerate(arg):
    ...         print(i, elem)
    ...
    

    (由 Yurii Karabas 於 bpo-46014 中所貢獻。)

gzip

  • The gzip.compress() function is now faster when used with the mtime=0 argument as it delegates the compression entirely to a single zlib.compress() operation. There is one side effect of this change: The gzip file header contains an "OS" byte in its header. That was traditionally always set to a value of 255 representing "unknown" by the gzip module. Now, when using compress() with mtime=0, it may be set to a different value by the underlying zlib C library Python was linked against. (See gh-112346 for details on the side effect.)

hashlib

  • hashlib.blake2b()hashlib.blake2s() 現在偏好使用 libb2 多於 Python 自發行版的複製。(由 Christian Heimes 於 bpo-47095 中所貢獻。)

  • 帶有 SHA3 和 SHAKE 演算法的內部 _sha3 模組現在使用 tiny_sha3 而不是 Keccak 程式碼套件來減少程式碼和二進位檔案大小。hashlib 模組更喜歡來自 OpenSSL 的 SHA3 和 SHAKE 最佳化實作。此更改僅影響沒有 OpenSSL 支援的安裝。(由 Christian Heimes 在 bpo-47098 中貢獻。)

  • 新增 hashlib.file_digest(),是個能夠為檔案或類檔案物件做高效率雜湊的幫助函式。(由 Christian Heimes 於 gh-89313 中貢獻。)

IDLE 與 idlelib

  • .pyi 檔案施用語法突顯 (syntax highlight)。(由 Alex Waygood 與 Terry Jan Reedy 於 bpo-45447 中所貢獻。)

  • 當帶有輸入與輸出地儲存 Shell 時,也會包含提示字元。(由 Terry Jan Reedy 於 gh-95191 中所貢獻。)

inspect

locale

logging

math

  • 新增 math.exp2():回傳 2 的 x 次方。(由 Gideon Mitchell 於 bpo-45917 中所貢獻。)

  • 新增 math.cbrt():回傳 x 的立方根。(由 Ajith Ramachandran 於 bpo-44357 中所貢獻。)

  • 為了與 IEEE 754 規範保持一致,更改了兩個 math.pow() 邊角案例 (corner case) 的行為。math.pow(0.0, -math.inf)math.pow(-0.0, -math.inf) 現在回傳 inf,之前它們會引發 ValueError。(由 Mark Dickinson 在 bpo-44339 中貢獻。)

  • math.nan 現為隨時可用。(由 Victor Stinner 於 bpo-46917 中所貢獻。)

operator

  • 新增 operator.call 函式,使得 operator.call(obj, *args, **kwargs) == obj(*args, **kwargs)。(由 Antony Lee 於 bpo-44019 中所貢獻。)

os

  • 在 Windows 上,os.urandom() 現在使用 BCryptGenRandom() 以取代被棄用的 CryptGenRandom()。(由 Donghee Na 於 bpo-44611 中所貢獻。)

pathlib

re

  • 現在規則運算式 (regular expression) 是有支援原子性群組 (atomic grouping) ((?>...)) 和佔有性量詞 (possessive quantifier) (*+, ++, ?+, {m,n}+) 的。(由 Jeffrey C. Jacobs 和 Serhiy Storchaka 在 bpo-433030 中貢獻。)

shutil

socket

  • 新增 NetBSD 對於 CAN Socket 的支援。(由 Thomas Klausner 於 bpo-30512 中所貢獻。)

  • 當連接失敗時,create_connection() 有個選項可以引發一個包含所有錯誤的 ExceptionGroup,而非只引發最後一個錯誤。(由 Irit Katriel 於 bpo-29980 中貢獻。)

sqlite3

string

sys

  • sys.exc_info() 現在從 value(例外實例)衍生出 typetraceback 欄位,因此當例外在處理過程中被修改時,變更會反映在 exc_info() 後續呼叫的結果中。(由 Irit Katriel 在 bpo-45711 中貢獻。)

  • 新增會回傳活躍例外實例 (active exception instance) 的 sys.exception()(等價於 sys.exc_info()[1])。(由 Irit Katriel 於 bpo-46328 中所貢獻。)

  • 新增 sys.flags.safe_path 旗標。(由 Victor Stinner 於 gh-57684 中所貢獻。)

sysconfig

  • 新增了三個安裝方案posix_venvnt_venvvenv),它們在 Python 建立新的虛擬環境或在虛擬環境中執行環境使用。前兩個方案(posix_venvnt_venv)是非 Windows 和 Windows 作業系統所特有的,venv 本質上會根據 Python 運行的操作系統來做為其中之一的別名。這對修改 sysconfig.get_preferred_scheme() 的下游發布者很有用。建立新虛擬環境的第三方程式碼應該使用新的 venv 安裝方案來確定路徑,就像 venv 一樣。(由 Miro Hrončok 在 bpo-45413 中貢獻。)

tempfile

threading

  • 在 Unix 上,如果 sem_clockwait() 函式在 C 函式庫(glibc 2.30 與其更新的版本)中可被使用,則 threading.Lock.acquire() 方法現在會使用單調時鐘 (time. CLOCK_MONOTONIC) 用於超時 (timeout),而不是使用系統時鐘 (time.CLOCK_REALTIME),以免受系統時鐘變化的影響。 由 Victor Stinner 在 bpo-41710 中貢獻。)

time

  • 在 Unix 上,如果可用的話,time.sleep() 現在會使用 clock_nanosleep()nanosleep() 函式,其解析度為 1 納秒(10-9 秒),而不是使用解析度為 1 微秒(10-6 秒)的 select()。(由 Benjamin Szőke 和 Victor Stinner 在 bpo-21302 中貢獻。)

  • 在 Windows 8.1 或更新的平台上,time.sleep() 現在使用了一個基於高解析度計時器的可等待 (waitable) 計時器,解析度為 100 奈秒(即 10-7 秒)。在這之前,它只有 1 微秒(10-3 秒) 的解析度。(由 Benjamin Szőke、Donghee Na、Eryk Sun 和 Victor Stinner 於 bpo-21302bpo-45429 中貢獻。)

tkinter

  • 新增了 info_patchlevel() 方法,它會回傳 Tcl 函式庫的確切版本以作為類似於 sys.version_info 的附名元組。(由 Serhiy Storchaka 在 gh-91827 中貢獻。)

traceback

typing

重大變更請見 型別提示相關的新特性

  • 新增 typing.assert_never()typing.Nevertyping.assert_never() 可用於要型別檢查器確認某行程式碼是否不可觸及。在執行環境,它會引發 AssertionError。(由 Jelle Zijlstra 在 gh-90633 中貢獻。)

  • 新增 typing.reveal_type(),這可用於請求型別檢查器為給定運算式推斷出什麼型別。在執行環境它會印出接收到的值的型別。(由 Jelle Zijlstra 在 gh-90572 中貢獻。)

  • 新增 typing.assert_type(),這可用於要型別檢查器確認它為給定運算式推斷的型別是否與給定型別相符。在執行環境,它只會回傳接收到的值。(由 Jelle Zijlstra 在 gh-90638 中貢獻。)

  • typing.TypedDict 型別現可為泛型。(由 Samodya Abeysiriwardane 於 gh-89026 中所貢獻。)

  • NamedTuple 型別現可為泛型。(由 Serhiy Storchaka 於 bpo-43923 中所貢獻。)

  • 允許繼承 typing.Any,這能有效避免與高度動態類別(例如 mock)相關的型別檢查器錯誤。(由 Shantanu Jain 在 gh-91154 中貢獻。)

  • typing.final() 裝飾器現在會在被裝飾的物件上設定 __final__ 屬性。(由 Serhiy Storchaka 於 gh-90500 中所貢獻。)

  • typing.get_overloads() 函式可用於自我檢查 (introspect) 一個函式的過載 (overload)。typing.clear_overloads() 可用於清除一個函式的所有已註冊過載。(由 Jelle Zijlstra 在 gh-89263 中貢獻。)

  • Protocol 子類別的 __init__() 方法現在被保留。(由 Adrian Garcia Badarasco 在 gh-88970 中貢獻。)

  • 空元組型別 (Tuple[()]) 的表示法得到簡化,這會影響自我檢查 (introspection),例如 get_args(Tuple[()]) 的求值現在會是 () 而不是 ((),)。(由 Serhiy Storchaka 在 gh-91137 中貢獻。)

  • 通過刪除私有 typing._type_check 函式中的可呼叫檢查,放寬型別標註的執行環境要求。(由 Gregory Beauregard 在 gh-90802 中貢獻。)

  • 作為PEP 585 泛化別名中的前向參照,typing.get_type_hints() 現支援了為字串求值 (evaluate)。(由 Niklas Rosenstein 在 gh-85542 中貢獻。)

  • typing.get_type_hints() 不再將 Optional 新增到預設為 None 的參數中。(由 Nikita Sobolev 在 gh-90353 中貢獻。)

  • typing.get_type_hints() 現在支援為無修飾 (bare) 字串化 (stringified) 的 ClassVar 標註來求值。(由 Gregory Beauregard 在 gh-90711 中貢獻。)

  • typing.no_type_check() 不再修改外部類別和函式。它現在也正確地將類別方法標記為不需進行型別檢查。(由 Nikita Sobolev 在 gh-90729 中貢獻。)

unicodedata

  • Unicode 資料庫被更新為 14.0.0 版本。(Benjamin Peterson 於 bpo-45190 中所貢獻。)

unittest

venv

  • 建立新的 Python 虛擬環境時,venv sysconfig 安裝方案會被用於確定環境內的路徑。當 Python 在虛擬環境中運行時,預設使用相同的安裝方案。這意味著下游發布者可以在不改變虛擬環境行為的情況下更改預設的 sysconfig 安裝方案。建立新虛擬環境的第三方程式碼也應該這樣做。(由 Miro Hrončok 在 bpo-45413 中貢獻。)

warnings

zipfile

  • 新增了對指定成員名稱編碼的支援,以便在 ZipFile 的目錄和檔案標頭中讀取元資料 (metadata)。(由 Stephen J. Turnbull 和 Serhiy Storchaka 在 bpo-28080 中貢獻。)

  • 新增 ZipFile.mkdir() 以在 ZIP 歸檔中建立新的目錄。(由 Sam Ezeh 於 gh-49083 貢獻。)

  • zipfile.Path 新增 stemsuffixsuffixes。(由 Miguel Brito 於 gh-88261 貢獻。)

最佳化

這個部分會涵蓋到特定的最佳化,但獨立於擁有自己一個說明的更快的 CPython 計畫。

  • 編譯器現在對僅包含格式程式碼 %s%r%a 的字串文本 (string literal) 進行簡單的 printf 風格 % 格式化 (printf-style % formatting) 最佳化並使其與相應的 f-string 運算式一樣快。(由 Serhiy Storchaka 在 bpo-28307 中貢獻。)

  • 整數除法 (//) 為了編譯器最佳化而被調校過。現在將 int 除以小於 2**30 的值時,在 x86-64 上快了大約 20%。(由 Gregory P. Smith 和 Tim Peters 在 gh-90564 中貢獻。)

  • 針對小於 2**30 的整數,sum() 現在快了將近 30%。(由 Stefan Behnel 於 gh-68264 中所貢獻。)

  • 調整 list 大小在常見情況下增進了效能,為 list.append() 加快了約 15% 並為簡單的 list comprehension 加快了高達 20-30%(由 Dennis Sweeney 在 gh-91165 中貢獻。)

  • 當所有鍵都是 Unicode 物件時,字典不存儲雜湊值,減少了 dict 的大小。例如,sys.getsizeof(dict.fromkeys("abcdefg")) 在 64-bit 平台上從 352 位元組減少到 272 位元組(減少 23%)。(由 Inada Naoki 在 bpo-46845 中貢獻。)

  • 使用 asyncio.DatagramProtocol 以透過 UDP 傳輸大文件時,現在速度提高了幾個數量級,傳輸 ≈60 MiB 檔案的速度提高了 100 多倍。(由 msoxzw 在 gh-91487 中貢獻。)

  • math 函式 comb()perm() 針對較大引數現在快了 ≈10 倍(對於更大的 k 有更大的加速)。(由 Serhiy Storchaka 在 bpo-37295 中貢獻。)

  • statistics 函式 mean()variance()stdev() 現在會一次性的消耗疊代器,而不是先將它們轉換為 list,這讓速度提升為兩倍並可以節省大量記憶體空間。(由 Raymond Hettinger 在 gh-90415 中貢獻。)

  • unicodedata.normalize() 現在在常數時間內規範化 (normalize) 純 ASCII 字串。(由 Donghee Na 在 bpo-44987 中貢獻。)

更快的 CPython

當使用基準量測套裝軟體 pyperformance 量測並以 GCC 於 Ubuntu Linux 上編譯,Python 3.11 平均比 Python 3.10 快了 25%。根據程式工作量可能有所不同,整體加速程度可達 10-60%。

此計畫專注在 Python 的 更快的啟動更快的運行程式。不在此專案內的最佳化被獨立列出在 最佳化

更快的啟動

凍結引入 (Frozen imports) / 靜態程式碼物件 (Static code objects)

Python 將位元組碼__pycache__ 目錄中存為快取來加速模組的載入。

在先前的 3.10 中,執行 Python 模組會像是這樣:

Read __pycache__ -> Unmarshal -> Heap allocated code object -> Evaluate

在 Python 3.11 中,核心模組在 Python 啟動時必須被「凍結」,這意味著它們的程式碼物件(和位元組碼)是由直譯器靜態分配的。這將模組執行過程中的步驟減少為:

Statically allocated code object -> Evaluate

在 Python 3.11 中直譯器啟動速度快了 10-15%。這對於使用 Python 所撰寫的短暫程式有著巨大影響。

(由 Eric Snow、Guido van Rossum 與 Kumar Aditya 於多個 issue 中貢獻。)

更快的運行程式

所需資源更少 (cheaper) 且惰性的 (lazy)) Python 幀 (frame)

每當 Python 呼叫 Python 函式時,就會建立保存執行資訊的 Python 幀。以下是針對幀而做的新最佳化:

  • 使幀的建立過程更有效率。

  • 在 C 堆疊 (stack) 中盡量重複利用幀的空間來避免記憶體分配。

  • 讓內部幀結構只包含必要資訊,使其更加精簡。在過去,幀必須帶有額外的偵錯與記憶體管理的資訊。

舊式幀物件現在僅在除錯器或 Python 自我檢查函式(例如 sys._getframe()inspect.currentframe())請求時才建立。對於大多數使用者程式碼,根本不會建立任何幀物件。結果幾乎所有 Python 函式呼叫都顯著加速。我們以 pyperformance 測得了 3-7% 的加速。

(由 Mark Shannon 於 bpo-44590 中所貢獻。)

行內 Python 函式呼叫

在 Python 函式呼叫期間,Python 將呼叫一個正在求值的 C 函式來直譯該函式的程式碼,這有效地將純 Python 遞迴限制在對 C 堆疊的安全範圍內。

在 3.11 中,當 CPython 檢測到 Python 程式碼呼叫另一個 Python 函式時,它會設立一個新框架 (frame),並「跳轉」到新框架內的新程式碼,這避免了呼叫整個 C 直譯函式。

現在大多數 Python 函式的呼叫因為不會佔用 C 堆疊空間而被加速。在斐波那契 (fibonacci) 或階乘等簡單遞迴函式中,觀察到 1.7 倍的加速。這也意味著遞迴函式可以遞迴得更深(如果使用者有增加遞迴限制)。我們在 pyperformance 測得 1-3% 的改進。

(由 Pablo Galindo 與 Mark Shannon 於 bpo-45256 中所貢獻。)

PEP 659:特化的適應性直譯器

PEP 659 是加速 CPython 專案的關鍵部分之一。一般的想法是,雖然 Python 是一種動態語言,但大多數程式碼都有物件和型別很少去更改的區域。這個概念被稱為型別穩定 (type stability)

在執行環境,Python 將嘗試在執行中的程式碼內尋找常用模式和型別穩定,然後 Python 將用更特化的操作替換當前操作。這種特化操作運用了僅適用於那些用例/型別的快速路徑,這通常優於它們的泛用對應 (generic counterparts)。這也引入了另一個稱為行內快取 (inline caching)的概念,其中 Python 將繁重操作的結果直接快取在位元組碼中。

特化程式 (specializer) 還將某些常用指示 (common instruction) 組合成一個超級指示 (superinstruction),這減少了執行期間的開銷。

Python 只會在看到「熱」(被多次執行的)程式碼時特化,這可以防止 Python 將時間浪費在只運行一次的程式碼上。當程式碼過於動態或用途發生變化時,Python 也可以去特化 (de-specialize)。特化會定期被嘗試執行,而嘗試的成本也不會太高,這讓特化得以適應新的環境。

(PEP 由 Mark Shannon 撰寫、概念啟發自 Stefan Brunthaler。詳情請見 PEP 659。由 Mark Shannon 和 Brandt Bucher 實作,Irit Katriel 和 Dennis Sweeney 亦提供了額外的幫助。)

操作

形式

特化

操作加速程度(上限)

貢獻者

二元操作

x + x

x - x

x * x

常見型別如 intfloatstr 的二元加法、乘法與減法,為底層型別採取了特製的快速路徑。

10%

Mark Shannon, Donghee Na, Brandt Bucher, Dennis Sweeney

下標

a[i]

下標容器型別如 listtupledict 直接索引底層的資料結構。

下標自定義 __getitem__() 也是行內的,類似於 行內 Python 函式呼叫

10-25%

Irit Katriel, Mark Shannon

儲存下標

a[i] = z

類似於上面的下標特化。

10-25%

Dennis Sweeney

呼叫

f(arg)

C(arg)

常見內建 (C) 函式和型別的呼叫,例如 len()str,會直接呼叫它們的 C 版本底層,這避免了通過內部呼叫的慣例。

20%

Mark Shannon, Ken Jin

載入全域變數

print

len

全域/內建之命名空間內的物件索引被快取起來。載入全域與內建變數不需要任何命名空間的查找。

[1]

Mark Shannon

載入屬性

o.attr

和載入全域變數類似,類別/物件之命名空間內的屬性索引被快取起來。在大部分情況中,載入屬性不需要任何命名空間的查找。

[2]

Mark Shannon

載入要呼叫的方法

o.meth()

方法的真實記憶體地址被快取 (cache) 起來,方法的載入現在不需要命名空間的查找 -- 即便有很長繼承鏈結的類別也是。

10-20%

Ken Jin, Mark Shannon

儲存屬性

o.attr = z

和載入屬性的最佳化相似。

2% 於 pyperformance 中

Mark Shannon

拆解 (unpack) 序列

*seq

為像是 listtuple 的常見容器所特化,避免了內部呼叫慣例。

8%

Brandt Bucher

雜項

  • 物件現在因為使用了惰性建立的物件命名空間所以需要更少的記憶體。它們的命名空間字典現在也更自由地共享鍵。(由 Mark Shannon 於 bpo-45340bpo-40116 貢獻。 )

  • 實作了「無代價 (Zero-cost)」的例外,消除了在沒有例外被引發時的 try 陳述式開銷。(由 Mark Shannon 於 bpo-40222 貢獻。)

  • 在直譯器內使用更簡潔的例外表示法將捕獲一個例外所需的時間減少了大約 10%。 由 Irit Katriel 在 bpo-45711 中貢獻。)

  • re 的正規表示式比對引擎部分被重構,且現在會有支援的平台上使用 computed gotos(或者「執行緒程式碼 (threaded code)」),因此 Python 3.11 在執行 pyperformance 正規表示式基準量測的表現上比起 Python 3.10 快了 10%。(由 Brandt Bucher 於 gh-91404 中貢獻。)

FAQ

我該如何在程式碼中獲取這些加速?

撰寫符合 Python 風格 (Pythonic) 且依循常見最佳實踐的程式碼就好,你不需要改變你的程式碼。CPython 加速計畫中,我們為所觀察到的常見程式編寫模式來做最佳化。

Python 3.11 會不會使用更多記憶體?

也許不會。我們預期不會有超出 3.10 20% 的記憶體使用量。這數字會和上述禎物件與物件字典的記憶體最佳化而有所偏差。

我在我的程式當中沒感覺到任何加速,為什麼?

某些程式中不會有顯著的好處。如果你的程式花了大部分的時間在 I/O 操作上,或已經將大部分計算用像是 numpy 的 C 擴充函式庫處理,那就不會有明顯的加速。這個計畫是對純 Python 的工作負荷最有幫助。

此外,pyperformance 數值為一個幾何平均數 (geometric mean)。即便在 pyperformance 基準量測中,某些測試稍微慢了一些,但其他加快了將近兩倍!

有用到 JIT 編譯器嗎?

沒有,我們還在探索其他最佳化方式。

關於

CPython 加速計畫探索了各種 CPython 最佳化的可能性。主要團隊由微軟 (microsoft) 所資助以全職發展該計畫,Pablo Galindo Salgado 亦由彭博有限合夥企業 (Bloomberg LP) 資助來兼職開發,更有許許多多來自社群的自發性貢獻者。

CPython 位元組碼變更

位元組碼現在包含行內快取條目,它們採用新添加的 CACHE 指示的形式。許多操作碼預期後面要有確切數量的快取,並指示直譯器在執行環境跳過它們。傳遞的 (populated) 快取看起來像任意指示,因此在讀取或修改包含加速資料的原始且適應 (adaptive) 位元組碼時應格外小心。

新增 opcode

被取代的操作碼 (opcode)

被取代的操作碼

新的操作碼

註記

BINARY_*
INPLACE_*

BINARY_OP

以單一一個操作碼來取代所有數值的、二進位/原位 (in-place) 操作碼

CALL_FUNCTION
CALL_FUNCTION_KW
CALL_METHOD
KW_NAMES
PRECALL

將方法的引數搬移 (argument shifting) 與關鍵字引數的處理分離開來;允許更好的呼叫特化

DUP_TOP
DUP_TOP_TWO
ROT_TWO
ROT_THREE
ROT_FOUR
ROT_N

堆疊操作指示

JUMP_IF_NOT_EXC_MATCH

現在執行檢查但不跳位 (jump)

JUMP_ABSOLUTE
POP_JUMP_IF_FALSE
POP_JUMP_IF_TRUE
POP_JUMP_BACKWARD_IF_*
POP_JUMP_FORWARD_IF_*

參見 [3];每個方向的 TRUEFALSENONENOT_NONE 變體

SETUP_WITH
SETUP_ASYNC_WITH

BEFORE_WITH

with 區塊設置

有更動/被移除的 opcode

  • 更改了 MATCH_CLASSMATCH_KEYS ,不再推送一個額外的布林值來表示成功/失敗。取而代之的是會在失敗時推送 None,而非一個包含提取值的元組。

  • 更改了運作於例外的操作碼以反映它們現在在堆疊中的表示為一項而不是三項(請參閱 gh-89874)。

  • 刪除 COPY_DICT_WITHOUT_KEYSGEN_STARTPOP_BLOCKSETUP_FINALLYYIELD_FROM

已棄用

這個部分列出了在 Python 3.11 中棄用的 Python API。

被棄用的 C API 被獨立列出

語言/內建

  • 鏈接 classmethod 描述器(在 bpo-19072 中引入)現已棄用。它不能再用於包裝其他描述器,例如 property。此功能的核心設計存在缺陷,並導致了許多下游問題。要「傳遞通過 (pass-through)」classmethod,請考慮使用 Python 3.10 中添加的 __wrapped__ 屬性。(由 Raymond Hettinger 在 gh-89519 中貢獻。)

  • 值大於 0o377(十進位為 255)的字串和位元組文本值 (bytes literal) 中的八進位跳脫 (octal escape) 現在會產生 DeprecationWarning。在未來的 Python 版本中,他們將引發一個 SyntaxWarning 並最終引發一個 SyntaxError。(由 Serhiy Storchaka 在 gh-81548 中貢獻。)

  • int()__trunc__() 的授權 (delegation) 現已棄用。當 type(a) 有實作 __trunc__() 但沒有 __int__()__index__(),呼叫 int(a) 現在會引發一個 DeprecationWarning。(由 Zackery Spytz 在 bpo-44977 中貢獻。)

模組

  • PEP 594 引領下列模組的棄用,並排訂於 Python 3.13 移除:

    aifc

    chunk

    msilib

    pipes

    telnetlib

    audioop

    crypt

    nis

    sndhdr

    uu

    cgi

    imghdr

    nntplib

    spwd

    xdrlib

    cgitb

    mailcap

    ossaudiodev

    sunau

    (由 Brett Cannon 和 Victor Stinner 分別於 bpo-47061gh-68966 中所貢獻。)

  • asynchatasyncoresmtpd 至少在 Python 3.6 以前就被棄用,它們的文件與棄用警告現在已被更新為會提示它們即將於 Python 3.12 中移除。(由 Hugo van Kemenade 於 bpo-47022 中貢獻。)

  • lib2to3 套件和 2to3 工具現已棄用,可能無法剖析 Python 3.10 或更新版本。有關詳細資訊請參閱 PEP 617,它引入了新的 PEG 剖析器。(由 Victor Stinner 在 bpo-40360 中貢獻。)

  • 未被記錄於文件中的 sre_compilesre_constantssre_parse 模組現在已被棄用。(由 Serhiy Storchaka 在 bpo-47152 中貢獻。)

標準函式庫

Python 3.12 中待決議的移除項目

下列 API 已在先前的 Python 發布版本中棄用,並將於 Python 3.12 中移除。

待定的 C API 移除項目為獨立列出的

  • asynchat 模組

  • asyncore 模組

  • 整個 distutils 套件

  • imp 模組

  • typing.io 命名空間

  • typing.re 命名空間

  • cgi.log()

  • importlib.find_loader()

  • importlib.abc.Loader.module_repr()

  • importlib.abc.MetaPathFinder.find_module()

  • importlib.abc.PathEntryFinder.find_loader()

  • importlib.abc.PathEntryFinder.find_module()

  • importlib.machinery.BuiltinImporter.find_module()

  • importlib.machinery.BuiltinLoader.module_repr()

  • importlib.machinery.FileFinder.find_loader()

  • importlib.machinery.FileFinder.find_module()

  • importlib.machinery.FrozenImporter.find_module()

  • importlib.machinery.FrozenLoader.module_repr()

  • importlib.machinery.PathFinder.find_module()

  • importlib.machinery.WindowsRegistryFinder.find_module()

  • importlib.util.module_for_loader()

  • importlib.util.set_loader_wrapper()

  • importlib.util.set_package_wrapper()

  • pkgutil.ImpImporter

  • pkgutil.ImpLoader

  • pathlib.Path.link_to()

  • sqlite3.enable_shared_cache()

  • sqlite3.OptimizedUnicode()

  • PYTHONTHREADDEBUG 環境變數

  • unittest 中被棄用的別名:

    已棄用的別名

    方法名稱

    棄用於

    failUnless

    assertTrue()

    3.1

    failIf

    assertFalse()

    3.1

    failUnlessEqual

    assertEqual()

    3.1

    failIfEqual

    assertNotEqual()

    3.1

    failUnlessAlmostEqual

    assertAlmostEqual()

    3.1

    failIfAlmostEqual

    assertNotAlmostEqual()

    3.1

    failUnlessRaises

    assertRaises()

    3.1

    assert_

    assertTrue()

    3.2

    assertEquals

    assertEqual()

    3.2

    assertNotEquals

    assertNotEqual()

    3.2

    assertAlmostEquals

    assertAlmostEqual()

    3.2

    assertNotAlmostEquals

    assertNotAlmostEqual()

    3.2

    assertRegexpMatches

    assertRegex()

    3.2

    assertRaisesRegexp

    assertRaisesRegex()

    3.2

    assertNotRegexpMatches

    assertNotRegex()

    3.5

已移除

此部分列出 Python 3.11 中移除的 Python API。

被移除的 C API 被獨立列出

  • 刪除了 @asyncio.coroutine() decorator 使遺留的基於生成器的協程 (generator-based coroutine) 與 async / await 程式碼相容。該函式自 Python 3.8 起已被棄用,計劃於 Python 3.10 刪除。請改用 async def。(由 Illia Volochii 在 bpo-43216 中貢獻。)

  • 移除除錯模式中用於包裝遺留基於產生器之協程物件的 asyncio.coroutines.CoroWrapper。(由 Illia Volochii 於 bpo-43216 中貢獻。)

  • 因為有重大的安全性考量,Python 3.9 中停用的 asyncio.loop.create_datagram_endpoint()reuse_address 參數目前已經移除。這是因為 UDP socket 選項 SO_REUSEADDR 的行為所致。(由 Hugo van Kemenade 於 bpo-45129 中貢獻。)

  • 移除 Python 3.9 中棄用的 binhex 模組,與其相關且相似的 binascii 函式也一併被移除:

    • binascii.a2b_hqx()

    • binascii.b2a_hqx()

    • binascii.rlecode_hqx()

    • binascii.rldecode_hqx()

    binascii.crc_hqx() 維持可用。

    (由 Victor Stinner 於 bpo-45085 中所貢獻。)

  • 移除 Python 3.9 中棄用的 distutils bdist_msi 命令。請改用 bdist_wheel(wheel 套件)。(由 Hugo van Kemenade 於 bpo-45124 中貢獻。)

  • xml.dom.pulldom.DOMEventStreamwsgiref.util.FileWrapperfileinput.FileInput 自 Python 3.9 中棄用的 __getitem__() 方法移除。(由 Hugo van Kemenade 在 bpo-45132 中貢獻。)

  • 刪除了已棄用的 gettext 函式 lgettext()ldgettext()lngettext()ldngettext(),也刪除了 bind_textdomain_codeset() 函式、NullTranslations.output_charset()NullTranslations.set_output_charset() 方法,以及 translation()install()codeset 參數,因為它們僅被用於 l*gettext() 函式。(由 Donghee Na 和 Serhiy Storchaka 在 bpo-44235 中貢獻。)

  • inspect 模組中移除:

    (由 Hugo van Kemenade 於 bpo-45320 中所貢獻。)

  • pathlib.PurePath 中移除 __class_getitem__() 方法,因為它是前一版本中誤加且沒被使用。(由 Nikita Sobolev 於 bpo-46483 中所貢獻。)

  • 移除 smtpd 模組中的 MailmanProxy 類別,因為它無法獨立於外部套件 mailman 使用。(由 Donghee Na 於 bpo-35800 貢獻。)

  • 移除 _tkinter.TkappType 已被棄用的 split() 方法。(由 Erlend E. Aasland 於 bpo-38371 貢獻。)

  • unittest 中刪除了命名空間套件支援。它在 Python 3.4 中引入,但自 Python 3.7 以來已無法運作。(由 Inada Naoki 在 bpo-23882 中貢獻。)

  • 將未被記錄於文件中的私有方法 float.__set_format__() 移除,它過去是 Python 3.7 中的 float.__setformat__()。它的文件字串 (docstring) 說到:「你大概不會想要使用這個函式,它只為了讓 Python 測試系列套件 (suite) 使用而存在。」(由 Victor Stinner 於 bpo-46852 中貢獻。)

  • 移除 --experimental-isolated-subinterpreters 配置旗標(與對應的 EXPERIMENTAL_ISOLATED_SUBINTERPRETERS 巨集)。

  • Pynche --- Python 風格的自然色彩與色調編輯器 --- 已被移出 Tools/scripts獨立開發於 Python 原始碼之外。

移植至 Python 3.11

本部分列出了之前描述的 Python API 中可能需要你去更改 Python 程式碼的變更和其他錯誤修復。

C API 的移植被獨立列出

  • open()io.open()codecs.open()fileinput.FileInput 不再接受 'U'("universal newline",通用換行符)文件模式。在 Python 3 中,每當以文本模式 (text mode) 打開檔案時,預設情況下會使用「通用換行符」模式,並且自 Python 3.3 以來就不推薦使用 'U' 旗標。這些函式的 newline 參數控制了通用換行符的作用方式。(由 Victor Stinner 在 bpo-37330 中貢獻。)

  • ast.AST 節點位置現在會在提供給 compile() 和其他相關函式時被驗證。如果檢測到無效位置,則會引發 ValueError。(由 Pablo Galindo 在 gh-93351 中貢獻)

  • 在 Python 3.8 中棄用後,禁止將非 concurrent.futures.ThreadPoolExecutor 執行器傳遞給 asyncio.loop.set_default_executor()。(由 Illia Volochii 在 bpo-43234 中貢獻。)

  • calendarcalendar.LocaleTextCalendarcalendar.LocaleHTMLCalendar 類別如果沒有指定語言環境,現在會使用 locale.getlocale() 而非 locale.getdefaultlocale()。(由 Victor Stinner 在 bpo-46659 中貢獻。)

  • pdb 模組現在會讀取 'UTF-8' 編碼的 .pdbrc 配置檔案。(Srinivas Reddy Thatiparthy (శ్రీనివాస్ రెడ్డి తాటిపర్తి) 於 bpo-41137 貢獻。)

  • random.sample()population 參數必須是一個序列,不再支援 setlist 的自動轉換。此外,如果抽樣大小大於總體大小,則會引發 ValueError。(由 Raymond Hettinger 在 bpo-40465 中貢獻。)

  • 刪除了 random.shuffle()random 可選參數。它以前是用於隨機排列 (shuffle) 的任意隨機函式;現在都會使用 random.random()(這是它以前的預設值)。

  • re 正規表示式語法 中,全域行內旗標(例如 (?i))現在只能在規則運算式的開頭使用。自 Python 3.6 以來,在其他地方使用它們已被棄用。(由 Serhiy Storchaka 在 bpo-47066 中貢獻。)

  • re 模組中修復了幾個長期存在的錯誤,在極少數情況下,這些錯誤可能會導致捕獲群組 (capture group) 得到錯誤的結果。因此,這可能會在這些情況下更改捕獲的輸出。(Ma Lin 在 bpo-35859 中貢獻。)

建置變更

  • CPython 現在有 PEP 11 Tier 3 支援 以用於交叉編譯至 WebAssembly 平台 Emscriptenwasm32-unknown-emscripten,即瀏覽器中的 Python)和 WebAssembly 系統介面 (WASI) (wasm32-unknown-wasi)。這個靈感來自過往的貢獻,例如 Pyodide。這些平台提供了有限的 POSIX API 子集;Python 標準函式庫功能和與網路、行程、執行緒、訊號、mmap、用戶/群組相關的模組不開放使用或無法正常使用。(Emscripten 由 Christian Heimes 和 Ethan Smith 在 gh-84461 貢獻,WASI 由 Christian Heimes 在 gh-90473 貢獻;平台在 gh-95085 中推廣)

  • 建置 CPython 現在必須要有:

  • Py_NO_NAN 巨集已被移除。因為 CPython 現在需要 IEEE 754 浮點數,NaN 數值皆為可得的。(由 Victor Stinner 在 bpo-46656 中貢獻。)

  • tkinter 套件現在必須要有 Tcl/Tk 8.5.12 或更新的版本。(由 Serhiy Storchaka 於 bpo-46996 中所貢獻。)

  • 大多數 stdlib 擴充模組的依賴套件、編譯器旗標 (compiler flag) 和鏈接器旗標 (linker flags) 現在可以透過 configure 檢測出來。(當可用時)pkg-config 會檢測出 libffi、libnsl、libsqlite3、zlib、bzip2、liblzma、libcrypt、Tcl/Tk 和 uuid 旗標。tkinter 現在需要一個 pkg-config 命令來檢測 Tcl/Tk 標頭檔和函式庫的開發設定。(由 Christian Heimes 和 Erlend Egeberg Aasland 在 bpo-45847bpo-45747bpo-45763 中貢獻。)

  • libpython 不再鏈接到 libcrypt。(由 Mike Gilbert 在 bpo-45433 中貢獻。)

  • CPython 現在可以透過將 thin 傳遞給 --with-lto(也就是 --with-lto=thin)來以 ThinLTO 選項建置。(由 Donghee Na 與 Brett Holman 於 bpo-44340 中所貢獻。)

  • Freelists for object structs can now be disabled. A new configure option --without-freelists can be used to disable all freelists except empty tuple singleton. (Contributed by Christian Heimes in bpo-45522.)

  • Modules/SetupModules/makesetup 已得到改進和綁定。現在可以通過 makesetup 建置擴充模組。除了一些測試模組外,所有模組都可以靜態鏈接到主要的二進制文件或函式庫中。(由 Brett Cannon 和 Christian Heimes 在 bpo-45548bpo-45570bpo-45571bpo-43974 中貢獻。)

    備註

    使用環境變數 TCLTK_CFLAGSTCLTK_LIBS 以手動指定 Tcl/Tk 標頭檔和函式庫的位置。configure 選項 —with-tcltk-includes—with-tcltk-libs 已被刪除。

    RHEL 7 和 CentOS 7 上的開發套件並無提供 tcl.pctk.pc;要使用 TCLTK_LIBS="-ltk8.5 -ltkstub8.5 -ltcl8.5"。目錄 Misc/rhel7 包含 .pc 檔案與如何使用 RHEL 7 和 CentOS 7 的 Tcl/Tk 與 OpenSSL 建置 Python 的指示。

  • CPython 現在預設使用 30-bit 數字來實作 Python int。以前,在 SIZEOF_VOID_P >= 8 的平台上預設使用 30-bit 數字,否則使用 15-bit 數字,但仍能通過配置腳本的 --enable-big-digits 選項或(於 Windows)PC/pyconfig.h 中的 PYLONG_BITS_IN_DIGIT 變數來明確請求使用 15-bit 數字,但此選項可能會在將來的某個時候被刪除。(由 Mark Dickinson 在 bpo-45569 中貢獻。)

C API 變更

新增特性

移植至 Python 3.11

  • 一些巨集已轉換為行內靜態函式以避免巨集陷阱 (macro pitfalls)。這種變化對用戶來說應該是透明的,因為替換函式會將它們的引數轉換為預期的型別,以避免由於靜態型別檢查而產生的編譯器警告。但是,當受限 C API 設置為 >=3.11 時,這些轉換不會完成,使用者需要將引數轉換為他們期望的型別。有關更多詳細資訊,請參閱 PEP 670。(由 Victor Stinner 和 Erlend E. Aasland 在 gh-89653 中貢獻。)

  • PyErr_SetExcInfo() 不再使用 typetraceback 引數,直譯器現在從例外實例(value 引數)中獲得這些值。該函式仍會偷用這三個引數的參照。(由 Irit Katriel 在 bpo-45711 中貢獻。)

  • PyErr_GetExcInfo() 現在從例外實例的結果(value 欄位)中導出 typetraceback 欄位。(由 Irit Katriel 在 bpo-45711 中貢獻。)

  • _frozen 有一個新的 is_package 欄位來表示凍結模組是否為一個套件。以前 size 欄位中的負值是指標,現在只有非負值可用於 size。(由 Kumar Aditya 在 bpo-46608 中貢獻。)

  • _PyFrameEvalFunction() 現在將 _PyInterpreterFrame* 作為其第二個參數,而不是 PyFrameObject*。有關如何使用此函式指標型別的更多詳細資訊,請參閱 PEP 523

  • PyCode_New()PyCode_NewWithPosOnlyArgs() 現在採用額外的 exception_table 引數。如果可能的話應該避免使用這些函式。要獲取自定義程式碼物件,使用編譯器建立一個程式碼物件,然後使用 replace 方法來得到修改後的版本。

  • PyCodeObject 不再會有 co_codeco_varnamesco_cellvarsco_freevars 欄位。分別被改為透過 C API 的 PyCode_GetCode()PyCode_GetVarnames()PyCode_GetCellvars()PyCode_GetFreevars() 來存取。(由 Brandt Bucher 在 bpo-46841、Ken Jin 在 gh-92154gh-94936 中貢獻。)

  • 舊的回收筒巨集 (trashcan macro) (Py_TRASHCAN_SAFE_BEGIN/Py_TRASHCAN_SAFE_END) 現在已經被棄用,它們應被新的巨集 Py_TRASHCAN_BEGINPy_TRASHCAN_END 所取代。

    一個用到老舊巨集的 tp_dealloc 函式,像是:

    static void
    mytype_dealloc(mytype *p)
    {
        PyObject_GC_UnTrack(p);
        Py_TRASHCAN_SAFE_BEGIN(p);
        ...
        Py_TRASHCAN_SAFE_END
    }
    

    應該要搬遷到新的巨集,如下所示:

    static void
    mytype_dealloc(mytype *p)
    {
        PyObject_GC_UnTrack(p);
        Py_TRASHCAN_BEGIN(p, mytype_dealloc)
        ...
        Py_TRASHCAN_END
    }
    

    請注意 Py_TRASHCAN_BEGIN 有第二個引數,它應該是它所在的釋放函式 (deallocation function)。

    為支援舊版 Python 在同一份程式碼中,你可以定義以下巨集並在程式碼中使用它們(要歸功於 mypy 程式碼,這些是從那邊複製過來的):

    #if PY_VERSION_HEX >= 0x03080000
    #  define CPy_TRASHCAN_BEGIN(op, dealloc) Py_TRASHCAN_BEGIN(op, dealloc)
    #  define CPy_TRASHCAN_END(op) Py_TRASHCAN_END
    #else
    #  define CPy_TRASHCAN_BEGIN(op, dealloc) Py_TRASHCAN_SAFE_BEGIN(op)
    #  define CPy_TRASHCAN_END(op) Py_TRASHCAN_SAFE_END(op)
    #endif
    
  • 如果一個型別是以 Py_TPFLAGS_HAVE_GC 旗標來定義,但卻沒有遍歷函式 (traverse function) (PyTypeObject.tp_traverse),那 PyType_Ready() 函式現在會引發一個錯誤。(由 Victor Stinner 於 bpo-44263 中貢獻。)

  • 帶有 Py_TPFLAGS_IMMUTABLETYPE 旗標的堆積型別現在可以繼承 PEP 590 向量呼叫協定 (vectorcall protocol)。以前這僅適用於 static types。(由 Erlend E. Aasland 在 bpo-43908 中貢獻)。

  • 由於 Py_TYPE() 更改為行內靜態函式 (inline static function),因此 Py_TYPE(obj) = new_type 必須替換為 Py_SET_TYPE(obj, new_type):參見 Py_SET_TYPE() 函式(自 Python 3.9 起可用)。為了向後相容,可以使用這個巨集:

    #if PY_VERSION_HEX < 0x030900A4 && !defined(Py_SET_TYPE)
    static inline void _Py_SET_TYPE(PyObject *ob, PyTypeObject *type)
    { ob->ob_type = type; }
    #define Py_SET_TYPE(ob, type) _Py_SET_TYPE((PyObject*)(ob), type)
    #endif
    

    (由 Victor Stinner 於 bpo-39573 中所貢獻。)

  • 由於 Py_SIZE() 更改為行內靜態函式,因此 Py_SIZE(obj) = new_size 必須替換為 Py_SET_SIZE(obj, new_size):參見 Py_SET_SIZE() 函式(自 Python 3.9 起可用)。為了向後相容,可以使用這個巨集:

    #if PY_VERSION_HEX < 0x030900A4 && !defined(Py_SET_SIZE)
    static inline void _Py_SET_SIZE(PyVarObject *ob, Py_ssize_t size)
    { ob->ob_size = size; }
    #define Py_SET_SIZE(ob, size) _Py_SET_SIZE((PyVarObject*)(ob), size)
    #endif
    

    (由 Victor Stinner 於 bpo-39573 中所貢獻。)

  • Py_LIMITED_API 巨集被設定為 0x030b0000(Python 3.11)或以上,<Python.h> 不再會包含標頭檔 <stdlib.h><stdio.h><errno.h><string.h>。C 擴充程式應該要清楚的在 #include <Python.h> 之後引入標頭檔案。(由 Victor Stinner 於 bpo-45434 中貢獻。)

  • 非受限 API (non-limited API) 檔案 cellobject.hclassobject.hcode.hcontext.hfuncobject.hgenobject. hlongintrepr.h 已移至 Include/cpython 目錄。此外,eval.h 標頭檔已被刪除。不能直接引入這些文件,因為它們已被包含在 Python.h 中:引入檔案。如果它們已被直接引入,請考慮改為引入 Python.h。 (由 Victor Stinner 在 bpo-35134 中貢獻。)

  • PyUnicode_CHECK_INTERNED() 巨集已從受限 C API 中移出,它從來沒辦法被使用,因為它使用了受限 C API 不提供的內部結構。(由 Victor Stinner 於 bpo-46007 中所貢獻。)

  • 以下用於幀 (frame) 的函式與型別現在可直接透過 #include <Python.h> 來使用,不必再加上 #include <frameobject.h>

    (由 Victor Stinner 於 gh-93937 中所貢獻。)

  • PyFrameObject 結構成員已經從公開的 C API 中移除。

    雖然文件指出 PyFrameObject 欄位隨時可能發生變化,但它們已經穩定了很長時間,並被用於幾個流行的擴充套件中。

    Python 3.11 中,幀的結構被重新編制來為性能做最佳化,有些作為舊版實作細節的欄位被整個移除。

    PyFrameObject 欄位:

    Python 幀物件的建立現為惰性的 (lazily),一個副作用是 f_back 成員不能被直接存取,因為其職的計算也是惰性的,要改呼叫 PyFrame_GetBack()

    直接存取 f_locals 的除錯器必須改為呼叫 PyFrame_GetLocals()。他們不再需要呼叫 PyFrame_FastToLocalsWithError()PyFrame_LocalsToFast(),事實上他們不應該呼叫這些函式。框架的必要更新現在由虛擬機管理。

    PyFrame_GetCode() 在 Python 3.8 以前的程式定義:

    #if PY_VERSION_HEX < 0x030900B1
    static inline PyCodeObject* PyFrame_GetCode(PyFrameObject *frame)
    {
        Py_INCREF(frame->f_code);
        return frame->f_code;
    }
    #endif
    

    PyFrame_GetBack() 在 Python 3.8 以前的程式定義:

    #if PY_VERSION_HEX < 0x030900B1
    static inline PyFrameObject* PyFrame_GetBack(PyFrameObject *frame)
    {
        Py_XINCREF(frame->f_back);
        return frame->f_back;
    }
    #endif
    

    或是使用 pythoncap_compat 計畫來在舊版 Python 函式中取得這兩個函式。

  • PyThreadState 結構成員的改動:

    PyThreadState_GetFrame() 在 Python 3.8 以前的程式定義:

    #if PY_VERSION_HEX < 0x030900B1
    static inline PyFrameObject* PyThreadState_GetFrame(PyThreadState *tstate)
    {
        Py_XINCREF(tstate->frame);
        return tstate->frame;
    }
    #endif
    

    PyThreadState_EnterTracing()PyThreadState_LeaveTracing() 在 Python 3.10 以前的程式定義:

    #if PY_VERSION_HEX < 0x030B00A2
    static inline void PyThreadState_EnterTracing(PyThreadState *tstate)
    {
        tstate->tracing++;
    #if PY_VERSION_HEX >= 0x030A00A1
        tstate->cframe->use_tracing = 0;
    #else
        tstate->use_tracing = 0;
    #endif
    }
    
    static inline void PyThreadState_LeaveTracing(PyThreadState *tstate)
    {
        int use_tracing = (tstate->c_tracefunc != NULL || tstate->c_profilefunc != NULL);
        tstate->tracing--;
    #if PY_VERSION_HEX >= 0x030A00A1
        tstate->cframe->use_tracing = use_tracing;
    #else
        tstate->use_tracing = use_tracing;
    #endif
    }
    #endif
    

    或是使用 pythoncap-compat 計畫來在舊版 Python 函式中取得它們。

  • 鼓勵發布者們使用最佳化過的 Blake2 函式庫 libb2 來建置 Python。

  • 初始化中若是要用 PyConfig.module_search_paths 來初始化 sys.path,則現在 PyConfig.module_search_paths_set 必須被設為 1。否則,初始化會重新計算路徑並取代所有被加到 module_search_paths 的值。

  • PyConfig_Read() 不再計算初始搜索路徑,並且不會將任何值填充到 PyConfig.module_search_paths 中。若要計算預設路徑然後修改它們,完成初始化並使用 PySys_GetObject() 以取得 sys.path 作為 Python 列表物件並直接修改它。

已棄用

  • 棄用以下用來配置 Python 初始化的函式:

    • PySys_AddWarnOptionUnicode()

    • PySys_AddWarnOption()

    • PySys_AddXOption()

    • PySys_HasWarnOptions()

    • PySys_SetArgvEx()

    • PySys_SetArgv()

    • PySys_SetPath()

    • Py_SetPath()

    • Py_SetProgramName()

    • Py_SetPythonHome()

    • Py_SetStandardStreamEncoding()

    • _Py_SetProgramFullPath()

    請改用 Python 初始化配置中新的 PyConfig API。(由 Victor Stinner 於 gh-88279 中所貢獻。)

  • 棄用 PyBytesObject 中的 ob_shash 成員。請改用 PyObject_Hash()。(由 Inada Naoki 於 bpo-46864 中所貢獻。)

Python 3.12 中待決議的移除項目

以下 C API 已於先前 Python 發布版本中棄用,並將於 Python 3.12 中移除。

  • PyUnicode_AS_DATA()

  • PyUnicode_AS_UNICODE()

  • PyUnicode_AsUnicodeAndSize()

  • PyUnicode_AsUnicode()

  • PyUnicode_FromUnicode()

  • PyUnicode_GET_DATA_SIZE()

  • PyUnicode_GET_SIZE()

  • PyUnicode_GetSize()

  • PyUnicode_IS_COMPACT()

  • PyUnicode_IS_READY()

  • PyUnicode_READY()

  • PyUnicode_WSTR_LENGTH()

  • _PyUnicode_AsUnicode()

  • PyUnicode_WCHAR_KIND

  • PyUnicodeObject

  • PyUnicode_InternImmortal()

已移除

  • PyFrame_BlockSetup() and PyFrame_BlockPop() have been removed. (Contributed by Mark Shannon in bpo-40222.)

  • 移除以下使用到 errno 變數的數學巨集:

    • Py_ADJUST_ERANGE1()

    • Py_ADJUST_ERANGE2()

    • Py_OVERFLOWED()

    • Py_SET_ERANGE_IF_OVERFLOW()

    • Py_SET_ERRNO_ON_MATH_ERROR()

    (由 Victor Stinner 於 bpo-45412 中所貢獻。)

  • 移除在 Python 3.3 中棄用的 Py_UNICODE_COPY()Py_UNICODE_FILL()。請改用 PyUnicode_CopyCharacters()memcpy()wchar_t* 字串)和 PyUnicode_Fill() 函式。(由 Victor Stinner 於 bpo-41123 中所貢獻。)

  • 移除 pystrhex.h 標頭檔案。它只有包含私有函式。C 的擴充應該只要引入主要的 <Python.h> 標頭檔案。(由 Victor Stinner 於 bpo-45434 中所貢獻。)

  • 移除 Py_FORCE_DOUBLE() 巨集。它先前被用於 Py_IS_INFINITY() 巨集。(由 Victor Stinner 於 bpo-45440 中所貢獻。)

  • Py_LIMITED_API 有被定義時,以下項目將無法被取得:

    These are not part of the limited API.

    (由 Victor Stinner 於 bpo-45474 中所貢獻。)

  • PyWeakref_GET_OBJECT() 排除於受限 C API 之外,它因為 PyWeakReference 結構在受限 C API 中過於晦澀而從未運作。(由 Victor Stinner 於 bpo-35134 中所貢獻。)

  • 移除 PyHeapType_GET_MEMBERS() 巨集,它是不小心才被放到公開的 C API 中,應該只能被 Python 內部所使用。請改用 PyTypeObject.tp_members。(由 Victor Stinner 於 bpo-40170 中所貢獻。)

  • 移除 HAVE_PY_SET_53BIT_PRECISION 巨集(移動至內部 C API)。(由 Victor Stinner 於 bpo-45412 中所貢獻。)

  • 移除 Py_UNICODE 編碼器 API,它們自從 Python 3.3 就被棄用,非常少用且和推薦的替代方案已無太大關聯。

    被移除的函式為:

    • PyUnicode_Encode()

    • PyUnicode_EncodeASCII()

    • PyUnicode_EncodeLatin1()

    • PyUnicode_EncodeUTF7()

    • PyUnicode_EncodeUTF8()

    • PyUnicode_EncodeUTF16()

    • PyUnicode_EncodeUTF32()

    • PyUnicode_EncodeUnicodeEscape()

    • PyUnicode_EncodeRawUnicodeEscape()

    • PyUnicode_EncodeCharmap()

    • PyUnicode_TranslateCharmap()

    • PyUnicode_EncodeDecimal()

    • PyUnicode_TransformDecimalToASCII()

    詳情請見 PEP 624搬遷指南。(由 Inada Naoki 於 bpo-44029 中所貢獻。)

Notable changes in 3.11.4

tarfile

  • The extraction methods in tarfile, and shutil.unpack_archive(), have a new a filter argument that allows limiting tar features than may be surprising or dangerous, such as creating files outside the destination directory. See Extraction filters for details. In Python 3.12, use without the filter argument will show a DeprecationWarning. In Python 3.14, the default will switch to 'data'. (Contributed by Petr Viktorin in PEP 706.)

Notable changes in 3.11.5

OpenSSL

  • Windows builds and macOS installers from python.org now use OpenSSL 3.0.