Python 3.8 有什么新变化

编者

Raymond Hettinger

本文解释了 Python 3.8 相比 3.7 的新增特性。 完整的详情可参阅 更新日志

预发布版用户应当清楚意识到此文档目前处于草稿状态。 它将随着 Python 3.8 的发布进程不断更新,因此即使已经阅读过较早的版本仍然值得再次查看。 尚未覆盖到的部分关键条目为:

  • PEP 578 - 针对潜在敏感操作的运行时审计钩子

  • python -m asyncio 运行原生的异步 REPL

摘要 - 发布重点

新的特性

赋值表达式

There is new syntax := that assigns values to variables as part of a larger expression. It is affectionately known as "the walrus operator" due to its resemblance to the eyes and tusks of a walrus.

在这个示例中,赋值表达式可以避免调用 len() 两次:

if (n := len(a)) > 10:
    print(f"List is too long ({n} elements, expected <= 10)")

类似的益处还可出现在正则表达式匹配中需要使用两次匹配对象的情况中,一次检测用于匹配是否发生,另一次用于提取子分组:

discount = 0.0
if (mo := re.search(r'(\d+)% discount', advertisement)):
    discount = float(mo.group(1)) / 100.0

此运算符也适用于配合 while 循环计算一个值来检测循环是否终止,而同一个值又在循环体中再次被使用的情况:

# Loop over fixed length blocks
while (block := f.read(256)) != '':
    process(block)

另一个值得介绍的用例出现于列表推导式中,在筛选条件中计算一个值,而同一个值又在表达式中需要被使用:

[clean_name.title() for name in names
 if (clean_name := normalize('NFC', name)) in allowed_names]

请尽量将海象运算符的使用限制在清晰的场合中,以降低复杂性并提升可读性。

请参阅 PEP 572 了解详情。

(由 Morehouse 在 bpo-35224 中贡献。)

仅限位置形参

新增了一个函数形参语法 / 用来指明某些函数形参必须使用仅限位置而非关键字参数的形式。 这种标记语法与通过 help() 所显示的使用 Larry Hastings 的 Argument Clinic 工具标记的 C 函数相同。

在下面的例子中,形参 ab 为仅限位置形参,cd 可以是位置形参或关键字形参,而 ef 要求为关键字形参:

def f(a, b, /, c, d, *, e, f):
    print(a, b, c, d, e, f)

以下均为合法的调用:

f(10, 20, 30, d=40, e=50, f=60)

但是,以下均为不合法的调用:

f(10, b=20, c=30, d=40, e=50, f=60)   # b cannot be a keyword argument
f(10, 20, 30, 40, 50, f=60)           # e must be a keyword argument

这种标记形式的一个用例是它允许纯 Python 函数完整模拟现有的用 C 代码编写的函数的行为。 例如,内置的 pow() 函数不接受关键字参数:

def pow(x, y, z=None, /):
    "Emulate the built in pow() function"
    r = x ** y
    return r if z is None else r%z

另一个用例是在不需要形参名称时排除关键字参数。 例如,内置的 len() 函数的签名为 len(obj, /)。 这可以排除如下这种笨拙的调用形式:

len(obj='hello')  # The "obj" keyword argument impairs readability

另一个益处是将形参标记为仅限位置形参将允许在未来修改形参名而不会破坏客户的代码。 例如,在 statistics 模块中,形参名 dist 在未来可能被修改。 这使得以下函数描述成为可能:

def quantiles(dist, /, *, n=4, method='exclusive')
    ...

由于在 / 左侧的形参不会被公开为可用关键字,其他形参名仍可在 **kwargs 中使用:

>>> def f(a, b, /, **kwargs):
...     print(a, b, kwargs)
...
>>> f(10, 20, a=1, b=2, c=3)         # a and b are used in two ways
10 20 {'a': 1, 'b': 2, 'c': 3}

这极大地简化了需要接受任意关键字参数的函数和方法的实现。 例如以下摘自 collections 模块的代码:

class Counter(dict):

    def __init__(self, iterable=None, /, **kwds):
        # Note "iterable" is a possible keyword argument

请参阅 PEP 570 了解详情。

(由 Pablo Galindo 在 bpo-36540 中贡献。)

用于已编译字节码文件的并行文件系统缓存

新增的 PYTHONPYCACHEPREFIX 设置 (也可使用 -X pycache_prefix) 可将隐式的字节码缓存配置为使用单独的并行文件系统树,而不是默认的每个源代码目录下的 __pycache__ 子目录。

缓存的位置会在 sys.pycache_prefix 中报告 (None 表示默认位置即 __pycache__ 子目录)。

(由 Carl Meyer 在 bpo-33499 中贡献。)

调试构建使用与发布构建相同的 ABI

Python 现在不论是以发布模式还是调试模块进行构建都将使用相同的 ABI。 在 Unix 上,当 Python 以调试模式构建时,现在将可以加载以发布模式构建的 C 扩展以及使用稳定版 ABI 构建的 C 扩展。

发布构建和调试构建现在都是 ABI 兼容的:定义 Py_DEBUG 宏不会再启用 Py_TRACE_REFS 宏,它引入了唯一的 ABI 不兼容性。 Py_TRACE_REFS 宏添加了 sys.getobjects() 函数和 PYTHONDUMPREFS 环境变量,它可以使用新的 ./configure --with-trace-refs 构建选项来设置。 (由 Victor Stinner 在 bpo-36465 中贡献。)

在 Unix 上,C 扩展不会再被链接到 libpython,但 Android 和 Cygwin 例外。 现在静态链接的 Python 将可以加载使用共享库 Python 构建的 C 扩展。 (由 Victor Stinner 在 bpo-21536 中贡献。)

在 Unix 上,当 Python 以调试模式构建时,导入操作现在也会查找在发布模式下编译的 C 扩展以及使用稳定版 ABI 编译的 C 扩展。 (由 Victor Stinner 在 bpo-36722 中贡献。)

要将 Python 嵌入到一个应用中,必须将新增的 --embed 选项传给 python3-config --libs --embed 以获得 -lpython3.8 (将应用链接到 libpython)。 要同时支持 3.8 和旧版本,请先尝试 python3-config --libs --embed 并在此命令失败时回退到 python3-config --libs (即不带 --embed)。

增加一个 pkg-config python-3.8-embed 模块用来将 Python 嵌入到一个应用中: pkg-config python-3.8-embed --libs 包含 -lpython3.8。 要同时支持 3.8 和旧版本,请先尝试 pkg-config python-X.Y-embed --libs 并在此命令失败时回退到 pkg-config python-X.Y --libs (即不带 --embed) (请将 X.Y 替换为 Python 版本号)。

另一方面,pkg-config python3.8 --libs 不再包含 -lpython3.8。 C 扩展不可被链接到 libpython (但 Android 和 Cygwin 例外,这两者的情况由脚本处理);此改变是故意被设为向下不兼容的。 (由 Victor Stinner 在 bpo-36721 中贡献。)

f-字符串支持 = 用于自动记录表达式和调试文档

增加 = 说明符用于 f-string。 形式为 f'{expr=}' 的 f-字符串将扩展表示为表达式文本,加一个等于号,再加表达式的求值结果。 例如:

>>> user = 'eric_idle'
>>> member_since = date(1975, 7, 31)
>>> f'{user=} {member_since=}'
"user='eric_idle' member_since=datetime.date(1975, 7, 31)"

通常的 f-字符串格式说明符 允许更细致地控制所要显示的表达式结果:

>>> delta = date.today() - member_since
>>> f'{user=!s}  {delta.days=:,d}'
'user=eric_idle  delta.days=16,075'

= 说明符将输出整个表达式,以便详细演示计算过程:

>>> print(f'{theta=}  {cos(radians(theta))=:.3f}')
theta=30  cos(radians(theta))=0.866

(由 Eric V. Smith 和 Larry Hastings 在 bpo-36817 中贡献。)

PEP 587: Python 初始化配置

PEP 587 增加了一个新的 C API 用来配置 Python 初始化,提供对整个配置过程的更细致控制以及更好的错误报告。

新的结构:

新的函数:

此 PEP 还为这些内部结构添加了 _PyRuntimeState.preconfig (PyPreConfig 类型) 和 PyInterpreterState.config (PyConfig 类型) 字段。 PyInterpreterState.config 成为新的引用配置,替代全局配置变量和其他私有变量。

请参阅 Python 初始化配置 获取详细文档。

请参阅 PEP 587 了解详情。

(由 Victor Stinner 在 bpo-36763 中贡献。)

Vectorcall: 用于 CPython 的快速调用协议

添加 "vectorcall" 协议到 Python/C API。 它的目标是对已被应用于许多类的现有优化进行正式化。 任何实现可调用对象的扩展类型均可使用此协议。

此特性目前为暂定状态,计划在 Python 3.9 将其完全公开。

请参阅 PEP 590 了解详情。

(由 Jeroen Demeyer 和 Mark Shannon 在 bpo-36974 中贡献。)

具有外部数据缓冲区的 pickle 协议 5

当使用 pickle 在 Python 进程间传输大量数据以充分发挥多核或多机处理的优势时,非常重要一点是通过减少内存拷贝来优化传输效率,并可能应用一些定制技巧例如针对特定数据的压缩。

pickle 协议 5 引入了对于外部缓冲区的支持,这样 PEP 3118 兼容的数据可以与主 pickle 流分开进行传输,这是由通信层来确定的。

请参阅 PEP 574 了解详情。

(由 Antoine Pitrou 在 bpo-36785 中贡献。)

其他语言特性修改

  • 在之前版本中 continue 语句不允许在 finally 子句中使用,这是因为具体实现存在一个问题。 在 Python 3.8 中此限制已被取消。 (由 Serhiy Storchaka 在 bpo-32489 中贡献。)

  • bool, intfractions.Fraction 类型现在都有一个 as_integer_ratio() 方法,与 floatdecimal.Decimal 中的已有方法类似。 这个微小的 API 扩展使得 numerator, denominator = x.as_integer_ratio() 这样的写法在多种数字类型上通用成为可能。 (由 Lisa Roach 在 bpo-33073 和 Raymond Hettinger 在 bpo-37819 中贡献。)

  • int, floatcomplex 的构造器现在会使用 __index__() 特殊方法,如果该方法可用而对应的方法 method __int__(), __float__()__complex__() 方法不可用的话。 (由 Serhiy Storchaka 在 bpo-20092 中贡献。)

  • 添加 \N{name} 转义符在 正则表达式 中的支持:

    >>> notice = 'Copyright © 2019'
    >>> copyright_year_pattern = re.compile(r'\N{copyright sign}\s*(\d{4})')
    >>> int(copyright_year_pattern.search(notice).group(1))
    2019
    

    (由 Jonathan Eunice 和 Serhiy Storchaka 在 bpo-30688 中贡献。)

  • 现在 dict 和 dictview 可以使用 reversed() 按插入顺序反向迭代。 (由 Rémi Lapeyre 在 bpo-33462 中贡献。)

  • 在函数调用中允许使用的关键字名称语法受到进一步的限制。 特别地,f((keyword)=arg) 不再被允许。 关键字参数赋值形式的左侧绝不允许一般标识符以外的其他内容。 参阅 bpo-34641

  • yieldreturn 语句中的一般可迭代对象解包不再要求加圆括号。 这使得 yieldreturn 的语法与正常的赋值语法更为一致:

    >>> def parse(family):
            lastname, *members = family.split()
            return lastname.upper(), *members
    
    >>> parse('simpsons homer marge bart lisa sally')
    ('SIMPSONS', 'homer', 'marge', 'bart', 'lisa', 'sally')
    

    (由 David Cuthbert 和 Jordan Chapman 在 bpo-32117 中贡献。)

  • 当类似 [(10, 20) (30, 40)] 这样在代码中少了一个逗号时,编译器将显示 SyntaxWarning 并附带更有帮助的提示。 这相比原来用 TypeError 来提示第一个元组是不可调用的更容易被理解。 (由 Serhiy Storchaka 在 bpo-15248 中贡献。)

  • datetime.datedatetime.datetime 的子类和 datetime.timedelta 对象之间的算术运算现在将返回相应子类的实例而不是基类的实例。 这也会影响到在具体实现中(直接或间接地)使用了 datetime.timedelta 算术的运算的返回类型,例如 datetime.datetime.astimezone()。 (由 Paul Ganssle 在 bpo-32417 中贡献。)

  • 当 Python 解释器通过 Ctrl-C (SIGINT) 被中断并且所产生的 KeyboardInterrupt 异常未被捕获,Python 进程现在会通过一个 SIGINT 信号或是使得发起调用的进程能检测到它是由 Ctrl-C 操作杀死的正确退出代码来退出。 POSIX 和 Windows 上的终端会相应地使用此代码在交互式会话中终止脚本。 (由 Google 的 Gregory P. Smith 在 bpo-1054041 中贡献。)

  • 某些高级编程风格要求为现有的函数更新 types.CodeType 对象。 由于代码对象是不可变的,需要基于现有代码对象模型创建一个新的代码对象。 使用 19 个形参将会相当繁琐。 现在,新的 replace() 方法使得通过少量修改的形参创建克隆对象成为可能。

    下面是一个修改 statistics.mean() 函数来防止 data 形参被用作关键字参数的例子:

    >>> from statistics import mean
    >>> mean(data=[10, 20, 90])
    40
    >>> mean.__code__ = mean.__code__.replace(co_posonlyargcount=1)
    >>> mean(data=[10, 20, 90])
    Traceback (most recent call last):
      ...
    TypeError: mean() got some positional-only arguments passed as keyword arguments: 'data'
    

    (由 Victor Stinner 在 bpo-37032 中贡献。)

  • 对于整数,现在 pow() 函数的三参数形式在底数与模数不可约的情况下允许指数为负值。 随后它会在指数为 -1 时计算底数的模乘逆元,并对其他负指数计算反模的适当幂次。 例如,要计算 38 模 137 的 模乘逆元 则可写为:

    >>> pow(38, -1, 137)
    119
    >>> 119 * 38 % 137
    1
    

    模乘逆元在求解 线性丢番图方程 会被用到。 例如,想要求出 4258𝑥 + 147𝑦 = 369 的整数解,首先应重写为 4258𝑥 369 (mod 147) 然后求解:

    >>> x = 369 * pow(4258, -1, 147) % 147
    >>> y = (4258 * x - 369) // -147
    >>> 4258 * x + 147 * y
    369
    

    (由 Mark Dickinson 在 bpo-36027 中贡献。)

  • 字典推导式已与字典字面值实现同步,会先计算键再计算值:

    >>> # Dict comprehension
    >>> cast = {input('role? '): input('actor? ') for i in range(2)}
    role? King Arthur
    actor? Chapman
    role? Black Knight
    actor? Cleese
    
    >>> # Dict literal
    >>> cast = {input('role? '): input('actor? ')}
    role? Sir Robin
    actor? Eric Idle
    

    对执行顺序的保证对赋值表达式来说很有用,因为在键表达式中赋值的变量将可在值表达式中被使用:

    >>> names = ['Martin von Löwis', 'Łukasz Langa', 'Walter Dörwald']
    >>> {(n := normalize('NFC', name)).casefold() : n for name in names}
    {'martin von löwis': 'Martin von Löwis',
     'łukasz langa': 'Łukasz Langa',
     'walter dörwald': 'Walter Dörwald'}
    

新增模块

  • 新增的 importlib.metadata 模块提供了从第三方包读取元数据的(临时)支持。 例如,它可以提取一个已安装软件包的版本号、入口点列表等等:

    >>> # Note following example requires that the popular "requests"
    >>> # package has been installed.
    >>>
    >>> from importlib.metadata import version, requires, files
    >>> version('requests')
    '2.22.0'
    >>> list(requires('requests'))
    ['chardet (<3.1.0,>=3.0.2)']
    >>> list(files('requests'))[:5]
    [PackagePath('requests-2.22.0.dist-info/INSTALLER'),
     PackagePath('requests-2.22.0.dist-info/LICENSE'),
     PackagePath('requests-2.22.0.dist-info/METADATA'),
     PackagePath('requests-2.22.0.dist-info/RECORD'),
     PackagePath('requests-2.22.0.dist-info/WHEEL')]
    

    (由 Barry Warsaw 和 Jason R. Coombs 在 bpo-34632 中贡献。)

改进的模块

ast

AST 节点现在具有 end_linenoend_col_offset 属性,它们给出节点结束的精确位置。 (这只适用于具有 linenocol_offset 属性的节点。)

ast.parse() 函数具有一些新的旗标:

  • type_comments=True 导致其返回与特定 AST 节点相关联的 PEP 484PEP 526 类型注释文本;

  • mode='func_type' 可被用于解析 PEP 484 "签名类型注释" (为函数定义 AST 节点而返回);

  • feature_version=(3, N) 允许指定一个更早的 Python 3 版本。 (例如,feature_version=(3, 4) 将把 asyncawait 视为非保留字。)

新增函数 ast.get_source_segment() 返回指定 AST 节点的源代码。

asyncio

在 Windows 上,现在默认的事件循环为 ProactorEventLoop。 (由 Victor Stinner 在 bpo-34687 中贡献。)

ProactorEventLoop 现在也支持 UDP。 (由 Adam Meily 和 Andrew Svetlov 在 bpo-29883 中贡献。)

ProactorEventLoop 现在可通过 KeyboardInterrupt ("CTRL+C") 来中断。 (由 Vladimir Matveev 在 bpo-23057 中贡献。)

builtins

内置的 compile() 已改进为可接受 ast.PyCF_ALLOW_TOP_LEVEL_AWAIT 旗标。 当传入此新旗标时,compile() 将允许之前会被视为无效语法的最高层级 await, async forasync with 构造,并可随后返回带有 CO_COROUTINE 旗标的异步代码对象。

(由 Matthias Bussonnier 在 bpo-34616 中贡献。)

collections

collections.namedtuple()_asdict() 方法现在将返回 dict 而不是 collections.OrderedDict。 此项更改是因为普通字典自 Python 3.7 起已保证具有确定的元素顺序。 如果还需要 OrderedDict 的额外特性,推荐的解决方案是将结果转换为需要的类型: OrderedDict(nt._asdict())。 (由 Raymond Hettinger 在 bpo-35864 中贡献。)

ctypes

在 Windows 上,CDLL 及其子类现在接受 winmode 形参来指定用于底层 LoadLibraryEx 调用的旗标。 默认旗标被设为仅加载来自可信任位置的 DLL 依赖项,包括 DLL 的存放路径(如果加载初始 DLL 时使用了完整或部分路径)以及通过 add_dll_directory() 添加的路径。

datetime

Added new alternate constructors datetime.date.fromisocalendar() and datetime.datetime.fromisocalendar(), which construct date and datetime objects respectively from ISO year, week number, and weekday; these are the inverse of each class's isocalendar method. (Contributed by Paul Ganssle in bpo-36004.)

functools

functools.lru_cache() 现在可直接作为装饰器而不是作为返回装饰器的函数。 因此这两种写法现在都被支持:

@lru_cache
def f(x):
    ...

@lru_cache(maxsize=256)
def f(x):
    ...

(由 Raymond Hettinger 在 bpo-36772 中贡献。)

gc

get_objects() 现在能接受一个可选的 generation 形参来指定一个用来获取对象的生成器。 由 Pablo Galindo 在 bpo-36016 中贡献。

gettext

添加了 pgettext() 及其变化形式。 (由 Franz Glasner, Éric Araujo 和 Cheryl Sabella 在 bpo-2504 中贡献。)

gzip

添加 mtime 形参到 gzip.compress() 用于可重现的输出。 (由 Guo Ci Teo 在 bpo-34898 中贡献。)

对于特定类型的无效或已损坏 gzip 文件现在将引发 BadGzipFile 而不是 OSError。 (由 Filip Gruszczyński, Michele Orrù 和 Zackery Spytz 在 bpo-6584 中贡献。)

idlelib 与 IDLE

超过 N 行(默认值为 50)的输出将被折叠为一个按钮。 N 可以在 Settings 对话框的 General 页的 PyShell 部分中进行修改。 数量较少但是超长的行可以通过在输出上右击来折叠。 被折叠的输出可通过双击按钮来展开,或是通过右击按钮来放入剪贴板或是单独的窗口。 (由 Tal Einat 在 bpo-1529353 中贡献。)

在 Run 菜单中增加了 "Run Customized" 以使用自定义设置来运行模块。 输入的任何命令行参数都会被加入 sys.argv。 它们在下次自定义运行时会再次显示在窗体中。 用户也可以禁用通常的 Shell 主模块重启。 (由 Cheryl Sabella, Terry Jan Reedy 等人在 bpo-5680bpo-37627 中贡献。)

在 IDLE 编辑器窗口中增加了可选的行序号。 窗口打开时默认不带行序号,除非在配置对话框的 General 选项卡中进行设置。 已打开窗口中的行序号可以在 Options 菜单中显示和隐藏。 (由 Tal Einat 和 Saimadhav Heblikar 在 bpo-17535 中贡献。)

上述修改已被反向移植到 3.7 维护发行版中。

inspect

inspect.getdoc() 函数现在可以找到 __slots__ 的文档字符串,如果该属性是一个元素值为文档字符串的 dict 的话。 这提供了类似于目前已有的 property(), classmethod()staticmethod() 等函数的文档选项:

class AudioClip:
    __slots__ = {'bit_rate': 'expressed in kilohertz to one decimal place',
                 'duration': 'in seconds, rounded up to an integer'}
    def __init__(self, bit_rate, duration):
        self.bit_rate = round(bit_rate / 1000.0, 1)
        self.duration = ceil(duration)

io

在开发模式 (-X env) 和调试构建中,io.IOBase 终结器现在会在 close() 方法失败时将异常写入日志。 发生的异常在发布构建中默认会被静默忽略。 (由 Victor Stinner 在 bpo-18748 中贡献。)

json.tool

添加选项 --json-lines 用于将每个输入行解析为单独的 JSON 对象。 (由 Weipeng Hong 在 bpo-31553 中贡献。)

math

添加了新的函数 math.dist() 用于计算两点之间的欧几里得距离。 (由 Raymond Hettinger 在 bpo-33089 中贡献。)

扩展了 math.hypot() 函数以便处理更多的维度。 之前它仅支持 2-D 的情况。 (由 Raymond Hettinger 在 bpo-33089 中贡献。)

添加了新的函数 math.prod() 作为的 sum() 同类,该函数返回 'start' 值 (默认值: 1) 乘以一个数字可迭代对象的积:

>>> prior = 0.8
>>> likelihoods = [0.625, 0.84, 0.30]
>>> math.prod(likelihoods, start=prior)
0.126

(由 Pablo Galindo 在 bpo-35606 中贡献。)

添加了新的函数 math.isqrt() 用于计算整数平方根。 (由 Mark Dickinson 在 bpo-36887 中贡献。)

函数 math.factorial() 不再接受非整数类参数。 (由 Pablo Galindo 在 bpo-33083 中贡献。)

mmap

mmap.mmap 类现在具有一个 madvise() 方法用于访问 madvise() 系统调用。 (由 Zackery Spytz 在 bpo-32941 中贡献。)

multiprocessing

添加了新的 multiprocessing.shared_memory 模块。 (由 Davin Potts 在 bpo-35813 中贡献。)

在macOS上,现在默认使用的启动方式是*spawn*启动方式。 (由 Victor Stinner 在 bpo-33725 中贡献。)

os

添加了 Windows 版的新函数 add_dll_directory() 用于在导入扩展模块或使用 ctypes 加载 DLL 时为原生依赖提供额外搜索路径。

添加了新的 os.memfd_create() 函数用于包装 memfd_create() 系统调用。 (由 Zackery Spytz 和 Christian Heimes 在 bpo-26836 中贡献。)

在 Windows 上,大部分用于处理重解析点,(包括符号链接和目录连接)的手动逻辑已被委托给操作系统。 特别地,os.stat() 现在将会遍历操作系统所支持的任何内容,而 os.lstat() 将只打开被标识为“名称代理”的重解析点,而其要由 os.stat() 打开其他的重解析点。 在所有情况下,stat_result.st_mode 将只为符号链接而非其他种类的重解析点设置 S_IFLNK。 要标识其他种类的重解析点,请检查新的 stat_result.st_reparse_tag 属性。

在 Windows 上,os.readlink() 现在能够读取目录连接。 请注意 islink() 会对目录连接返回 False,因此首先检查 islink 的代码将连续把连接视为目录,而会处理 os.readlink() 所引发错误的代码现在会把连接视为链接。

os.path

返回布尔值结果的 os.path 函数例如 exists(), lexists(), isdir(), isfile(), islink(), 以及 ismount() 现在对于包含在 OS 层级无法表示的字符或字节的路径将会返回 False 而不是引发 ValueError 或其子类 UnicodeEncodeErrorUnicodeDecodeError。 (由 Serhiy Storchaka 在 bpo-33721 中贡献。)

expanduser() 在 Windows 上现在改用 USERPROFILE 环境变量而不再使用 HOME,后者通常不会为一般用户账户设置。

isdir() 在 Windows 上不再为不存在的目录的链接返回真值。

realpath() 在 Windows 上现在会识别重解析点,包括符号链接和目录连接。

ncurses

添加了一个新变量用于保存下层 ncurses 库的结构版信息: ncurses_version。 (由 Serhiy Storchaka 在 bpo-31680 中贡献。)

pathlib

返回布尔值结果的 pathlib.Path 方法例如 exists(), is_dir(), is_file(), is_mount(), is_symlink(), is_block_device(), is_char_device(), is_fifo(), is_socket() 现在对于包含在 OS 层级无法表示的字符或字节的路径将会返回 False 而不是引发 ValueError 或其子类 UnicodeEncodeError。 (由 Serhiy Storchaka 在 bpo-33721 中贡献。)

添加了 pathlib.Path.link_to() 用于创建指向某个路径的硬链接。 (由 Joannah Nanjekye 在 bpo-26978 中贡献。)

pickle

缩减型的方法现在可在它们返回的元组中包含第 6 个条目。 此条目应当指定一个自定义的状态设置方法,该方法将替代常规的 __setstate__ 方法被调用。 (由 Pierre Glaser 和 Olivier Grisel 在 bpo-35900 中贡献。)

pickle 扩展子类化针对 C 优化的 Pickler 现在可通过定义特殊的 reducer_override() 方法来重载函数和类的封存逻辑。 (由 Pierre Glaser 和 Olivier Grisel 在 bpo-35900 中贡献。)

plistlib

添加了新的 plistlib.UID 并启动了对读取和写入经过 NSKeyedArchiver 编码的二进制 plists 的支持。 (由 Jon Janzen 在 bpo-26707 中贡献。)

py_compile

py_compile.compile() 现在支持静默模式。 (由 Joannah Nanjekye 在 bpo-22640 中贡献。)

shlex

新增了 shlex.join() 函数作为 shlex.split() 的逆操作。 (由 Bo Bayles 在 bpo-32102 中贡献。)

shutil

shutil.copytree() 现在接受新的 dirs_exist_ok 关键字参数。 (由 Josh Bronson 在 bpo-20849 中贡献。)

shutil.make_archive() 现在对新的归档默认使用 modern pax (POSIX.1-2001) 格式以提升可移植性和标准一致性,此特性继承自对 tarfile 模块的相应更改。 (由 C.A.M. Gerlach 在 bpo-30661 中贡献。)

shutil.rmtree() 在 Windows 上现在会移除目录连接而不会递归地先移除其中的内容。

socket

Added create_server() and has_dualstack_ipv6() convenience functions to automate the necessary tasks usually involved when creating a server socket, including accepting both IPv4 and IPv6 connections on the same socket. (Contributed by Giampaolo Rodolà in bpo-17561.)

socket.if_nameindex(), socket.if_nametoindex()socket.if_indextoname() 函数已经在 Windows 上实现。 (由 Zackery Spytz 在 bpo-37007 中贡献。)

ssl

增加了 SSLContext.post_handshake_auth 以及 ssl.SSLSocket.verify_client_post_handshake() 来启用并初始化 TLS 1.3 握手后验证。 (由 Christian Heimes 在 bpo-34670 中贡献。)

statistics

添加了 statistics.fmean() 作为 statistics.mean() 的更快速的浮点数版版本。 (由 Raymond Hettinger 和 Steven D'Aprano 在 bpo-35904 中贡献。)

添加了 statistics.geometric_mean() (由 Raymond Hettinger 在 bpo-27181 中贡献。)

添加了 statistics.multimode() 用于返回最常见值的列表。 (由 Raymond Hettinger 在 bpo-35892 中贡献。)

添加了 statistics.quantiles() 用于将数据或分布划分为多个等概率区间(例如四分位、十分位或百分位)。 (由 Raymond Hettinger 在 bpo-36546 中贡献。)

添加了 statistics.NormalDist 用于创建和操纵随机变量的正态分布。 (由 Raymond Hettinger 在 bpo-36018 中贡献。)

>>> temperature_feb = NormalDist.from_samples([4, 12, -3, 2, 7, 14])
>>> temperature_feb.mean
6.0
>>> temperature_feb.stdev
6.356099432828281

>>> temperature_feb.cdf(3)            # Chance of being under 3 degrees
0.3184678262814532
>>> # Relative chance of being 7 degrees versus 10 degrees
>>> temperature_feb.pdf(7) / temperature_feb.pdf(10)
1.2039930378537762

>>> el_niño = NormalDist(4, 2.5)
>>> temperature_feb += el_niño        # Add in a climate effect
>>> temperature_feb
NormalDist(mu=10.0, sigma=6.830080526611674)

>>> temperature_feb * (9/5) + 32      # Convert to Fahrenheit
NormalDist(mu=50.0, sigma=12.294144947901014)
>>> temperature_feb.samples(3)        # Generate random samples
[7.672102882379219, 12.000027119750287, 4.647488369766392]

sys

添加了新的 sys.unraisablehook() 函数,可被重载以便控制如何处理“不可引发的异常”。 它会在发生了一个异常但 Python 没有办法处理时被调用。 例如,当一个析构器在垃圾回收时 (gc.collect()) 所引发的异常。 (由 Victor Stinner 在 bpo-36829 中贡献。)

tarfile

tarfile 模块现在对新的归档默认使用 modern pax (POSIX.1-2001) 格式而不再是之前的 GNU 专属格式。 这通过标准化和可扩展格式的统一编码 (UTF-8) 提升了跨平台可移植性,还提供了其他一些益处。 (由 C.A.M. Gerlach 在 bpo-36268 中贡献。)

threading

tokenize

当提供不带末尾新行的输入时,tokenize 模块现在会隐式地添加 NEWLINE 形符。 此行为现在已与 C 词法分析器的内部行为相匹配。 (由 Ammar Askar 在 bpo-33899 中贡献。)

tkinter

tkinter.Spinbox 中添加了方法 selection_from(), selection_present(), selection_range()selection_to()。 (由 Juliette Monsel 在 bpo-34829 中贡献。)

tkinter.Canvas 类中添加了方法 moveto()。 (由 Juliette Monsel 在 bpo-23831 中贡献。)

tkinter.PhotoImage 类现在具有 transparency_get()transparency_set() 方法。 (由 Zackery Spytz 在 bpo-25451 中贡献。)

time

为 macOS 10.12 添加了新的时钟 CLOCK_UPTIME_RAW。 (由 Joannah Nanjekye 在 bpo-35702 中贡献。)

typing

typing 模块加入了一些新特性:

unicodedata

  • unicodedata 模块现在已升级为使用 Unicode 12.1.0 发布版。

  • 新的函数 is_normalized() 可被用来验证字符串是否为特定正规形式,通常会比实际进行字符串正规化要快得多。 (由 Max Belanger, David Euresti 和 Greg Price 在 bpo-32285bpo-37966 中贡献。)

unittest

  • 添加了 AsyncMock 以支持异步版本的 Mock。 同时也添加了相应的断言函数用于测试。 (由 Lisa Roach 在 bpo-26467 中贡献。)

  • unittest 添加了 addModuleCleanup()addClassCleanup() 以支持对 setUpModule()setUpClass() 进行清理。 (由 Lisa Roach 在 bpo-24412 中贡献。)

  • 一些模拟断言函数现在也会在失败时打印一个实际调用列表。 (由 Petter Strandmark 在 bpo-35047 中贡献。)

  • unittest 模块已支持通过 unittest.IsolatedAsyncioTestCase 来使用协程作为测试用例。 (由 Andrew Svetlov 在 bpo-32972 中贡献。)

    示例:

    import unittest
    
    
    class TestRequest(unittest.IsolatedAsyncioTestCase):
    
        async def asyncSetUp(self):
            self.connection = await AsyncConnection()
    
        async def test_get(self):
            response = await self.connection.get("https://example.com")
            self.assertEqual(response.status_code, 200)
    
        async def asyncTearDown(self):
            await self.connection.close()
    
    
    if __name__ == "__main__":
        unittest.main()
    

venv

  • 现在 venv 在所有平台上都会包含 Activate.ps1 脚本用于在 PowerShell Core 6.1 下激活虚拟环境。 (由 Brett Cannon 在 bpo-32718 中贡献。)

weakref

  • weakref.proxy() 返回的代理对象现在除其他算术运算符外也支持矩阵乘法运算符 @@=。 (由 Mark Dickinson 在 bpo-36669 中贡献。)

xml

  • 作为对 DTD 和外部实体检索的缓解,在默认情况下 xml.dom.minidomxml.sax 模块不再处理外部实体。 (由 Christian Heimes 在 bpo-17239 中贡献。)

  • xml.etree.ElementTree 模块中的 .find*() 方法支持通配符搜索例如 {*}tag,此搜索会忽略命名空间以及返回给定命名空间中所有标签的 {namespace}*。 (由 Stefan Behnel 在 bpo-28238 中贡献。)

  • xml.etree.ElementTree 模块提供了实现 C14N 2.0 的新函数 –xml.etree.ElementTree.canonicalize()。 (由 Stefan Behnel 在 bpo-13611 中贡献。)

  • xml.etree.ElementTree.XMLParser 的目标对象可通过新的回调方法 start_ns()end_ns() 来接受命名空间声明事件。 此外,xml.etree.ElementTree.TreeBuilder 目标可被配置为处理有关注释和处理指令事件以将它们包含在所生成的树当中。 (由 Stefan Behnel 在 bpo-36676bpo-36673 中贡献。)

性能优化

  • subprocess 模块现在能在某些情况下使用 os.posix_spawn() 函数以获得更好的性能。 目前,它的使用仅限 macOS 和 Linux(使用 glibc 2.24 或更新版本),并要求满足以下条件:

    • close_fds 为假值;

    • preexec_fn, pass_fds, cwdstart_new_session 形参未设置;

    • executable 路径包含一个目录。

    (由 Joannah Nanjekye 和 Victor Stinner 在 bpo-35537 中贡献。)

  • shutil.copyfile(), shutil.copy(), shutil.copy2(), shutil.copytree() and shutil.move() use platform-specific "fast-copy" syscalls on Linux and macOS in order to copy the file more efficiently. "fast-copy" means that the copying operation occurs within the kernel, avoiding the use of userspace buffers in Python as in "outfd.write(infd.read())". On Windows shutil.copyfile() uses a bigger default buffer size (1 MiB instead of 16 KiB) and a memoryview()-based variant of shutil.copyfileobj() is used. The speedup for copying a 512 MiB file within the same partition is about +26% on Linux, +50% on macOS and +40% on Windows. Also, much less CPU cycles are consumed. See Platform-dependent efficient copy operations section. (Contributed by Giampaolo Rodolà in bpo-33671.)

  • shutil.copytree() uses os.scandir() function and all copy functions depending from it use cached os.stat() values. The speedup for copying a directory with 8000 files is around +9% on Linux, +20% on Windows and +30% on a Windows SMB share. Also the number of os.stat() syscalls is reduced by 38% making shutil.copytree() especially faster on network filesystems. (Contributed by Giampaolo Rodolà in bpo-33695.)

  • pickle 模块使用的默认协议现在为 Protocol 4,最早在 Python 3.4 中被引入。 它提供了比自 Python 3.0 起可用的 Protocol 3 更好的性能和更小的数据尺寸。

  • PyGC_Head 移除了一个 Py_ssize_t 成员。 所有跟踪 GC 的对象(例如 tuple, list, dict) 大小减少了 4 或 8 字节。 (由 Inada Naoki 在 bpo-33597 中贡献。)

  • uuid.UUID 现在会使用 __slots__ 以减少内存足迹。

  • operator.itemgetter() 的性能提升了 33%。 优化了参数处理,并为常见的在元组中单个非负整数索引的情况新增了一条快速路径(这是标准库中的典型用例)。 (由 Raymond Hettinger 在 bpo-35664 中贡献。

  • 加快了在 collections.namedtuple() 中的字段查找。 它们现在的速度快了两倍以上,成为 Python 中最快的实例变量查找形式。 (由 Raymond Hettinger, Pablo Galindo 和 Joe Jevnik, Serhiy Storchaka 在 bpo-32492 中贡献。)

  • 如果输入的可迭代对象的长度已知 (即输入对象实现了 __len__),list 构造器不会过度分配内部项缓冲区。 这使得所创建的列表资源占用平均减少了 12%。 (由 Raymond Hettinger 和 Pablo Galindo 在 bpo-33234 中贡献。)

  • 类变量写入速度加倍。 当一个非冗余属性被更新时,之前存在一个更新 slots 的非必要调用。 (由 Stefan Behnel, Pablo Galindo Salgado, Raymond Hettinger, Neil Schemenauer, 和 Serhiy Storchaka 在 bpo-36012 中贡献。)

  • 减少了传递给许多内置函数和方法的参数转换的开销。 这使得某些简单内置函数和方法的速度提升了 20--50%。 (由 Serhiy Storchaka 在 bpo-23867, bpo-35582bpo-36127 中贡献。)

  • LOAD_GLOBAL 指令现在会使用新的 "per opcode cache" 机制。 它的速度现在提升了大约 40%。 (由 Yury Selivanov 和 Inada Naoki 在 bpo-26219 中贡献。)

构建和 C API 的改变

  • 默认的 sys.abiflags 成为一个空字符串:pymalloc 的 m 旗标不再有意义(无论是否启用 pymalloc 构建都是兼容 ABI 的)因此已被移除。 (由 Victor Stinner 在 bpo-36707 中贡献。)

    改变的例子:

    • 只会安装 python3.8 程序,不再有 python3.8m 程序。

    • 只会安装 python3.8-config 脚本,不再有 python3.8m-config 脚本。

    • m 旗标已经从动态库文件名后缀中移除:包括标准库中的扩展模块以及第三方包所产生和安装的模块例如从 PyPI 下载的模块。 以 Linux 为例,Python 3.7 的后缀 .cpython-37m-x86_64-linux-gnu.so 在 Python 3.8 中改为 .cpython-38-x86_64-linux-gnu.so

  • 重新组织了所有头文件以更好地区分不同种类的 API:

    • Include/*.h 应为可移植的公有稳定版 C API。

    • Include/cpython/*.h 应为 CPython 专属的不稳定版 C API;公有 API,部分私有 API 附加 _Py or _PY 前缀。

    • Include/internal/*.h 应为 CPython 特别专属的私有内部 C API。 此 API 不具备向下兼容保证并且不应在 CPython 以外被使用。 它们的公开仅适用于特别限定的需求例如调试器和性能分析等必须直接访问 CPython 内部数据而不通过调用函数的应用。 此 API 现在是通过 make install 安装的。

    (由 Victor Stinner 在 bpo-35134bpo-35081 贡献,相关工作由 Eric Snow 在 Python 3.7 中发起)

  • 某些宏已被转换为静态内联函数:形参类型和返回类型定义良好,它们不再会有与宏相关的问题,变量具有局部作用域。 例如:

    (由 Victor Stinner 在 bpo-35059 中贡献。)

  • PyByteArray_Init()PyByteArray_Fini() 函数已被移除。 它们自 Python 2.7.4 和 Python 3.2.0 起就没有任何用处,被排除在受限 API (稳定版 ABI) 之外,并且未被写入文档。 (由 Victor Stinner 在 bpo-35713 中贡献。)

  • PyExceptionClass_Name() 的结果类型现在是 const char * 而非 char *。 (由 Serhiy Storchaka 在 bpo-33818 中贡献。)

  • Modules/Setup.distModules/Setup 两者的共存已被移除。 之前在更新 CPython 源码树时,开发者必须手动拷贝 Modules/Setup.dist (在源码树内) 到 Modules/Setup (在构建树内) 以反映上游的任何改变。 旧特性对打包者来说有一点益处,但代价是对追踪 CPython 开发进程的开发者造成经常性的麻烦,因为忘记拷贝该文件可能导致构建失败。

    现在构建系统总是会从源码树内的 Modules/Setup 读取数据。 建议希望定制该文件的开发者在 CPython 的一个 git 分叉或补丁文件中维护他们的更改,就如他们对源码树做任何其他改变时一样。

    (由 Antoine Pitrou 在 bpo-32430 中贡献。)

  • 将 Python 数字转换为 C 整型的函数例如 PyLong_AsLong() 以及带有 'i' 之类整型转换格式单元的参数解析函数例如 PyArg_ParseTuple() 现在如果可能将会使用 __index__() 特殊方法而不是 __int__()。 对于带有 __int__() 方法但没有 __index__() 方法的对象 (例如 DecimalFraction) 将会发出弃用警告。 对于实现了 __index__() 的对象 PyNumber_Check() 现在将返回 1PyNumber_Long(), PyNumber_Float()PyFloat_AsDouble() 现在如果可能也将会使用 __index__() 方法。 (由 Serhiy Storchaka 在 bpo-36048bpo-20092 中贡献。)

  • 堆分配类型对象现在将增加它们在 PyObject_Init() (及其对应的宏 PyObject_INIT) 中的引用计数而不是在 PyType_GenericAlloc() 中。 修改实例分配或中止分配的类型可能需要进行调整。 (由 Elizondo 在 bpo-35810 中贡献。)

  • 新增函数 PyCode_NewWithPosOnlyArgs() 允许创建代码对象例如 PyCode_New(),但带有一个额外的 posonlyargcount 形参以指明仅限位置参数的数量。 (由 Pablo Galindo 在 bpo-37221 中贡献。)

  • Py_SetPath() 现在会将 sys.executable 设为程序完整路径 (Py_GetProgramFullPath()) 而不是程序名称 (Py_GetProgramName())。 (由 Victor Stinner 在 bpo-38234 中贡献。)

弃用

API 与特性的移除

下列特性与 API 已从 Python 3.8 中移除:

  • macpath 模块,在 Python 3.7 中弃用,现已被移除。 (由 Victor Stinner 在 bpo-35471 中贡献。)

  • The function platform.popen() has been removed, after having been deprecated since Python 3.3: use os.popen() instead. (Contributed by Victor Stinner in bpo-35345.)

  • The function time.clock() has been removed, after having been deprecated since Python 3.3: use time.perf_counter() or time.process_time() instead, depending on your requirements, to have well-defined behavior. (Contributed by Matthias Bussonnier in bpo-36895.)

  • pyvenv 脚本已被移除,推荐改用 python3.8 -m venv 来帮助消除容易混淆 pyvenv 脚本所关联的 Python 解释器这一问题。 (由 Brett Cannon 在 bpo-25427 中贡献。)

  • parse_qs, parse_qsl, and escape are removed from the cgi module. They are deprecated in Python 3.2 or older. They should be imported from the urllib.parse and html modules instead.

  • filemode function is removed from the tarfile module. It is not documented and deprecated since Python 3.3.

  • The XMLParser constructor no longer accepts the html argument. It never had an effect and was deprecated in Python 3.4. All other parameters are now keyword-only. (Contributed by Serhiy Storchaka in bpo-29209.)

  • XMLParserdoctype() 方法已被移除。 (由 Serhiy Storchaka 在 bpo-29209 中贡献。)

  • "unicode_internal" 编解码器已被移除。 (由 Inada Naoki 在 bpo-36297 中贡献。)

  • sqlite3 模块的 CacheStatement 对象已不再公开给用户。 (由 Aviv Palivoda 在 bpo-30262 中贡献。)

  • fileinput.input()fileinput.FileInput() 中自 Python 3.6 起就被忽略并弃用的 bufsize 关键字参数已被移除。 (由 Matthias Bussonnier 在 bpo-36952 中贡献。)

  • 在 Python 3.7 中弃用的函数 sys.set_coroutine_wrapper()sys.get_coroutine_wrapper() 已被移除。 (由 Matthias Bussonnier 在 bpo-36933 中贡献。)

移植到 Python 3.8

本节列出了先前描述的更改以及可能需要更改代码的其他错误修正.

Python 行为的改变

  • yield 表达式(包括 yieldyield from 子句)现在不允许在推导式和生成器表达式中使用(但 for 子句最左边的可迭代对象表达式除外)。 (由 Serhiy Storchaka 在 bpo-10544 中贡献。)

  • 当标识号检测 (isis not) 与特定类型的字面值 (例如字符串、整数) 一同使用时编译器现在会产生 SyntaxWarning。 这在 CPython 中通常是可行的,但并不被语言定义所保证。 该警告会建议用户改用相等性检测 (== and !=)。 (由 Serhiy Storchaka 在 bpo-34850 中贡献。)

  • CPython 解释器在某些情形下可以忽略异常。 在 Python 3.8 中这种情况会更少发生。 特别地,从类型字典获取属性时引发的异常不会再被忽略。 (由 Serhiy Storchaka 在 bpo-35459 中贡献。)

  • 从内置类型 bool, int, float, complex 和标准库的一些类中移除了 __str__ 实现。 它们现在会从 object 继承 __str__()。 作为结果,在这些类的子类中定义 __repr__() 方法将会影响它们的字符串表示。 (由 Serhiy Storchaka 在 bpo-36793 中贡献。)

  • On AIX, sys.platform doesn't contain the major version anymore. It is always 'aix', instead of 'aix3' .. 'aix7'. Since older Python versions include the version number, so it is recommended to always use sys.platform.startswith('aix'). (Contributed by M. Felt in bpo-36588.)

  • 现在 PyEval_AcquireLock()PyEval_AcquireThread() 如果在解释器终结化时被调用将会终结当前线程,以使它们与 PyEval_RestoreThread(), Py_END_ALLOW_THREADS() 以及 PyGILState_Ensure() 保持一致。 如果不想要这样的行为,请通过检测 _Py_IsFinalizing()sys.is_finalizing() 来保护该调用。

更改的Python API

  • 在 Windows 上 os.getcwdb() 函数现在会使用 UTF-8 编码格式而不是 ANSI 代码页:请参看 PEP 529 了解具体原因。 该函数在 Windows 上不再被弃用。 (由 Victor Stinner 在 bpo-37412 中贡献。)

  • subprocess.Popen can now use os.posix_spawn() in some cases for better performance. On Windows Subsystem for Linux and QEMU User Emulation, the Popen constructor using os.posix_spawn() no longer raises an exception on errors like "missing program". Instead the child process fails with a non-zero returncode. (Contributed by Joannah Nanjekye and Victor Stinner in bpo-35537.)

  • The preexec_fn argument of * subprocess.Popen is no longer compatible with subinterpreters. The use of the parameter in a subinterpreter now raises RuntimeError. (Contributed by Eric Snow in bpo-34651, modified by Christian Heimes in bpo-37951.)

  • imap.IMAP4.logout() 方法不会再忽略静默的任意异常。

  • The function platform.popen() has been removed, after having been deprecated since Python 3.3: use os.popen() instead. (Contributed by Victor Stinner in bpo-35345.)

  • 当传入多模数据时 statistics.mode() 函数不会再引发异常。 它将改为返回在输入数据中遇到的第一个模式。 (由 Raymond Hettinger 在 bpo-35892 中贡献。)

  • tkinter.ttk.Treeview 类的 selection() 方法不再接受参数。 带参数调用该方法来改变选择在 Python 3.6 中已弃用。 请使用专门方法例如 selection_set() 来改变选择。 (由 Serhiy Storchaka 在 bpo-31508 中贡献。)

  • The writexml(), toxml() and toprettyxml() methods of xml.dom.minidom, and the write() method of xml.etree, now preserve the attribute order specified by the user. (Contributed by Diego Rojas and Raymond Hettinger in bpo-34160.)

  • 附带 'r' 旗标打开的 dbm.dumb 数据库现在将是只读的。 如果数据库不存在,附带 'r''w' 旗标的 dbm.dumb.open() 不会再创建数据库。 (由 Serhiy Storchaka 在 bpo-32749 中贡献。)

  • The doctype() method defined in a subclass of XMLParser will no longer be called and will emit a RuntimeWarning instead of a DeprecationWarning. Define the doctype() method on a target for handling an XML doctype declaration. (Contributed by Serhiy Storchaka in bpo-29209.)

  • 现在当自定义元类未在传给 type.__new__ 的命名空间中提供 __classcell__ 入口时将引发 RuntimeError。 在 Python 3.6--3.7 中是则是引发 DeprecationWarning。 (由 Serhiy Storchaka 在 bpo-23722 中贡献。)

  • cProfile.Profile 类现在可被用作上下文管理器。 (由 Scott Sanderson 在 bpo-29235 中贡献。)

  • shutil.copyfile(), shutil.copy(), shutil.copy2(), shutil.copytree()shutil.move() 会使用平台专属的 "fast-copy" 系统调用(参见 Platform-dependent efficient copy operations 一节)。

  • shutil.copyfile() 在 Windows 上的默认缓冲区大小从 16 KiB 改为 1 MiB。

  • PyGC_Head 结构已被完全改变。 所有接触到该结构的代码都应当被重写。 (参见 bpo-33597)

  • PyInterpreterState 结构已被移入 "internal" 头文件 (特别是 Include/internal/pycore_pystate.h)。 不透明的 PyInterpreterState 作为公有 API (和稳定版 ABI) 的一部分仍然可用。 文档指明该结构的任何字段都不是公有的,因此我们希望没人在使用它们。 但是,如果你确实依赖其中某一个或更多个私有字段并且没有其他替代选项,则请开一个 BPO 问题。 我们将尽力帮助你进行调整 (可能包括向公有 API 添加访问器函数)。 (参见 bpo-35886。)

  • 现在 asyncio 任务可以被命名,具体方式是将 name 关键字参数传给 asyncio.create_task()create_task() 事件循环方法,或是在任务对象上调用 set_name() 方法。 任务名称可在 asyncio.Taskrepr() 输出中查看,并可使用 get_name() 方法来获取。

  • The mmap.flush() method now returns None on success and raises an exception on error under all platforms. Previously, its behavior was platform-dependent: a nonzero value was returned on success; zero was returned on error under Windows. A zero value was returned on success; an exception was raised on error under Unix. (Contributed by Berker Peksag in bpo-2122.)

  • xml.dom.minidomxml.sax 模块默认将不再处理外部实体。 (由 Christian Heimes 在 bpo-17239 中贡献。)

  • 从只读的 dbm 数据库 (dbm.dumb, dbm.gnudbm.ndbm) 删除键将会引发 error (dbm.dumb.error, dbm.gnu.errordbm.ndbm.error) 而不是 KeyError。 (由 Xiang Zhang 在 bpo-33106 中贡献。)

  • expanduser() 在 Windows 上现在改用 USERPROFILE 环境变量而不再使用 HOME,后者通常不会为一般用户账户设置。

  • 异常 asyncio.CancelledError 现在继承自 BaseException 而不再是 Exception。 (由 Yury Selivanov 在 bpo-13528 中贡献。)

  • 在 Windows 上对扩展模块的 DLL 依赖以及通过 ctypes 加载的 DLL 的解析现在将更为安全。 只有系统路径、包含相应 DLL 或 PYD 文件的路径以及通过 add_dll_directory() 添加的目录才会被作为加载时依赖的搜索位置。 特别地,PATH 和当前工作目录将不再被使用,对它们的修改将不再对正常的 DLL 解析产生影响。 如果你的应用依赖于这些机制,你应当先检查 add_dll_directory(),如果存在就用它在加载你的库时添加你的 DLL 目录。 请注意 Windows 7 用户还需要确保 Windows 更新包 KB2533625 已安装(这一点也会由安装器进行验证)。 (参见 bpo-36085。)

  • 关联到 pgen 的头文件和函数在其被纯 Python 实现取代后已被移除。 (由 Pablo Galindo 在 bpo-36623 中贡献。)

  • types.CodeType has a new parameter in the second position of the constructor (posonlyargcount) to support positional-only arguments defined in PEP 570. The first argument (argcount) now represents the total number of positional arguments (including positional-only arguments). The new replace() method of types.CodeType can be used to make the code future-proof.

C API 中的改变

  • The PyCompilerFlags structure got a new cf_feature_version field. It should be initialized to PY_MINOR_VERSION. The field is ignored by default, and is used if and only if PyCF_ONLY_AST flag is set in cf_flags.

  • PyEval_ReInitThreads() 函数已从 C API 中移除。 它不应当被显式地调用;请改用 PyOS_AfterFork_Child()。 (由 Victor Stinner 在 bpo-36728 中贡献。)

  • 在 Unix 上,C 扩展不会再被链接到 libpython,但 Android 和 Cygwin 例外。 当 Python 被嵌入时,libpython 不可使用 RTLD_LOCAL 加载,而要改用 RTLD_GLOBAL。 之前使用 RTLD_LOCAL 已经不可能加载未链接到 libpython 的 C 扩展了,例如通过 Modules/Setup*shared* 部分构建的标准库 C 扩展。 (由 Victor Stinner 在 bpo-21536 中贡献。)

  • 在解析或构建值时(例如 PyArg_ParseTuple(), Py_BuildValue(), PyObject_CallFunction() 等等)使用形如 # 的格式而不定义 PY_SSIZE_T_CLEAN 现在将会引发 DeprecationWarning。 它将在 3.10 或 4.0 中被移除。 请参阅 语句解释及变量编译 了解详情。 (由 Inada Naoki 在 bpo-36381 中贡献。)

  • 堆分配类型的实例(例如使用 PyType_FromSpec() 创建的实例)会保存一个对其类型对象的引用。 提升这些类型对象引用计数的操作已从 PyType_GenericAlloc() 移至更低层级的函数 PyObject_Init()PyObject_INIT()。 这使用通过This makes types created through PyType_FromSpec() 所创建类型的行为与管理代码中的其他类保持一致。

    静态分配类型将不受影响。

    在大部分情况下,这应该都不会有附带影响。 但是,在分配实例后手动提升引用计数的类型(也许是为了绕过漏洞)现在可能永远不会被销毁。 要避免这种情况,这些类需要在实例撤销分配期间在类型对象上调用 Py_DECREF。

    要正确地将这些类型移植到 3.8,请应用以下修改:

    • 在分配实例之后在类型对象上移除 Py_INCREF —— 如果有的话。 这可以发生在调用 PyObject_New(), PyObject_NewVar(), PyObject_GC_New(), PyObject_GC_NewVar() 或任何其他使用 PyObject_Init()PyObject_INIT() 的自定义分配器之后。

      示例:

      static foo_struct *
      foo_new(PyObject *type) {
          foo_struct *foo = PyObject_GC_New(foo_struct, (PyTypeObject *) type);
          if (foo == NULL)
              return NULL;
      #if PY_VERSION_HEX < 0x03080000
          // Workaround for Python issue 35810; no longer necessary in Python 3.8
          PY_INCREF(type)
      #endif
          return foo;
      }
      
    • 确保所有堆分配类型的自定义 tp_dealloc 函数会减少类型的引用计数。

      示例:

      static void
      foo_dealloc(foo_struct *instance) {
          PyObject *type = Py_TYPE(instance);
          PyObject_GC_Del(instance);
      #if PY_VERSION_HEX >= 0x03080000
          // This was not needed before Python 3.8 (Python issue 35810)
          Py_DECREF(type);
      #endif
      }
      

    (由 Eddie Elizondo 在 bpo-35810 中贡献。)

  • Py_DEPRECATED() 宏已经针对 MSVC 实现。 这个宏现在必须放在符号名称之前。

    示例:

    Py_DEPRECATED(3.8) PyAPI_FUNC(int) Py_OldFunction(void);
    

    (由 Zackery Spytz 在 bpo-33407 中贡献。)

  • 解释器将不再假装支持跨发布版本的扩展类型二进制兼容性。 由第三方扩展模块所导出的 PyTypeObject 应该具有当前 Python 版本所要求的所有空位,包括 tp_finalize (Py_TPFLAGS_HAVE_FINALIZE 不会再在读取 tp_finalize 之前被检查)。

    (由 Antoine Pitrou 在 bpo-32388 中贡献。)

  • PyCode_New() 在第二个位置添加了新的形参 (posonlyargcount) 以支持 PEP 570,指明仅限位置参数的数量。

  • 函数 PyNode_AddChild()PyParser_AddToken() 现在接受两个额外的 int 参数 end_linenoend_col_offset

  • 用于允许 MinGW 工具直接链接到 python38.dlllibpython38.a 文件已不再包含于标准的 Windows 发布包中。 如果你需要此文件,可使用 gendefdlltool 工具来生成,这些工具是 MinGW binutils 包的一部分:

    gendef python38.dll > tmp.def
    dlltool --dllname python38.dll --def tmp.def --output-lib libpython38.a
    

    已安装的 pythonXY.dll 所在位置将取决于安装选项以及 Windows 的版本和语言。 请参阅 在Windows上使用 Python 了解更多信息。 该结果库应当放在与 pythonXY.lib 相同的目录下,这通常是你的 Python 安装路径下的 libs 目录。

CPython 字节码的改变

  • 解释器循环已通过将块堆栈展开逻辑移入编译器获得了简化。 编译器现在会发出显式指令来调整值堆栈并为 break, continuereturn 调用清除代码。

    移除了操作码 BREAK_LOOP, CONTINUE_LOOP, SETUP_LOOPSETUP_EXCEPT。 添加了新的操作码 ROT_FOUR, BEGIN_FINALLY, CALL_FINALLYPOP_FINALLY。 修改了 END_FINALLYWITH_CLEANUP_START 的行为。

    (由 Mark Shannon, Antoine Pitrou 和 Serhiy Storchaka 在 bpo-17611 中贡献。)

  • 添加了新的操作码 END_ASYNC_FOR 用于处理当等待 async for 循环的下一项时引发的异常。 (由 Serhiy Storchaka 在 bpo-33041 中贡献。)

  • MAP_ADD 现在会预期值为栈的第一个元素而键为第二个元素。 作出此改变以使得字典推导式能如 PEP 572 所提议的那样,键总是会在值之前被求值。 (由 Jörn Heissler 在 bpo-35224 中贡献。)

演示和工具

  • 添加了一个检测脚本用于对访问变量的不同方式进行计时: Tools/scripts/var_access_benchmark.py。 (由 Raymond Hettinger 在 bpo-35884 中贡献。)