Що нового в Python 2.6

Автор

A.M. Kuchling (amk в amk.ca)

This article explains the new features in Python 2.6, released on October 1 2008. The release schedule is described in PEP 361.

Основною темою Python 2.6 є підготовка шляху міграції до Python 3.0, значного перероблення мови. Коли це можливо, Python 2.6 включає нові функції та синтаксис із 3.0, залишаючись сумісним із існуючим кодом, не видаляючи старіші функції чи синтаксис. Коли це неможливо зробити, Python 2.6 намагається зробити все, що може, додаючи функції сумісності в модуль future_builtins і перемикач -3, щоб попереджати про використання, яке стане непідтримуваним у 3.0. .

До стандартної бібліотеки додано кілька важливих нових пакетів, таких як модулі multiprocessing і json, але є не так багато нових функцій, які якимось чином не пов’язані з Python 3.0.

Python 2.6 також бачить ряд покращень і виправлень помилок у вихідному коді. Пошук у журналах змін виявив, що між Python 2.5 і 2.6 було застосовано 259 патчів і 612 виправлених помилок. Обидві цифри, ймовірно, занижені.

Ця стаття не намагається надати повну специфікацію нових функцій, натомість надає зручний огляд. Щоб отримати повну інформацію, зверніться до документації для Python 2.6. Якщо ви хочете зрозуміти обґрунтування дизайну та впровадження, зверніться до PEP для конкретної нової функції. Коли це можливо, «Що нового в Python» посилається на елемент помилки/виправлення для кожної зміни.

Python 3.0

Цикл розробки Python версій 2.6 і 3.0 був синхронізований, альфа- і бета-версії для обох версій були зроблені в ті самі дні. Розробка версії 3.0 вплинула на багато функцій версії 2.6.

Python 3.0 — це масштабна переробка Python, яка порушує сумісність із серією 2.x. Це означає, що існуючий код Python потребує певного перетворення, щоб працювати на Python 3.0. Однак не всі зміни в 3.0 обов’язково порушують сумісність. У випадках, коли нові функції не призведуть до поломки існуючого коду, їх було перенесено до версії 2.6 і описано у відповідному місці в цьому документі. Ось деякі з функцій версії 3.0:

  • Метод __complex__() для перетворення об’єктів на комплексне число.

  • Альтернативний синтаксис для перехоплення винятків: except TypeError as exc.

  • Додано functools.reduce() як синонім вбудованої функції reduce().

Python 3.0 додає кілька нових вбудованих функцій і змінює семантику деяких існуючих вбудованих функцій. Функції, які є новими у версії 3.0, такі як bin(), просто додано до Python 2.6, але існуючі вбудовані функції не змінено; натомість модуль future_builtins має версії з новою семантикою 3.0. Код, написаний для сумісності з 3.0, може виконувати from future_builtins import hex, map за потреби.

Новий параметр командного рядка -3 дозволяє попереджати про функції, які буде видалено в Python 3.0. Ви можете запустити код за допомогою цього перемикача, щоб побачити, скільки роботи знадобиться для перенесення коду на 3.0. Значення цього параметра доступне для коду Python як логічна змінна sys.py3kwarning, а для коду розширення C як Py_Py3kWarningFlag.

Дивись також

Серія PEP 3xxx, яка містить пропозиції щодо Python 3.0. PEP 3000 описує процес розробки для Python 3.0. Почніть із PEP 3100, який описує загальні цілі для Python 3.0, а потім досліджуйте PEPS з вищими номерами, які пропонують конкретні функції.

Зміни в процесі розробки

Поки розроблялася версія 2.6, процес розробки Python зазнав двох значних змін: ми перейшли від засобу відстеження проблем SourceForge до налаштованої інсталяції Roundup, а документацію було перетворено з LaTeX на reStructuredText.

Новий засіб відстеження проблем: огляд

Протягом тривалого часу розробники Python дедалі більше дратувалися програмою відстеження помилок SourceForge. Розміщене рішення SourceForge не дозволяє багато налаштовувати; наприклад, неможливо було налаштувати життєвий цикл проблем.

The infrastructure committee of the Python Software Foundation therefore posted a call for issue trackers, asking volunteers to set up different products and import some of the bugs and patches from SourceForge. Four different trackers were examined: Jira, Launchpad, Roundup, and Trac. The committee eventually settled on Jira and Roundup as the two candidates. Jira is a commercial product that offers no-cost hosted instances to free-software projects; Roundup is an open-source project that requires volunteers to administer it and a server to host it.

Після публікації заклику до волонтерів було встановлено нову установку Roundup на https://bugs.python.org. Одна інсталяція Roundup може розмістити кілька трекерів, і цей сервер тепер також розміщує трекери проблем для Jython і для веб-сайту Python. Він, безсумнівно, знайде інші застосування в майбутньому. Там, де це можливо, це видання «Що нового в Python» містить посилання на елемент помилки/виправлення для кожної зміни.

Hosting of the Python bug tracker is kindly provided by Upfront Systems of Stellenbosch, South Africa. Martin von Löwis put a lot of effort into importing existing bugs and patches from SourceForge; his scripts for this import operation are at http://svn.python.org/view/tracker/importer/ and may be useful to other projects wishing to move from SourceForge to Roundup.

Дивись також

https://bugs.python.org

Відстежувач помилок Python.

http://bugs.jython.org:

Відстежувач помилок Jython.

http://roundup.sourceforge.net/

Зведення завантажень і документації.

http://svn.python.org/view/tracker/importer/

Сценарії перетворення Мартіна фон Льовіса.

Новий формат документації: reStructuredText за допомогою Sphinx

Документація Python була написана з використанням LaTeX з моменту початку проекту приблизно в 1989 році. У 1980-х і на початку 1990-х більшість документації роздруковували для подальшого вивчення, а не переглядали в Інтернеті. LaTeX широко використовувався, тому що він забезпечував привабливий друкований результат, залишаючись простим для написання після вивчення основних правил розмітки.

Сьогодні LaTeX все ще використовується для написання публікацій, призначених для друку, але ландшафт інструментів програмування змінився. Ми більше не друкуємо купу документів; замість цього ми переглядаємо його в Інтернеті, і HTML став найважливішим форматом для підтримки. На жаль, перетворення LaTeX на HTML є досить складним, і Фред Л. Дрейк молодший, давній редактор документації Python, витратив багато часу на підтримку процесу перетворення. Час від часу люди пропонували конвертувати документацію в SGML, а пізніше в XML, але якісне перетворення є головним завданням, і ніхто ніколи не витрачав час, необхідний для завершення роботи.

During the 2.6 development cycle, Georg Brandl put a lot of effort into building a new toolchain for processing the documentation. The resulting package is called Sphinx, and is available from http://sphinx-doc.org/.

Sphinx зосереджується на виведенні HTML, виробляючи привабливий і сучасний HTML; друкований вихід все ще підтримується через перетворення на LaTeX. Формат введення – reStructuredText, синтаксис розмітки, який підтримує спеціальні розширення та директиви, який зазвичай використовується в спільноті Python.

Sphinx — це окремий пакет, який можна використовувати для написання, і майже два десятки інших проектів (зазначені на веб-сайті Sphinx) прийняли Sphinx як інструмент для документування.

Дивись також

Документування Python

Описує, як писати документацію для Python.

Sphinx

Документація та код для Sphinx toolchain.

Docutils

Базовий аналізатор reStructuredText і набір інструментів.

PEP 343: оператор «з».

Попередня версія, Python 2.5, додала інструкцію „with“ як необов’язкову функцію, яку можна було ввімкнути за допомогою директиви from __future__ import with_statement. У версії 2.6 цей оператор більше не потрібно спеціально вмикати; це означає, що with тепер завжди є ключовим словом. Решта цього розділу є копією відповідного розділу з документа «Що нового в Python 2.5»; якщо ви знайомі з оператором „with“ з Python 2.5, ви можете пропустити цей розділ.

Інструкція „with“ уточнює код, який раніше використовував блоки try...finally, щоб забезпечити виконання коду очищення. У цьому розділі я обговорю твердження, як воно буде зазвичай використовуватися. У наступному розділі я розгляну деталі реалізації та покажу, як писати об’єкти для використання з цим оператором.

Оператор „with“ — це структура потоку керування, основна структура якої:

with expression [as variable]:
    with-block

Вираз обчислюється, і в результаті він має отримати об’єкт, який підтримує протокол керування контекстом (тобто має методи __enter__() і __exit__()).

__enter__() об’єкта викликається перед виконанням with-block і тому може запускати код налаштування. Він також може повертати значення, яке прив’язане до імені змінної, якщо його задано. (Зверніть увагу, що змінній не присвоєно результат виразу.)

Після завершення виконання with-block викликається метод __exit__() об’єкта, навіть якщо блок викликав виняткову ситуацію, і тому може запустити код очищення.

Деякі стандартні об’єкти Python тепер підтримують протокол керування контекстом і можуть використовуватися з оператором „with“. Одним із прикладів є файлові об’єкти:

with open('/etc/passwd', 'r') as f:
    for line in f:
        print line
        ... more processing code ...

Після виконання цього оператора файловий об’єкт у f буде автоматично закрито, навіть якщо цикл for викликав виняток під час проходження блоку.

Примітка

У цьому випадку f — це той самий об’єкт, створений open(), оскільки file.__enter__() повертає self.

Блокування та змінні умови модуля threading також підтримують оператор „with“:

lock = threading.Lock()
with lock:
    # Critical section of code
    ...

Блокування встановлюється перед виконанням блоку та завжди знімається після завершення блоку.

Функція localcontext() у модулі decimal дозволяє легко зберігати та відновлювати поточний десятковий контекст, який інкапсулює бажану точність і характеристики округлення для обчислень:

from decimal import Decimal, Context, localcontext

# Displays with default precision of 28 digits
v = Decimal('578')
print v.sqrt()

with localcontext(Context(prec=16)):
    # All code in this block uses a precision of 16 digits.
    # The original context is restored on exiting the block.
    print v.sqrt()

Написання менеджерів контексту

Під капотом оператор „with“ досить складний. Більшість людей використовуватимуть „with“ тільки в компанії з існуючими об’єктами, і їм не потрібно знати ці деталі, тому ви можете пропустити решту цього розділу, якщо хочете. Авторам нових об’єктів потрібно буде зрозуміти деталі базової реалізації та продовжувати читати.

Загальне пояснення протоколу керування контекстом таке:

  • Вираз обчислюється та має призвести до об’єкта, який називається «менеджер контексту». Менеджер контексту повинен мати методи __enter__() і __exit__().

  • Викликається метод __enter__() контекстного менеджера. Повернуте значення присвоюється VAR. Якщо пропозиції as VAR немає, значення просто відкидається.

  • Код у BLOCK виконується.

  • Якщо BLOCK викликає виняток, викликається метод __exit__() контекстного менеджера з трьома аргументами, деталями виключення (тип, значення, відстеження, ті самі значення, що повертаються sys.exc_info(), який також може бути None, якщо винятків не сталося). Значення, яке повертає метод, контролює, чи повторно виникає виняток: будь-яке значення false повторно викликає виняток, а True призведе до його придушення. Ви рідко захочете придушити виняток, тому що, якщо ви це зробите, автор коду, що містить оператор „with“, ніколи не зрозуміє, що щось пішло не так.

  • Якщо BLOCK не викликає винятку, метод __exit__() все одно викликається, але type, value і traceback мають значення None.

Давайте поміркуємо на прикладі. Я не буду представляти детальний код, а лише накидаю методи, необхідні для бази даних, яка підтримує транзакції.

(Для людей, які не знайомі з термінологією бази даних: набір змін до бази даних групується в транзакцію. Транзакції можуть бути або зафіксованими, тобто всі зміни записуються в базу даних, або відкоченими, тобто всі зміни скасовуються та база даних не змінена. Для отримання додаткової інформації зверніться до будь-якого підручника з баз даних.)

Припустімо, що є об’єкт, що представляє з’єднання з базою даних. Нашою метою буде дозволити користувачеві писати такий код:

db_connection = DatabaseConnection()
with db_connection as cursor:
    cursor.execute('insert into ...')
    cursor.execute('delete from ...')
    # ... more operations ...

Транзакцію слід зафіксувати, якщо код у блоці працює бездоганно, або відкотити, якщо є виняткова ситуація. Ось базовий інтерфейс для DatabaseConnection, який я припускаю:

class DatabaseConnection:
    # Database interface
    def cursor(self):
        "Returns a cursor object and starts a new transaction"
    def commit(self):
        "Commits current transaction"
    def rollback(self):
        "Rolls back current transaction"

Метод __enter__() досить простий, вам потрібно лише почати нову транзакцію. Для цієї програми отриманий об’єкт курсора буде корисним результатом, тому метод поверне його. Потім користувач може додати as cursor до свого оператора „with“, щоб прив’язати курсор до імені змінної.

class DatabaseConnection:
    ...
    def __enter__(self):
        # Code to start a new transaction
        cursor = self.cursor()
        return cursor

Метод __exit__() є найскладнішим, тому що в ньому потрібно виконати більшу частину роботи. Метод повинен перевірити, чи сталася виняткова ситуація. Якщо не було винятку, транзакція зафіксована. Транзакція відкочується, якщо стався виняток.

У наведеному нижче коді виконання просто припиниться в кінці функції, повертаючи значення за замовчуванням None. None є хибним, тому виняток буде знову створено автоматично. Якщо ви бажаєте, ви можете бути більш чіткими та додати оператор return у позначене місце.

class DatabaseConnection:
    ...
    def __exit__(self, type, value, tb):
        if tb is None:
            # No exception, so commit
            self.commit()
        else:
            # Exception occurred, so rollback.
            self.rollback()
            # return False

Модуль contextlib

Модуль contextlib надає деякі функції та декоратор, корисні під час написання об’єктів для використання з оператором „with“.

Декоратор називається contextmanager() і дозволяє писати одну функцію-генератор замість визначення нового класу. Генератор повинен видавати рівно одне значення. Код до yield буде виконано як метод __enter__(), а отримане значення буде поверненим значенням методу, яке буде прив’язано до змінної в „with „ оператора as пункт, якщо такий є. Код після yield буде виконано в методі __exit__(). Будь-які винятки, викликані в блоці, будуть викликані оператором yield.

Використовуючи цей декоратор, наш приклад бази даних із попереднього розділу можна записати так:

from contextlib import contextmanager

@contextmanager
def db_transaction(connection):
    cursor = connection.cursor()
    try:
        yield cursor
    except:
        connection.rollback()
        raise
    else:
        connection.commit()

db = DatabaseConnection()
with db_transaction(db) as cursor:
    ...

Модуль contextlib також має функцію nested(mgr1, mgr2, ...), яка поєднує кілька контекстних менеджерів, тому вам не потрібно писати вкладений „with“ заяви. У цьому прикладі один оператор „with“ запускає транзакцію бази даних і отримує блокування потоку:

lock = threading.Lock()
with nested (db_transaction(db), lock) as (cursor, locked):
    ...

Нарешті, функція closing() повертає свій аргумент, щоб його можна було прив’язати до змінної, і викликає метод .close() аргументу в кінці блоку.

import urllib, sys
from contextlib import closing

with closing(urllib.urlopen('http://www.yahoo.com')) as f:
    for line in f:
        sys.stdout.write(line)

Дивись також

PEP 343 - оператор «з».

PEP, написаний Гвідо ван Россумом і Ніком Когланом; реалізований Майком Блендом, Гвідо ван Россумом і Нілом Норвітцем. PEP показує код, згенерований для оператора „with“, який може бути корисним для вивчення того, як працює оператор.

Документація для модуля contextlib.

PEP 366: Явний відносний імпорт із основного модуля

Перемикач Python -m дозволяє запускати модуль як сценарій. Коли ви запускали модуль, який знаходився всередині пакета, відносний імпорт не працював належним чином.

Виправлення для Python 2.6 додає атрибут __package__ до модулів. Якщо цей атрибут присутній, відносні імпорти будуть відносними до значення цього атрибута замість атрибута __name__.

Потім імпортери у стилі PEP 302 можуть за потреби встановити __package__. Модуль runpy, який реалізує перемикач -m, тепер робить це, тож відносний імпорт тепер працюватиме правильно у сценаріях, що виконуються зсередини пакета.

PEP 370: каталог site-packages для кожного користувача

When you run Python, the module search path sys.path usually includes a directory whose path ends in "site-packages". This directory is intended to hold locally-installed packages available to all users using a machine or a particular site installation.

Python 2.6 представляє конвенцію для каталогів сайтів, призначених для користувача. Каталог залежить від платформи:

  • Unix і Mac OS X: ~/.local/

  • Windows: %APPDATA%/Python

У цьому каталозі будуть підкаталоги для певної версії, наприклад lib/python2.6/site-packages в Unix/Mac OS і Python26/site-packages у Windows.

Якщо вам не подобається каталог за замовчуванням, його можна замінити змінною середовища. PYTHONUSERBASE встановлює кореневий каталог для всіх версій Python, які підтримують цю функцію. У Windows каталог для даних програми можна змінити, встановивши змінну середовища APPDATA. Ви також можете змінити файл site.py для інсталяції Python.

Цю функцію можна повністю вимкнути, запустивши Python із параметром -s або встановивши змінну середовища PYTHONNOUSERSITE.

Дивись також

PEP 370 - каталог site-packages для кожного користувача

PEP написаний і реалізований Крістіаном Хеймсом.

PEP 371: Пакет multiprocessing

Новий пакет multiprocessing дозволяє програмам Python створювати нові процеси, які виконуватимуть обчислення та повертатимуть результат батьківському. Батьківський і дочірній процеси можуть спілкуватися за допомогою черг і каналів, синхронізувати свої операції за допомогою блокувань і семафорів, а також можуть обмінюватися простими масивами даних.

Модуль multiprocessing починався як точна емуляція модуля threading із використанням процесів замість потоків. Ця мета була відкинута на шляху до Python 2.6, але загальний підхід модуля все ще подібний. Основним класом є Process, якому передається об’єкт, що викликається, і набір аргументів. Метод start() встановлює виклик, що виконується в підпроцесі, після чого ви можете викликати метод is_alive(), щоб перевірити, чи підпроцес все ще працює, і метод join(), щоб дочекатися процес для виходу.

Ось простий приклад, коли підпроцес обчислить факториал. Функція, яка виконує обчислення, написана дивним чином, тому вона займає значно більше часу, коли вхідний аргумент кратний 4.

import time
from multiprocessing import Process, Queue


def factorial(queue, N):
    "Compute a factorial."
    # If N is a multiple of 4, this function will take much longer.
    if (N % 4) == 0:
        time.sleep(.05 * N/4)

    # Calculate the result
    fact = 1L
    for i in range(1, N+1):
        fact = fact * i

    # Put the result on the queue
    queue.put(fact)

if __name__ == '__main__':
    queue = Queue()

    N = 5

    p = Process(target=factorial, args=(queue, N))
    p.start()
    p.join()

    result = queue.get()
    print 'Factorial', N, '=', result

Queue використовується для передачі результату факториалу. Об’єкт Queue зберігається в глобальній змінній. Дочірній процес використовуватиме значення змінної, коли був створений дочірній процес; оскільки це Queue, батько і дитина можуть використовувати об’єкт для спілкування. (Якщо батько змінить значення глобальної змінної, це не вплине на значення дочірньої системи, і навпаки.)

Два інших класи, Pool і Manager, забезпечують інтерфейси вищого рівня. Pool створить фіксовану кількість робочих процесів, а потім запити можна розповсюджувати серед робочих, викликаючи apply() або apply_async(), щоб додати один запит, і map() або map_async(), щоб додати кілька запитів. Наступний код використовує Pool для розподілу запитів між 5 робочими процесами та отримання списку результатів:

from multiprocessing import Pool

def factorial(N, dictionary):
    "Compute a factorial."
    ...
p = Pool(5)
result = p.map(factorial, range(1, 1000, 10))
for v in result:
    print v

Це дає такий вихід:

1
39916800
51090942171709440000
8222838654177922817725562880000000
33452526613163807108170062053440751665152000000000
...

Інший інтерфейс високого рівня, клас Manager, створює окремий серверний процес, який може зберігати головні копії структур даних Python. Потім інші процеси можуть отримувати доступ до цих структур даних і змінювати їх за допомогою проксі-об’єктів. У наступному прикладі створюється спільний словник шляхом виклику методу dict(); робочі процеси потім вставляють значення в словник. (Блокування не виконується автоматично, що не має значення в цьому прикладі. Методи Manager також включають Lock(), RLock() і Semaphore() для створення спільних блокувань.)

import time
from multiprocessing import Pool, Manager

def factorial(N, dictionary):
    "Compute a factorial."
    # Calculate the result
    fact = 1L
    for i in range(1, N+1):
        fact = fact * i

    # Store result in dictionary
    dictionary[N] = fact

if __name__ == '__main__':
    p = Pool(5)
    mgr = Manager()
    d = mgr.dict()         # Create shared dictionary

    # Run tasks using the pool
    for N in range(1, 1000, 10):
        p.apply_async(factorial, (N, d))

    # Mark pool as closed -- no more tasks can be added.
    p.close()

    # Wait for tasks to exit
    p.join()

    # Output results
    for k, v in sorted(d.items()):
        print k, v

Це дасть результат:

1 1
11 39916800
21 51090942171709440000
31 8222838654177922817725562880000000
41 33452526613163807108170062053440751665152000000000
51 15511187532873822802242430164693032110632597200169861120000...

Дивись також

Документація для модуля multiprocessing.

PEP 371 - Додано багатопроцесорний пакет

PEP, написаний Джессі Ноллером і Річардом Оудкерком; реалізовано Річардом Оудкерком і Джессі Ноллером.

PEP 3101: Розширене форматування рядків

In Python 3.0, the % operator is supplemented by a more powerful string formatting method, format(). Support for the str.format() method has been backported to Python 2.6.

In 2.6, both 8-bit and Unicode strings have a .format() method that treats the string as a template and takes the arguments to be formatted. The formatting template uses curly brackets ({, }) as special characters:

>>> # Substitute positional argument 0 into the string.
>>> "User ID: {0}".format("root")
'User ID: root'
>>> # Use the named keyword arguments
>>> "User ID: {uid}   Last seen: {last_login}".format(
...    uid="root",
...    last_login = "5 Mar 2008 07:20")
'User ID: root   Last seen: 5 Mar 2008 07:20'

Фігурні дужки можна екранувати, подвоюючи їх:

>>> "Empty dict: {{}}".format()
"Empty dict: {}"

Імена полів можуть бути цілими числами, що вказують на позиційні аргументи, такі як {0}, {1 тощо, або назви ключових аргументів. Ви також можете надати складені назви полів, які зчитують атрибути або мають доступ до ключів словника:

>>> import sys
>>> print 'Platform: {0.platform}\nPython version: {0.version}'.format(sys)
Platform: darwin
Python version: 2.6a1+ (trunk:61261M, Mar  5 2008, 20:29:41)
[GCC 4.0.1 (Apple Computer, Inc. build 5367)]'

>>> import mimetypes
>>> 'Content-type: {0[.mp4]}'.format(mimetypes.types_map)
'Content-type: video/mp4'

Зауважте, що використовуючи нотацію у стилі словника, наприклад [.mp4], вам не потрібно брати лапки навколо рядка; він шукатиме значення, використовуючи .mp4 як ключ. Рядки, що починаються з числа, будуть перетворені на ціле число. Ви не можете писати складніші вирази всередині рядка форматування.

Поки що ми показали, як вказати, яке поле підставляти в результуючий рядок. Використовуване точне форматування також можна контролювати, додавши двокрапку, за якою йде специфікатор формату. Наприклад:

>>> # Field 0: left justify, pad to 15 characters
>>> # Field 1: right justify, pad to 6 characters
>>> fmt = '{0:15} ${1:>6}'
>>> fmt.format('Registration', 35)
'Registration    $    35'
>>> fmt.format('Tutorial', 50)
'Tutorial        $    50'
>>> fmt.format('Banquet', 125)
'Banquet         $   125'

Специфікатори формату можуть посилатися на інші поля через вкладення:

>>> fmt = '{0:{1}}'
>>> width = 15
>>> fmt.format('Invoice #1234', width)
'Invoice #1234  '
>>> width = 35
>>> fmt.format('Invoice #1234', width)
'Invoice #1234                      '

Можна вказати вирівнювання поля в межах бажаної ширини:

характер

Ефект

< (за умовчанням)

Вирівнювання по лівому краю

>

Вирівнювання по правому краю

^

центр

=

(Лише для числових типів) Додайте після знака.

Специфікатори формату також можуть містити тип представлення, який керує форматуванням значення. Наприклад, числа з плаваючою комою можна відформатувати як загальне число або в експоненціальній системі:

>>> '{0:g}'.format(3.75)
'3.75'
>>> '{0:e}'.format(3.75)
'3.750000e+00'

Доступні різноманітні типи презентацій. Зверніться до документації 2.6, щоб отримати повний список; ось зразок:

b

Двійковий. Виводить число за основою 2.

c

характер. Перетворює ціле число на відповідний символ Unicode перед друком.

d

Десяткове ціле число. Виводить число за основою 10.

о

Вісімковий формат. Виводить число за основою 8.

x

Шістнадцятковий формат. Виводить число за основою 16, використовуючи малі літери для цифр над 9.

e

Запис степеня. Друкує число в науковому записі, використовуючи літеру «e» для позначення степеня.

g

Загальний формат. Це друкує число як число з фіксованою комою, за винятком випадків, коли число надто велике, і в цьому випадку воно перемикається на позначення ступеня «e».

n

Номер. Це те саме, що «g» (для чисел з плаваючою точкою) або «d» (для цілих чисел), за винятком того, що для вставки відповідних символів-роздільників використовуються поточні параметри мови.

%

Відсоток. Множить число на 100 і відображається у фіксованому форматі („f“) із знаком відсотка.

Класи та типи можуть визначати метод __format__() для керування їх форматуванням. Він отримує єдиний аргумент, специфікатор формату:

def __format__(self, format_spec):
    if isinstance(format_spec, unicode):
        return unicode(str(self))
    else:
        return str(self)

Існує також вбудований format(), який форматує одне значення. Він викликає метод типу __format__() із наданим специфікатором:

>>> format(75.6564, '.2f')
'75.66'

Дивись також

Синтаксис рядка формату

Довідкова документація для полів формату.

PEP 3101 - Розширене форматування рядків

PEP, написаний Таліним. Реалізовано Еріком Смітом.

PEP 3105: друк як функція

Оператор print стає функцією print() у Python 3.0. Зробивши print() функцією, можна замінити функцію, виконавши def print(...) або імпортувавши нову функцію з іншого місця.

У Python 2.6 є імпорт __future__, який видаляє print як синтаксис мови, дозволяючи замість цього використовувати функціональну форму. Наприклад:

>>> from __future__ import print_function
>>> print('# of entries', len(dictionary), file=sys.stderr)

Сигнатура нової функції:

def print(*args, sep=' ', end='\n', file=None)

Параметри такі:

  • args: позиційні аргументи, значення яких буде роздруковано.

  • sep: роздільник, який буде надруковано між аргументами.

  • end: кінцевий текст, який буде надруковано після виведення всіх аргументів.

  • file: файловий об’єкт, до якого буде надіслано вивід.

Дивись також

PEP 3105 - Зробити друк функцією

PEP, написаний Георгом Брандлом.

PEP 3110: Зміни обробки винятків

Однією з помилок, яку іноді роблять програмісти Python, є написання наступного коду:

try:
    ...
except TypeError, ValueError:  # Wrong!
    ...

Автор, ймовірно, намагається перехопити винятки TypeError і ValueError, але цей код насправді робить щось інше: він перехопить TypeError і прив’яже отриманий об’єкт винятку до локальної назви "ValueError". Виняток ValueError не буде перехоплено взагалі. Правильний код визначає кортеж винятків:

try:
    ...
except (TypeError, ValueError):
    ...

Ця помилка виникає через те, що використання коми тут неоднозначне: чи вказує вона на два різні вузли в дереві розбору, чи на один вузол, який є кортежем?

Python 3.0 робить це однозначним, замінюючи кому словом «як». Щоб перехопити виняток і зберегти об’єкт винятку в змінній exc, ви повинні написати:

try:
    ...
except TypeError as exc:
    ...

Python 3.0 підтримуватиме лише використання «as», і тому інтерпретує перший приклад як перехоплення двох різних винятків. Python 2.6 підтримує як кому, так і «as», тому наявний код працюватиме й надалі. Тому ми пропонуємо використовувати «as» під час написання нового коду Python, який виконуватиметься лише з 2.6.

Дивись також

PEP 3110 - Перехоплення винятків у Python 3000

PEP написав і реалізував Колін Вінтер.

PEP 3112: Байтові літерали

Python 3.0 використовує Unicode як основний рядковий тип мови та позначає 8-бітні літерали по-різному, або як b'string', або за допомогою конструктора bytes. Для майбутньої сумісності Python 2.6 додає bytes як синонім для типу str, а також підтримує нотацію b''.

Тип str 2.6 відрізняється від типу bytes 3.0 різними способами; головне, що конструктор зовсім інший. У 3.0 bytes([65, 66, 67]) складається з 3 елементів, які містять байти, що представляють ABC; у версії 2.6 bytes([65, 66, 67]) повертає 12-байтовий рядок, який представляє str() списку.

Основним використанням bytes у 2.6 буде написання тестів типу об’єкта, наприклад isinstance(x, bytes). Це допоможе конвертеру 2to3, який не може визначити, чи код 2.x передбачає, що рядки містять символи чи 8-бітні байти; Тепер ви можете використовувати або bytes, або str, щоб точно представити свій намір, і отриманий код також буде правильним у Python 3.0.

Існує також імпорт __future__, завдяки якому всі рядкові літерали стають рядками Unicode. Це означає, що керуючі послідовності \u можна використовувати для включення символів Unicode:

from __future__ import unicode_literals

s = ('\u751f\u3080\u304e\u3000\u751f\u3054'
     '\u3081\u3000\u751f\u305f\u307e\u3054')

print len(s)               # 12 Unicode characters

На рівні C Python 3.0 перейменує існуючий 8-бітний рядковий тип, що називається PyStringObject у Python 2.x, на PyBytesObject. Python 2.6 використовує #define для підтримки використання імен PyBytesObject(), PyBytes_Check(), PyBytes_FromStringAndSize(), а також усіх інших функцій і макросів, які використовуються з рядки.

Екземпляри типу bytes незмінні, як і рядки. Новий тип bytearray зберігає змінну послідовність байтів:

>>> bytearray([65, 66, 67])
bytearray(b'ABC')
>>> b = bytearray(u'\u21ef\u3244', 'utf-8')
>>> b
bytearray(b'\xe2\x87\xaf\xe3\x89\x84')
>>> b[0] = '\xe3'
>>> b
bytearray(b'\xe3\x87\xaf\xe3\x89\x84')
>>> unicode(str(b), 'utf-8')
u'\u31ef \u3244'

Байтові масиви підтримують більшість методів типів рядків, таких як startswith()/endswith(), find()/rfind(), а також деякі методи списків, наприклад як append(), pop() і reverse().

>>> b = bytearray('ABC')
>>> b.append('d')
>>> b.append(ord('e'))
>>> b
bytearray(b'ABCde')

Існує також відповідний C API з PyByteArray_FromObject(), PyByteArray_FromStringAndSize() та різними іншими функціями.

Дивись також

PEP 3112 - Байтові літерали в Python 3000

PEP, написаний Джейсоном Орендорфом; перенесено до 2.6 Крістіаном Хеймсом.

PEP 3116: Нова бібліотека введення-виведення

Вбудовані файлові об’єкти Python підтримують низку методів, але файлоподібні об’єкти не обов’язково підтримують усі з них. Об’єкти, які імітують файли, зазвичай підтримують read() і write(), але вони можуть не підтримувати, наприклад, readline(). Python 3.0 представляє багаторівневу бібліотеку вводу-виводу в модулі io, яка відокремлює функції буферизації та обробки тексту від основних операцій читання та запису.

Модуль io пропонує три рівні абстрактних базових класів:

  • RawIOBase визначає необроблені операції введення-виведення: read(), readinto(), write(), seek(), tell(), truncate() і close(). Більшість методів цього класу часто відображаються на один системний виклик. Існують також методи readable(), writable() і seekable() для визначення того, які операції дозволятиме певний об’єкт.

    У Python 3.0 є конкретні реалізації цього класу для файлів і сокетів, але Python 2.6 не реструктурував свої об’єкти файлів і сокетів таким чином.

  • BufferedIOBase — це абстрактний базовий клас, який буферизує дані в пам’яті, щоб зменшити кількість використовуваних системних викликів, що робить обробку вводу-виводу більш ефективною. Він підтримує всі методи RawIOBase і додає атрибут raw, що містить базовий необроблений об’єкт.

    Є п’ять конкретних класів, що реалізують цю ABC. BufferedWriter і BufferedReader призначені для об’єктів, які підтримують використання лише для запису або лише для читання, які мають метод seek() для довільного доступу. Об’єкти BufferedRandom підтримують доступ для читання та запису до одного основного потоку, а BufferedRWPair призначений для таких об’єктів, як TTY, які мають операції читання та запису, що діють на незв’язані потоки даних. Клас BytesIO підтримує читання, запис і пошук у буфері в пам’яті.

  • TextIOBase: забезпечує функції для читання та запису рядків (пам’ятайте, що рядки будуть Unicode в Python 3.0), а також підтримує universal newlines. TextIOBase визначає метод readline() і підтримує ітерацію по об’єктах.

    Є дві конкретні реалізації. TextIOWrapper обгортає буферизований об’єкт введення-виведення, підтримуючи всі методи текстового вводу-виводу та додаючи атрибут buffer для доступу до основного об’єкта. StringIO просто буферизує все в пам’яті, не записуючи нічого на диск.

    (У Python 2.6 io.StringIO реалізовано на чистому Python, тому він досить повільний. Тому наразі вам слід дотримуватися існуючого модуля StringIO або cStringIO. вказуйте на те, що модуль Python 3.0 io буде переписано на C для підвищення швидкості, і, можливо, реалізацію C буде перенесено до випусків 2.x.)

У Python 2.6 базові реалізації не були реструктуризовані для створення поверх класів модуля io. Модуль надається, щоб спростити написання коду, сумісного з версією 3.0, і позбавити розробників від зусиль написання власних реалізацій буферизації та текстового введення-виведення.

Дивись також

PEP 3116 - Новий I/O

PEP, написаний Даніелем Штуцбахом, Майком Вердоне та Гвідо ван Россумом. Код Гвідо ван Россума, Георга Брандла, Уолтера Доервальда, Джеремі Гілтона, Мартіна фон Льовіса, Тоні Лоундса та інших.

PEP 3118: Переглянутий буферний протокол

Буферний протокол — це API рівня C, який дозволяє типам Python обмінюватися покажчиками на свої внутрішні представлення. Файл із відображенням пам’яті можна розглядати, наприклад, як буфер символів, і це дозволяє іншому модулю, такому як re розглядати файли, відображені в пам’яті, як рядок символів для пошуку.

Основними користувачами протоколу буфера є пакети числової обробки, такі як NumPy, які відкривають внутрішнє представлення масивів, щоб абоненти могли записувати дані безпосередньо в масив замість використання повільнішого API. Цей PEP оновлює протокол буфера в світлі досвіду розробки NumPy, додаючи ряд нових функцій, таких як вказівка форми масиву або блокування області пам’яті.

Найважливішою новою функцією C API є PyObject_GetBuffer(PyObject *obj, Py_buffer *view, int flags), яка приймає об’єкт і набір прапорів і заповнює структуру Py_buffer інформацією про представлення пам’яті об’єкта. Об’єкти можуть використовувати цю операцію для блокування пам’яті на місці, поки зовнішній виклик може модифікувати вміст, тому існує відповідний PyBuffer_Release(Py_buffer *view), щоб вказати, що зовнішній виклик завершив роботу.

Аргумент flags для PyObject_GetBuffer() визначає обмеження щодо пам’яті, що повертається. Деякі приклади:

  • PyBUF_WRITABLE вказує, що пам’ять має бути доступною для запису.

  • PyBUF_LOCK запитує блокування пам’яті лише для читання або виключного блокування.

  • PyBUF_C_CONTIGUOUS і PyBUF_F_CONTIGUOUS запитує C-суміжний (останній вимір змінюється найшвидше) або Fortran-суміжний (перший вимір змінюється найшвидше) макет масиву.

Два нові коди аргументів для PyArg_ParseTuple(), s* і z* повертають заблоковані об’єкти буфера для параметра.

Дивись також

PEP 3118 - Перегляд буферного протоколу

PEP, написаний Тревісом Оліфантом і Карлом Бенксом; реалізований Тревісом Оліфантом.

PEP 3119: Абстрактні базові класи

Деякі об’єктно-орієнтовані мови, такі як Java, підтримують інтерфейси, декларуючи, що клас має заданий набір методів або підтримує певний протокол доступу. Абстрактні базові класи (або ABC) є еквівалентною функцією для Python. Підтримка ABC складається з модуля abc, який містить метаклас під назвою ABCMeta, спеціальну обробку цього метакласу вбудованими модулями isinstance() і issubclass(), а також колекцію основні азбуки, які, на думку розробників Python, будуть широко корисними. Майбутні версії Python, ймовірно, додадуть більше азбуки.

Припустімо, у вас є певний клас і ви бажаєте знати, чи підтримує він доступ у стилі словника. Проте фраза «словниковий стиль» розпливчаста. Можливо, це означає, що доступ до елементів за допомогою obj[1] працює. Чи означає це, що встановлення елементів за допомогою obj[2] = value працює? Або що об’єкт матиме методи keys(), values() і items()? А як щодо ітеративних варіантів, таких як iterkeys()? copy() і update()? Ітерація об’єкта за допомогою iter()?

Модуль Python 2.6 collections містить кілька різних азбуки, які представляють ці відмінності. Iterable вказує, що клас визначає __iter__(), а Container означає, що клас визначає метод __contains__() і тому підтримує вирази x в y. Базовий інтерфейс словника для отримання елементів, налаштування елементів і keys(), values() і items() визначається MutableMapping ABC.

Ви можете вивести власні класи з конкретного ABC, щоб вказати, що вони підтримують цей інтерфейс ABC:

import collections

class Storage(collections.MutableMapping):
    ...

Крім того, ви можете написати клас, не виходячи з бажаного ABC, а замість цього зареєструвати клас, викликавши метод register() ABC:

import collections

class Storage:
    ...

collections.MutableMapping.register(Storage)

Для класів, які ви пишете, виведення з ABC, ймовірно, більш зрозуміле. Метод register() корисний, коли ви написали новий ABC, який може описати існуючий тип або клас, або якщо ви хочете оголосити, що якийсь сторонній клас реалізує ABC. Наприклад, якщо ви визначили PrintableType ABC, це законно:

# Register Python's types
PrintableType.register(int)
PrintableType.register(float)
PrintableType.register(str)

Класи повинні підкорятися семантиці, визначеній ABC, але Python не може перевірити це; автор класу повинен зрозуміти вимоги ABC і відповідним чином реалізувати код.

Щоб перевірити, чи підтримує об’єкт певний інтерфейс, тепер можна написати:

def func(d):
    if not isinstance(d, collections.MutableMapping):
        raise ValueError("Mapping object expected, not %r" % d)

Не думайте, що вам потрібно починати виписувати багато чеків, як у наведеному вище прикладі. Python має сильну традицію качиного введення, коли явна перевірка типу ніколи не виконується, а код просто викликає методи об’єкта, вірячи, що ці методи будуть присутні, і створює виняток, якщо їх немає. Будьте розсудливими, перевіряючи наявність азбуки, і робіть це лише там, де це абсолютно необхідно.

Ви можете написати власні азбуки, використовуючи abc.ABCMeta як метаклас у визначенні класу:

from abc import ABCMeta, abstractmethod

class Drawable():
    __metaclass__ = ABCMeta

    @abstractmethod
    def draw(self, x, y, scale=1.0):
        pass

    def draw_doubled(self, x, y):
        self.draw(x, y, scale=2.0)


class Square(Drawable):
    def draw(self, x, y, scale):
        ...

У Drawable ABC вище метод draw_doubled() відтворює об’єкт у удвічі більшому розмірі та може бути реалізований у термінах інших методів, описаних у Drawable. Тому класам, що реалізують цей ABC, не потрібно надавати власну реалізацію draw_doubled(), хоча вони можуть це зробити. Однак реалізація draw() необхідна; ABC не може забезпечити корисну загальну реалізацію.

Ви можете застосувати декоратор @abstractmethod до таких методів, як draw(), які повинні бути реалізовані; Потім Python викличе виняток для класів, які не визначають метод. Зауважте, що виняток виникає лише тоді, коли ви фактично намагаєтеся створити екземпляр підкласу без методу:

>>> class Circle(Drawable):
...     pass
...
>>> c = Circle()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: Can't instantiate abstract class Circle with abstract methods draw
>>>

Атрибути абстрактних даних можна оголосити за допомогою декоратора @abstractproperty:

from abc import abstractproperty
...

@abstractproperty
def readonly(self):
   return self._x

Тоді підкласи повинні визначати властивість readonly().

Дивись також

PEP 3119 - Представляємо абстрактні базові класи

PEP, написаний Гвідо ван Россумом і Таліном. Реалізовано Гвідо ван Россумом. Перенесено до 2.6 Бенджаміном Арангуреном разом з Алексом Мартеллі.

PEP 3127: Підтримка цілочисельного літералу та синтаксис

Python 3.0 змінює синтаксис для вісімкових (за основою 8) цілих літералів, додаючи до них префікс «0o» або «0O» замість початкового нуля, і додає підтримку двійкових (за основою 2) цілих літералів, що позначаються «0b» або префікс «0B».

Python 2.6 не припиняє підтримку початкового 0, що сигналізує про вісімкове число, але додає підтримку «0o» і «0b»:

>>> 0o21, 2*8 + 1
(17, 17)
>>> 0b101111
47

Вбудована функція oct() все ще повертає числа з префіксом нуля на початку, а нова вбудована функція bin() повертає двійкове представлення числа:

>>> oct(42)
'052'
>>> future_builtins.oct(42)
'0o52'
>>> bin(173)
'0b10101101'

Вбудовані модулі int() і long() тепер прийматимуть префікси «0o» і «0b», коли надсилається запит base-8 або base-2 або коли аргумент base дорівнює нулю (сигналізуючи про те, що використовувану базу слід визначати з рядка):

>>> int ('0o52', 0)
42
>>> int('1101', 2)
13
>>> int('0b1101', 2)
13
>>> int('0b1101', 0)
13

Дивись також

PEP 3127 - Підтримка цілочисельного літералу та синтаксис

PEP, написаний Патріком Мопіном; повернуто до 2.6 Еріком Смітом.

PEP 3129: Декоратори класу

Декоратори були розширені з функцій до класів. Тепер можна писати:

@foo
@bar
class A:
  pass

Це еквівалентно:

class A:
  pass

A = foo(bar(A))

Дивись також

PEP 3129 - Декоратори класу

PEP, автор Колін Вінтер.

PEP 3141: Ієрархія типів чисел

Python 3.0 додає кілька абстрактних базових класів для числових типів, натхненних числовою вежею Scheme. Ці класи було перенесено до версії 2.6 як модуль numbers.

Найбільш загальна ABC – це Number. Він не визначає жодних операцій і існує лише для того, щоб дозволити перевірити, чи є об’єкт числом, виконавши isinstance(obj, Number).

Complex є підкласом Number. З комплексними числами можна виконувати основні операції додавання, віднімання, множення, ділення та піднесення до степеня, і ви можете отримати дійсну та уявну частини та отримати сполучене число. Вбудований комплексний тип Python є реалізацією Complex.

Real далі походить від Complex і додає операції, які працюють лише з дійсними числами: floor(), trunc(), округлення, отримання залишку за модулем N, поверхове ділення , і порівняння.

Rational числа походять від Real, мають властивості numerator і denominator і можуть бути перетворені на числа з плаваючою точкою. Python 2.6 додає простий клас раціональних чисел, Fraction, у модуль fractions. (Це називається Fraction замість Rational, щоб уникнути зіткнення назв із numbers.Rational.)

Integral числа походять від Rational і можуть бути зсунуті ліворуч і праворуч за допомогою << and >>, поєднані за допомогою побітових операцій, таких як & і |, і можна використовувати як індекси масиву та межі зрізів.

У Python 3.0 PEP дещо перевизначає існуючі вбудовані функції round(), math.floor(), math.ceil() і додає нову, math.trunc() , який було перенесено на Python 2.6. math.trunc() округляє до нуля, повертаючи найближчий Integral, який знаходиться між аргументом функції та нулем.

Дивись також

PEP 3141 - Ієрархія типів для чисел

PEP, написаний Джеффрі Яскіним.

Числова вежа схеми, з посібника Guile.

Scheme’s number datatypes from the R5RS Scheme specification.

Модуль fractions

Щоб заповнити ієрархію числових типів, модуль fractions надає клас раціональних чисел. Раціональні числа зберігають свої значення як чисельник і знаменник, утворюючи дріб, і можуть точно представляти числа, такі як 2/3, які числа з плаваючою комою можуть лише приблизно оцінити.

Конструктор Fraction приймає два значення Integral, які будуть чисельником і знаменником отриманого дробу.

>>> from fractions import Fraction
>>> a = Fraction(2, 3)
>>> b = Fraction(2, 5)
>>> float(a), float(b)
(0.66666666666666663, 0.40000000000000002)
>>> a+b
Fraction(16, 15)
>>> a/b
Fraction(5, 3)

Для перетворення чисел з плаваючою комою на раціональні числа тип float тепер має метод as_integer_ratio(), який повертає чисельник і знаменник для дробу, який має однакове значення з плаваючою комою:

>>> (2.5) .as_integer_ratio()
(5, 2)
>>> (3.1415) .as_integer_ratio()
(7074029114692207L, 2251799813685248L)
>>> (1./3) .as_integer_ratio()
(6004799503160661L, 18014398509481984L)

Зауважте, що значення, які можна апроксимувати лише числами з плаваючою комою, наприклад 1./3, не спрощуються до числа, яке апроксимується; дріб намагається точно збігатися зі значенням з плаваючою комою.

Модуль fractions базується на реалізації Sjoerd Mullender, яка довгий час була в каталозі Demo/classes/ Python. Ця реалізація була значно оновлена Джеффрі Яскіним.

Інші зміни мови

Деякі менші зміни, внесені до основної мови Python:

  • Каталоги та zip-архіви, що містять файл __main__.py, тепер можна виконувати безпосередньо, передавши їх імена інтерпретатору. Каталог або zip-архів автоматично вставляється як перший запис у sys.path. (Пропозиція та початковий патч Енді Чу, згодом переглянуті Філіпом Дж. Ебі та Ніком Когланом; bpo-1739468.)

  • Функція hasattr() виловлювала та ігнорувала всі помилки, припускаючи, що вони означають, що метод __getattr__() якимось чином не працює, і значення, яке повертає hasattr(), буде False. Однак цю логіку не слід застосовувати до KeyboardInterrupt і SystemExit; Python 2.6 більше не відкидає такі винятки, коли hasattr() зустрічає їх. (Виправлено Бенджаміном Петерсоном; bpo-2196.)

  • Під час виклику функції за допомогою синтаксису ** для надання ключових аргументів вам більше не потрібно використовувати словник Python; будь-яке відображення тепер працюватиме:

    >>> def f(**kw):
    ...    print sorted(kw)
    ...
    >>> ud=UserDict.UserDict()
    >>> ud['a'] = 1
    >>> ud['b'] = 'string'
    >>> f(**ud)
    ['a', 'b']
    

    (Надав Олександр Бєлопольський; bpo-1686487.)

    Також стало законним надавати аргументи ключового слова після аргументу *args для виклику функції.

    >>> def f(*args, **kw):
    ...     print args, kw
    ...
    >>> f(1,2,3, *(4,5,6), keyword=13)
    (1, 2, 3, 4, 5, 6) {'keyword': 13}
    

    Раніше це була синтаксична помилка. (Надав Аморі Форже д’Арк; bpo-3473.)

  • Нова вбудована функція next(iterator, [default]) повертає наступний елемент із зазначеного ітератора. Якщо вказано аргумент default, він буде повернений, якщо iterator вичерпано; інакше буде викликано виняток StopIteration. (Бекпортовано в bpo-2719.)

  • Кортежі тепер мають методи index() і count(), що відповідають методам index() і count() типу списку:

    >>> t = (0,1,2,3,4,0,1,2)
    >>> t.index(3)
    3
    >>> t.count(0)
    2
    

    (Надав Реймонд Геттінгер)

  • Вбудовані типи тепер мають покращену підтримку розширеного синтаксису нарізки, приймаючи різні комбінації (початок, зупинка, крок). Раніше підтримка була частковою, і певні кутові випадки не працювали. (Реалізовано Томасом Воутерсом.)

  • Властивості тепер мають три атрибути, getter, setter і deleter, які є декораторами, що надають корисні ярлики для додавання функції отримання, налаштування або видалення до існуючої властивості. Ви б використали їх так:

    class C(object):
        @property
        def x(self):
            return self._x
    
        @x.setter
        def x(self, value):
            self._x = value
    
        @x.deleter
        def x(self):
            del self._x
    
    class D(C):
        @C.x.getter
        def x(self):
            return self._x * 2
    
        @x.setter
        def x(self, value):
            self._x = value / 2
    
  • Кілька методів вбудованих типів наборів тепер приймають кілька ітерацій: intersection(), intersection_update(), union(), update(), difference() і difference_update().

    >>> s=set('1234567890')
    >>> s.intersection('abc123', 'cdf246')  # Intersection between all inputs
    set(['2'])
    >>> s.difference('246', '789')
    set(['1', '0', '3', '5'])
    

    (Надав Реймонд Геттінгер.)

  • Було додано багато функцій з плаваючою комою. Функція float() тепер перетворить рядок nan на значення IEEE 754 Not A Number, а +inf і -inf на позитивну або негативну нескінченність. Це працює на будь-якій платформі із семантикою IEEE 754. (Надав Крістіан Хаймес; bpo-1635.)

    Інші функції в модулі math, isinf() і isnan(), повертають істину, якщо їхній аргумент із плаваючою комою є нескінченним або не є числом. (bpo-1640)

    Було додано функції перетворення для перетворення чисел з плаваючою комою в шістнадцяткові рядки (bpo-3008). Ці функції перетворюють числа з плаваючою точкою в рядкове представлення та з нього, не вводячи помилок округлення через перетворення між десятковим і двійковим. Поплавки мають метод hex(), який повертає представлення рядка, а метод float.fromhex() перетворює рядок назад у число:

    >>> a = 3.75
    >>> a.hex()
    '0x1.e000000000000p+1'
    >>> float.fromhex('0x1.e000000000000p+1')
    3.75
    >>> b=1./3
    >>> b.hex()
    '0x1.5555555555555p-2'
    
  • Числова тонкість: під час створення комплексного числа з двох чисел з плаваючою точкою в системах, які підтримують нулі зі знаком (-0 і +0), конструктор complex() тепер збереже знак нуля. (Виправлено Марком Т. Дікінсоном; bpo-1507.)

  • Класи, які успадковують метод __hash__() від батьківського класу, можуть встановити __hash__ = None, щоб вказати, що клас не можна хешувати. Це змусить hash(obj) викликати TypeError і клас не буде вказано як реалізований Hashable ABC.

    Ви повинні зробити це, коли ви визначили метод __cmp__() або __eq__(), який порівнює об’єкти за їх значенням, а не за ідентичністю. Усі об’єкти мають хеш-метод за замовчуванням, який використовує id(obj) як хеш-значення. Немає простого способу видалити метод __hash__(), успадкований від батьківського класу, тому призначення None було реалізовано як перевизначення. На рівні C розширення можуть встановити tp_hash на PyObject_HashNotImplemented(). (Виправлено Ніком Когланом і Аморі Форже д’Арк; bpo-2235.)

  • Виняток GeneratorExit тепер є підкласами BaseException замість Exception. Це означає, що обробник винятків, який виконує except Exception:, не буде випадково перехоплювати GeneratorExit. (Надав Чед Остін; bpo-1537.)

  • Об’єкти генератора тепер мають атрибут gi_code, який посилається на оригінальний об’єкт коду, що підтримує генератор. (Надав Колін Вінтер; bpo-1473257.)

  • Вбудована функція compile() тепер приймає аргументи ключових слів, а також позиційні параметри. (Надав Томас Воутерс; bpo-1444529.)

  • Конструктор complex() тепер приймає рядки, що містять комплексні числа в круглих дужках, що означає, що complex(repr(cplx)) тепер передаватиме значення. Наприклад, complex('(3+4j)') тепер повертає значення (3+4j). (bpo-1491866)

  • Метод string translate() тепер приймає None як параметр таблиці перекладу, який розглядається як трансформація ідентичності. Це полегшує виконання операцій, які видаляють лише символи. (Надано Бенгтом Ріхтером і реалізовано Раймондом Геттінгером; bpo-1193128.)

  • Вбудована функція dir() тепер перевіряє наявність методу __dir__() для об’єктів, які вона отримує. Цей метод має повертати список рядків, що містять назви дійсних атрибутів для об’єкта, і дозволяє об’єкту контролювати значення, яке створює dir(). Об’єкти, які мають методи __getattr__() або __getattribute__(), можуть використовувати це для реклами псевдоатрибутів, які вони вважатимуть. (bpo-1591665)

  • Об’єкти методу екземпляра мають нові атрибути для об’єкта та функції, що включає метод; новий синонім im_self__self__, а im_func також доступний як __func__. Старі назви все ще підтримуються в Python 2.6, але зникли в 3.0.

  • Незрозуміла зміна: коли ви використовуєте функцію locals() всередині оператора class, отриманий словник більше не повертає вільні змінні. (У цьому випадку вільні змінні — це змінні, на які посилається оператор class, які не є атрибутами класу.)

Оптимізації

  • Модуль warnings було переписано мовою C. Це дає змогу викликати попередження від аналізатора, а також може пришвидшити запуск інтерпретатора. (Надано Нілом Норвітцем і Бреттом Кенноном; bpo-1631171.)

  • Об’єкти типу тепер мають кеш методів, що може зменшити роботу, необхідну для пошуку правильної реалізації методу для певного класу; після кешування інтерпретатору не потрібно проходити базові класи, щоб визначити правильний метод для виклику. Кеш очищається, якщо базовий клас або сам клас змінено, тому кеш має залишатися правильним навіть з огляду на динамічну природу Python. (Оригінальна оптимізація реалізована Арміном Ріго, оновлена для Python 2.6 Кевіном Джейкобсом; bpo-1700288.)

    За замовчуванням ця зміна застосовується лише до типів, які входять до складу ядра Python. Модулі розширення можуть не обов’язково бути сумісними з цим кешем, тому вони повинні явно додати Py_TPFLAGS_HAVE_VERSION_TAG до поля tp_flags модуля, щоб увімкнути кеш методів. (Щоб бути сумісним із кешем методів, код модуля розширення не повинен напряму отримувати доступ до члена tp_dict будь-якого з типів, які він реалізує, і змінювати його. Більшість модулів цього не роблять, але інтерпретатор Python не може визначте це. Перегляньте bpo-1878 для деякого обговорення.)

  • Виклики функцій, які використовують ключові аргументи, значно пришвидшуються завдяки швидкому порівнянню вказівників, що зазвичай економить час на повне порівняння рядків. (Надано Реймондом Геттінгером, після початкової реалізації Антуаном Пітру; bpo-1819.)

  • Усі функції в модулі struct були переписані мовою C завдяки роботі над спринтом Need For Speed. (Надав Реймонд Геттінгер.)

  • Деякі зі стандартних вбудованих типів тепер встановлюють біт у своїх об’єктах типу. Це прискорює перевірку того, чи є об’єкт підкласом одного з цих типів. (Надав Ніл Норвіц.)

  • Рядки Unicode тепер використовують швидший код для виявлення пробілів і розривів рядків; це прискорює метод split() приблизно на 25% і splitlines() на 35%. (Надано Антуаном Пітру.) Використання пам’яті зменшується завдяки використанню pymalloc для даних рядка Unicode.

  • Оператор with тепер зберігає метод __exit__() у стеку, створюючи невелике прискорення. (Реалізовано Джеффрі Яскіним.)

  • Щоб зменшити використання пам’яті, збирач сміття тепер очищатиме внутрішні вільні списки під час збирання сміття найвищого покоління об’єктів. Це може швидше повернути пам’ять операційній системі.

Зміни перекладача

Два параметри командного рядка були зарезервовані для використання іншими реалізаціями Python. Перемикач -J було зарезервовано для використання Jython для параметрів Jython, таких як перемикачі, які передаються базовій JVM. -X було зарезервовано для параметрів, специфічних для конкретної реалізації Python, наприклад CPython, Jython або IronPython. Якщо будь-яка з опцій використовується з Python 2.6, інтерпретатор повідомить, що ця опція наразі не використовується.

Тепер Python можна заборонити записувати файли .pyc або .pyo, вказавши перемикач -B інтерпретатору Python або налаштувавши середовище PYTHONDONTWRITEBYTECODE перед запуском інтерпретатора. Цей параметр доступний для програм Python як змінна sys.dont_write_bytecode, і код Python може змінити значення, щоб змінити поведінку інтерпретатора. (Надано Нілом Норвітцем і Георгом Брандлом.)

Кодування, що використовується для стандартного введення, виведення та стандартної помилки, можна вказати, встановивши змінну середовища PYTHONIOENCODING перед запуском інтерпретатора. Значення має бути рядком у формі <encoding> або <encoding> : <errorhandler>. Частина encoding визначає назву кодування, напр. utf-8 або latin-1; необов’язкова частина errorhandler визначає, що робити з символами, які не можуть бути оброблені кодуванням, і має бути одним із «помилка», «ігнорувати» або «замінити». (Надав Мартін фон Льовіс.)

Нові та вдосконалені модулі

Як і в кожному випуску, стандартна бібліотека Python отримала низку вдосконалень і виправлень помилок. Ось неповний список найбільш помітних змін, відсортованих за алфавітом назв модулів. Зверніться до файлу Misc/NEWS у дереві вихідних кодів, щоб отримати більш повний список змін, або перегляньте журнали Subversion, щоб отримати всі деталі.

  • Модулі asyncore і asynchat знову активно обслуговуються, і було застосовано ряд патчів і виправлень помилок. (Підтримується Josiah Carlson; див. bpo-1736190 для одного патча.)

  • Модуль bsddb також має новий супроводжувач, Jesús Cea Avión, і пакет тепер доступний як окремий пакет. Веб-сторінка пакета – www.jcea.es/programacion/pybsddb.htm. Планується видалити пакет зі стандартної бібліотеки Python 3.0, оскільки його випуски виходять набагато частіше, ніж у Python.

    Модуль bsddb.dbshelve тепер використовує найвищий доступний протокол травлення, замість того, щоб обмежуватися протоколом 1. (Надано W. Barnes.)

  • Модуль cgi тепер читатиме змінні з рядка запиту запиту HTTP POST. Це дає змогу використовувати дії форми з URL-адресами, які містять рядки запиту, такі як «/cgi-bin/add.py?category=1». (Надано Александром Фіорі та Nubis; bpo-1817.)

    Функції parse_qs() і parse_qsl() було переміщено з модуля cgi до модуля urlparse. Версії, які все ще доступні в модулі cgi, запускатимуть повідомлення PendingDeprecationWarning у 2.6 (bpo-600362).

  • Модуль cmath зазнав значної редакції, внесеної Марком Дікінсоном і Крістіаном Хеймсом. Додано п’ять нових функцій:

    • polar() перетворює комплексне число на полярну форму, повертаючи модуль і аргумент комплексного числа.

    • rect() робить навпаки, перетворюючи модуль, пару аргументів назад у відповідне комплексне число.

    • phase() повертає аргумент (також званий кутом) комплексного числа.

    • isnan() повертає True, якщо дійсна чи уявна частина його аргументу є NaN.

    • isinf() повертає True, якщо дійсна чи уявна частина аргументу нескінченна.

    Ревізії також покращили чисельну надійність модуля cmath. Для всіх функцій дійсна та уявна частини результатів мають точність у межах кількох одиниць найменшої точності (ulps), коли це можливо. Докладніше див. bpo-1381. Також було виправлено скорочення гілок для asinh(), atanh(): і atan().

    Значно розширено тести для модуля; Майже 2000 нових тестів використовують алгебраїчні функції.

    На платформах IEEE 754 модуль cmath тепер обробляє спеціальні значення IEEE 754 і винятки з плаваючою комою відповідно до додатку „G“ стандарту C99.

  • Новий тип даних у модулі collections: namedtuple(typename, fieldnames) — це фабрична функція, яка створює підкласи стандартного кортежу, поля якого доступні як за іменем, так і за індексом. Наприклад:

    >>> var_type = collections.namedtuple('variable',
    ...             'id name type size')
    >>> # Names are separated by spaces or commas.
    >>> # 'id, name, type, size' would also work.
    >>> var_type._fields
    ('id', 'name', 'type', 'size')
    
    >>> var = var_type(1, 'frequency', 'int', 4)
    >>> print var[0], var.id    # Equivalent
    1 1
    >>> print var[2], var.type  # Equivalent
    int int
    >>> var._asdict()
    {'size': 4, 'type': 'int', 'id': 1, 'name': 'frequency'}
    >>> v2 = var._replace(name='amplitude')
    >>> v2
    variable(id=1, name='amplitude', type='int', size=4)
    

    Кілька місць у стандартній бібліотеці, які повертали кортежі, було змінено, щоб повертати екземпляри namedtuple. Наприклад, метод Decimal.as_tuple() тепер повертає іменований кортеж із полями sign, digits і exponent.

    (Надав Реймонд Геттінгер.)

  • Ще одна зміна в модулі collections полягає в тому, що тип deque тепер підтримує додатковий параметр maxlen; якщо надано, розмір дек буде обмежено не більше ніж maxlen елементів. Додавання більшої кількості предметів до повного ряду спричиняє відкидання старих предметів.

    >>> from collections import deque
    >>> dq=deque(maxlen=3)
    >>> dq
    deque([], maxlen=3)
    >>> dq.append(1); dq.append(2); dq.append(3)
    >>> dq
    deque([1, 2, 3], maxlen=3)
    >>> dq.append(4)
    >>> dq
    deque([2, 3, 4], maxlen=3)
    

    (Надав Реймонд Геттінгер.)

  • Об’єкти Morsel модуля Cookie тепер підтримують атрибут httponly. У деяких браузерах. до файлів cookie з цим набором атрибутів неможливо отримати доступ або маніпулювати кодом JavaScript. (Надав Арвін Шнелл; bpo-1638033.)

  • Новий метод вікна в модулі curses, chgat(), змінює атрибути відображення для певної кількості символів в одному рядку. (Надав Фабіан Кройц.)

    # Boldface text starting at y=0,x=21
    # and affecting the rest of the line.
    stdscr.chgat(0, 21, curses.A_BOLD)
    

    Клас Textbox у модулі curses.textpad тепер підтримує редагування в режимі вставки, а також режимі перезапису. Режим вставки вмикається шляхом надання дійсного значення для параметра insert_mode під час створення екземпляра Textbox.

  • Методи strftime() модуля datetime тепер підтримують код формату %f, який розширюється до кількості мікросекунд в об’єкті, з доповненням нуля зліва до шести позицій. (Надав Скіп Монтанаро; bpo-1158.)

  • The decimal module was updated to version 1.66 of the General Decimal Specification. New features include some methods for some basic mathematical functions such as exp() and log10():

    >>> Decimal(1).exp()
    Decimal("2.718281828459045235360287471")
    >>> Decimal("2.7182818").ln()
    Decimal("0.9999999895305022877376682436")
    >>> Decimal(1000).log10()
    Decimal("3")
    

    Метод as_tuple() об’єктів Decimal тепер повертає іменований кортеж із полями sign, digits і exponent.

    (Реалізовано Факундо Батістою та Марком Дікінсоном. Підтримку іменованих кортежів додав Реймонд Геттінгер.)

  • Клас SequenceMatcher модуля difflib тепер повертає іменовані кортежі, що представляють збіги, з атрибутами a, b і size. (Надав Реймонд Геттінгер.)

  • До конструктора класу ftplib.FTP, а також методу connect() було додано необов’язковий параметр timeout, який визначає час очікування в секундах. (Додано Факундо Батіста.) Крім того, storbinary() і storlines() класу FTP тепер приймають необов’язковий параметр callback, який буде викликатися з кожним блоком даних після даних був відправлений. (Надав Філ Шварц; bpo-1221598.)

  • Вбудована функція reduce() також доступна в модулі functools. У Python 3.0 вбудований компонент було видалено, і reduce() доступний лише з functools; наразі немає планів відмовлятися від вбудованої версії 2.x. (Виправлено Крістіаном Хеймсом; bpo-1739906.)

  • Коли це можливо, модуль getpass тепер використовуватиме /dev/tty для друку підказки та читання пароля, повертаючись до стандартної помилки та стандартного введення. Якщо пароль може відтворюватися на терміналі, перед відображенням підказки друкується попередження. (Надав Грегорі П. Сміт.)

  • Функція glob.glob() тепер може повертати назви файлів у кодуванні Unicode, якщо було використано шлях у кодуванні Unicode і назви файлів у кодуванні Unicode збігаються в каталозі. (bpo-1001604)

  • Нова функція в модулі heapq, merge(iter1, iter2, ...), приймає будь-яку кількість ітерацій, які повертають дані в порядку сортування, і повертає новий генератор, який повертає вміст усіх ітератори, також у відсортованому порядку. Наприклад:

    >>> list(heapq.merge([1, 3, 5, 9], [2, 8, 16]))
    [1, 2, 3, 5, 8, 9, 16]
    

    Інша нова функція, heappushpop(heap, item), надсилає item на heap, потім виривається та повертає найменший елемент. Це ефективніше, ніж виклик heappush(), а потім heappop().

    heapq тепер реалізовано для використання лише порівняння менше ніж, замість порівняння менше або рівно, яке використовувалося раніше. Завдяки цьому використання типу heapq відповідає методу list.sort(). (Надав Реймонд Геттінгер.)

  • До конструкторів класів httplib.HTTPConnection і HTTPSConnection було додано необов’язковий параметр timeout, який визначає час очікування в секундах. (Додав Факундо Батіста.)

  • Більшість функцій модуля inspect, наприклад getmoduleinfo() і getargs(), тепер повертають іменовані кортежі. Окрім того, що вони ведуть себе як кортежі, до елементів значення, що повертається, також можна отримати доступ як до атрибутів. (Надав Реймонд Геттінгер.)

    Деякі нові функції в модулі включають isgenerator(), isgeneratorfunction() і isabstract().

  • Модуль itertools отримав кілька нових функцій.

    izip_longest(iter1, iter2, ...[, fillvalue]) створює кортежі з кожного з елементів; якщо деякі з ітерацій коротші за інші, відсутні значення встановлюються як fillvalue. Наприклад:

    >>> tuple(itertools.izip_longest([1,2,3], [1,2,3,4,5]))
    ((1, 1), (2, 2), (3, 3), (None, 4), (None, 5))
    

    product(iter1, iter2, ..., [repeat=N]) повертає декартовий добуток наданих ітераторів, набір кортежів, що містить усі можливі комбінації елементів, що повертаються з кожного ітератора.

    >>> list(itertools.product([1,2,3], [4,5,6]))
    [(1, 4), (1, 5), (1, 6),
     (2, 4), (2, 5), (2, 6),
     (3, 4), (3, 5), (3, 6)]
    

    Необов’язковий аргумент ключового слова repeat використовується для взяття продукту iterable або набору iterables із собою, повторюваних N разів. З одним ітерованим аргументом повертаються N-кортежі:

    >>> list(itertools.product([1,2], repeat=3))
    [(1, 1, 1), (1, 1, 2), (1, 2, 1), (1, 2, 2),
     (2, 1, 1), (2, 1, 2), (2, 2, 1), (2, 2, 2)]
    

    З двома ітераціями повертаються 2N-кортежі.

    >>> list(itertools.product([1,2], [3,4], repeat=2))
    [(1, 3, 1, 3), (1, 3, 1, 4), (1, 3, 2, 3), (1, 3, 2, 4),
     (1, 4, 1, 3), (1, 4, 1, 4), (1, 4, 2, 3), (1, 4, 2, 4),
     (2, 3, 1, 3), (2, 3, 1, 4), (2, 3, 2, 3), (2, 3, 2, 4),
     (2, 4, 1, 3), (2, 4, 1, 4), (2, 4, 2, 3), (2, 4, 2, 4)]
    

    combinations(iterable, r) повертає підпослідовності довжиною r з елементів iterable.

    >>> list(itertools.combinations('123', 2))
    [('1', '2'), ('1', '3'), ('2', '3')]
    >>> list(itertools.combinations('123', 3))
    [('1', '2', '3')]
    >>> list(itertools.combinations('1234', 3))
    [('1', '2', '3'), ('1', '2', '4'),
     ('1', '3', '4'), ('2', '3', '4')]
    

    permutations(iter[, r]) повертає всі перестановки довжиною r елементів iterable. Якщо r не вказано, за замовчуванням використовуватиметься кількість елементів, створених iterable.

    >>> list(itertools.permutations([1,2,3,4], 2))
    [(1, 2), (1, 3), (1, 4),
     (2, 1), (2, 3), (2, 4),
     (3, 1), (3, 2), (3, 4),
     (4, 1), (4, 2), (4, 3)]
    

    itertools.chain(*iterables) — це існуюча функція в itertools, яка отримала новий конструктор у Python 2.6. itertools.chain.from_iterable(iterable) приймає один ітератор, який має повертати інші ітератори. chain() потім поверне всі елементи першого ітератора, потім усі елементи другого і так далі.

    >>> list(itertools.chain.from_iterable([[1,2,3], [4,5,6]]))
    [1, 2, 3, 4, 5, 6]
    

    (Усі внесено Реймондом Геттінгером.)

  • Клас FileHandler модуля logging і його підкласи WatchedFileHandler, RotatingFileHandler і TimedRotatingFileHandler тепер мають додатковий параметр delay для своїх конструкторів . Якщо delay має значення true, відкриття файлу журналу відкладено до першого виклику emit(). (Надав Віней Саджип.)

    TimedRotatingFileHandler також має параметр конструктора utc. Якщо аргумент істинний, час UTC використовуватиметься для визначення часу настання опівночі та для створення назв файлів; інакше використовуватиметься місцевий час.

  • До модуля math додано кілька нових функцій:

    • isinf() і isnan() визначають, чи є даний float нескінченністю (позитивною чи від’ємною) чи NaN (не числом) відповідно.

    • copysign() копіює знаковий біт числа IEEE 754, повертаючи абсолютне значення x у поєднанні зі знаковим бітом y. Наприклад, math.copysign(1, -0.0) повертає -1.0. (Надано Крістіаном Хеймсом.)

    • factorial() обчислює факториал числа. (Надав Реймонд Геттінгер; bpo-2138.)

    • fsum() додає потік чисел із ітерованого об’єкта та обережно, щоб уникнути втрати точності через використання часткових сум. (Надано Жаном Брауерсом, Реймондом Геттінгером і Марком Дікінсоном; bpo-2819.)

    • acosh(), asinh() і atanh() обчислюють обернені гіперболічні функції.

    • log1p() повертає натуральний логарифм 1+x (за основою e).

    • trunc() округлює число до нуля, повертаючи найближчий Integral, який знаходиться між аргументом функції та нулем. Додано як частину бекпорту ієрархії типів PEP 3141 для номерів.

  • Модуль math було покращено, щоб забезпечити більш узгоджену поведінку на різних платформах, особливо щодо обробки винятків із плаваючою комою та спеціальних значень IEEE 754.

    За можливості модуль дотримується рекомендацій стандарту C99 щодо спеціальних значень 754. Наприклад, sqrt(-1.) тепер має видавати ValueError майже на всіх платформах, тоді як sqrt(float('NaN')) має повертати NaN на всіх IEEE 754 платформи. Там, де Додаток «F» стандарту C99 рекомендує сигналізувати «ділить на нуль» або «недійсний», Python викличе ValueError. Там, де додаток «F» стандарту C99 рекомендує сигналізувати «переповнення», Python викличе OverflowError. (Див. bpo-711019 і bpo-1640.)

    (Надано Крістіаном Хеймсом і Марком Дікінсоном.)

  • Об’єкти mmap тепер мають метод rfind(), який шукає підрядок, що починається в кінці рядка, і виконує пошук у зворотному напрямку. Метод find() також отримав параметр end, що вказує індекс, на якому потрібно припинити пошук. (Надав Джон Лентон.)

  • Модуль operator отримав функцію methodcaller(), яка приймає ім’я та необов’язковий набір аргументів, повертаючи виклик, який викликає названу функцію за будь-якими переданими їй аргументами. Наприклад:

    >>> # Equivalent to lambda s: s.replace('old', 'new')
    >>> replacer = operator.methodcaller('replace', 'old', 'new')
    >>> replacer('old wine in old bottles')
    'new wine in new bottles'
    

    (Надав Георг Брандл за пропозицією Григорія Петросяна.)

    Функція attrgetter() тепер приймає імена з крапками та виконує відповідні пошуки атрибутів:

    >>> inst_name = operator.attrgetter(
    ...        '__class__.__name__')
    >>> inst_name('')
    'str'
    >>> inst_name(help)
    '_Helper'
    

    (Надано Георгом Брандлом за пропозицією Баррі Варшави.)

  • Модуль os тепер обертає кілька нових системних викликів. fchmod(fd, mode) і fchown(fd, uid, gid) змінюють режим і право власності на відкритий файл, а lchmod(path, mode) змінює режим символічного посилання . (Надано Георгом Брандлом і Крістіаном Хаймсом.)

    chflags() і lchflags() є обгортками для відповідних системних викликів (де вони доступні), змінюючи прапорці, встановлені для файлу. Константи для значень прапорців визначені в модулі stat; деякі можливі значення включають UF_IMMUTABLE, щоб повідомити, що файл не може бути змінено, і UF_APPEND, щоб вказати, що дані можуть бути лише додані до файлу. (Надав М. Левінсон.)

    os.closerange(low, high) ефективно закриває всі файлові дескриптори від low до high, ігноруючи будь-які помилки та не включаючи сам high. Ця функція тепер використовується модулем subprocess для пришвидшення запуску процесів. (Надав Георг Брандл; bpo-1663329.)

  • Метод clear() об’єкта os.environ тепер скасовуватиме змінні середовища за допомогою os.unsetenv() на додаток до очищення ключів об’єкта. (Надав Martin Horcicka; bpo-1181.)

  • Функція os.walk() тепер має параметр followlinks. Якщо встановлено значення True, він переходитиме за символічними посиланнями на каталоги та відвідуватиме вміст каталогу. Для зворотної сумісності значення параметра за замовчуванням — false. Зверніть увагу, що функція може впасти в нескінченну рекурсію, якщо є символічне посилання, яке вказує на батьківський каталог. (bpo-1273829)

  • У модулі os.path функцію splitext() було змінено так, що вона не розділяється на початкові символи крапок. Це дає кращі результати під час роботи з dot-файлами Unix. Наприклад, os.path.splitext('.ipython') тепер повертає ('.ipython', '') замість ('', '.ipython'). (bpo-1115886)

    Нова функція, os.path.relpath(path, start='.'), повертає відносний шлях від шляху start, якщо він надається, або від поточного робочого каталогу до пункту призначення шлях. (Надав Річард Барран; bpo-1339796.)

    У Windows os.path.expandvars() тепер розширюватиме змінні середовища, подані у формі «%var%», а «~user» буде розгорнуто до шляху до домашнього каталогу користувача. (Надав Джосія Карлсон; bpo-957650.)

  • Налагоджувач Python, наданий модулем pdb, отримав нову команду: «запустити» перезапускає програму Python, яка налагоджується, і може додатково приймати нові аргументи командного рядка для програми. (Надав Роккі Бернштейн; bpo-1393667.)

  • Функція pdb.post_mortem(), яка використовується для початку налагодження зворотного відстеження, тепер використовуватиме відстеження, яке повертає sys.exc_info(), якщо відстеження не надано. (Надав Факундо Батіста; bpo-1106316.)

  • Модуль pickletools тепер має функцію optimize(), яка приймає рядок, що містить pickle, і видаляє деякі невикористані коди операцій, повертаючи коротший pickle, який містить ту саму структуру даних. (Надав Реймонд Геттінгер.)

  • До модуля pkgutil додано функцію get_data(), яка повертає вміст файлів ресурсів, що входять до встановленого пакета Python. Наприклад:

    >>> import pkgutil
    >>> print pkgutil.get_data('test', 'exception_hierarchy.txt')
    BaseException
     +-- SystemExit
     +-- KeyboardInterrupt
     +-- GeneratorExit
     +-- Exception
          +-- StopIteration
          +-- StandardError
     ...
    

    (Надав Пол Мур; bpo-2439.)

  • Об’єкти Parser модуля pyexpat тепер дозволяють установлювати атрибут buffer_size, щоб змінити розмір буфера, який використовується для зберігання символьних даних. (Надав Ахім Гаедке; bpo-1137.)

  • Модуль Queue тепер надає варіанти черги, які отримують записи в різному порядку. Клас PriorityQueue зберігає елементи в черзі в купі та отримує їх у порядку пріоритету, а LifoQueue спочатку отримує останні додані записи, тобто він поводиться як стек. (Надав Реймонд Геттінгер.)

  • Об’єкти Random модуля random тепер можна вибирати в 32-бітній системі та скасовувати в 64-бітній системі, і навпаки. На жаль, ця зміна також означає, що об’єкти Random Python 2.6 не можна правильно вилучити в попередніх версіях Python. (Надав Шон Лігокі; bpo-1727780.)

    Нова функція triangular(low, high, mode) повертає випадкові числа за трикутним розподілом. Повернуті значення знаходяться в діапазоні від low до high, не враховуючи самого high, і з mode як значенням, що найчастіше зустрічається в розподілі. (Надано Володимиром ван дер Ланом і Раймондом Геттінгером; bpo-1681432.)

  • Довгі пошуки регулярних виразів, які виконує модуль re, перевірятимуть сигнали, які доставляються, тому трудомісткі пошуки тепер можна перервати. (Надано Джошем Хойтом і Ральфом Шміттом; bpo-846388.)

    Модуль регулярного виразу реалізовано шляхом компіляції байт-кодів для крихітної віртуальної машини, специфічної для регулярного виразу. Ненадійний код може безпосередньо створювати шкідливі рядки байт-коду та спричиняти збої, тому Python 2.6 включає верифікатор для байт-коду регулярного виразу. (Надано Гвідо ван Россумом із роботи в Google App Engine; bpo-3487.)

  • Метод Completer.complete() модуля rlcompleter тепер ігноруватиме винятки, викликані під час оцінювання імені. (Виправлено Lorenz Quack; bpo-2250.)

  • Екземпляри scheduler модуля sched тепер мають атрибут queue лише для читання, який повертає вміст черги планувальника, представлений у вигляді списку іменованих кортежів із полями ( час, пріоритет, дія, аргумент). (Надав Раймонд Геттінгер; bpo-1861.)

  • Модуль select тепер має функції оболонки для системних викликів Linux epoll() і BSD kqueue(). Метод modify() додано до існуючих об’єктів poll; pollobj.modify(fd, eventmask) приймає дескриптор файлу або файловий об’єкт і маску події, змінюючи записану маску події для цього файлу. (Надав Крістіан Хаймес; bpo-1657.)

  • Функція shutil.copytree() тепер має додатковий аргумент ignore, який приймає об’єкт, що викликається. Цей виклик отримає кожен шлях до каталогу та список вмісту каталогу, а також поверне список імен, які будуть проігноровані, не скопійовані.

    Модуль shutil також надає функцію ignore_patterns() для використання з цим новим параметром. ignore_patterns() приймає довільну кількість шаблонів у стилі glob і повертає виклик, який ігноруватиме будь-які файли та каталоги, що відповідають будь-якому з цих шаблонів. У наступному прикладі копіюється дерево каталогів, але пропускаються каталоги .svn і резервні файли Emacs, імена яких закінчуються на „~“:

    shutil.copytree('Doc/library', '/tmp/library',
                    ignore=shutil.ignore_patterns('*~', '.svn'))
    

    (Надав Тарек Зіаде; bpo-2663.)

  • Інтеграція обробки сигналів із циклами обробки подій GUI, подібними до тих, що використовуються Tkinter або GTk+, давно була проблемою; більшість програм закінчується опитуванням, прокидаючись кожну частку секунди, щоб перевірити, чи відбулися якісь події GUI. Модуль signal тепер може зробити це ефективнішим. Виклик signal.set_wakeup_fd(fd) встановлює дескриптор файлу для використання; коли сигнал отримано, байт записується в цей файловий дескриптор. Існує також функція C-рівня, PySignal_SetWakeupFd(), для встановлення дескриптора.

    Цикли подій використовуватимуть це шляхом відкриття каналу для створення двох дескрипторів, одного для читання та іншого для запису. Дескриптор, доступний для запису, буде передано до set_wakeup_fd(), а дескриптор, доступний для читання, буде додано до списку дескрипторів, які відстежуються циклом подій через select() або poll(). Після отримання сигналу буде записаний байт, і основний цикл подій буде активовано, уникаючи необхідності опитування.

    (Надав Адам Олсен; bpo-1583.)

    Функція siginterrupt() тепер доступна з коду Python і дозволяє змінювати, чи можуть сигнали переривати системні виклики чи ні. (Надав Ральф Шмітт.)

    Також додано функції setitimer() і getitimer() (де вони доступні). setitimer() дозволяє встановлювати інтервальні таймери, які спричинять доставку сигналу до процесу після визначеного часу, виміряного за часом настінного годинника, спожитим часом процесу або комбінованим часом процесу+системи. (Надав Гільєрме Поло; bpo-2240.)

  • Модуль smtplib тепер підтримує SMTP через SSL завдяки додаванню класу SMTP_SSL. Цей клас підтримує інтерфейс, ідентичний існуючому класу SMTP. (Надано Монті Тейлором.) Обидва конструктори класів також мають додатковий параметр timeout, який визначає час очікування для початкової спроби підключення, виміряний у секундах. (Надав Факундо Батіста.)

    Також до модуля додано реалізацію протоколу LMTP (RFC 2033). LMTP використовується замість SMTP під час передачі електронної пошти між агентами, які не керують чергою пошти. (LMTP реалізовано Leif Hedstrom; bpo-957003.)

    SMTP.starttls() тепер відповідає RFC 3207 і забуває будь-яку інформацію, отриману від сервера, не отриману в результаті узгодження TLS. (Патч надав Білл Феннер; bpo-829951.)

  • Модуль socket тепер підтримує TIPC (http://tipc.sourceforge.net/), високопродуктивний протокол не на основі IP, розроблений для використання в кластерних середовищах. Адреси TIPC складаються з 4 або 5 кортежів. (Надав Альберто Бертоглі; bpo-1646.)

    Нова функція, create_connection(), приймає адресу та підключається до неї, використовуючи додаткове значення тайм-ауту, повертаючи підключений об’єкт сокета. Ця функція також шукає тип адреси та підключається до неї за допомогою IPv4 або IPv6 відповідно. Зміна коду на використання create_connection() замість socket(socket.AF_INET, ...) — це все, що потрібно, щоб ваш код працював з IPv6.

  • Базові класи в модулі SocketServer тепер підтримують виклик методу handle_timeout() після періоду бездіяльності, визначеного атрибутом timeout сервера. (Надано Майклом Помранінгом.) Метод serve_forever() тепер використовує додатковий інтервал опитування, виміряний у секундах, контролюючи, як часто сервер перевірятиме запит на завершення роботи. (Надано Педро Вернеком і Джеффрі Яскіним; bpo-742598, bpo-1193577.)

  • Модуль sqlite3, який підтримує Gerhard Häring, було оновлено з версії 2.3.2 у Python 2.5 до версії 2.4.1.

  • The struct module now supports the C99 _Bool type, using the format character '?'. (Contributed by David Remahl.)

  • Об’єкти Popen, надані модулем subprocess, тепер мають методи terminate(), kill() і send_signal(). У Windows send_signal() підтримує лише сигнал SIGTERM, і всі ці методи є псевдонімами для функції Win32 API TerminateProcess(). (Надано Крістіаном Хеймсом.)

  • Нова змінна в модулі sys, float_info, є об’єктом, що містить інформацію, отриману з файлу float.h про підтримку платформою операцій з плаваючою комою. Атрибути цього об’єкта включають mant_dig (кількість цифр у мантисі), epsilon (найменша різниця між 1,0 і наступним найбільшим значенням, яке можна представити), і кілька інших. (Надав Крістіан Хаймес; bpo-1534.)

    Інша нова змінна, dont_write_bytecode, контролює, чи Python записує файли .pyc або .pyo під час імпортування модуля. Якщо ця змінна має значення true, скомпільовані файли не записуються. Змінна спочатку встановлюється під час запуску шляхом надання перемикача -B інтерпретатору Python або встановленням змінної середовища PYTHONDONTWRITEBYTECODE перед запуском інтерпретатора. Код Python може згодом змінити значення цієї змінної, щоб контролювати, записуються чи ні файли байт-коду. (Надано Нілом Норвітцем і Георгом Брандлом.)

    Інформація про аргументи командного рядка, які надаються інтерпретатору Python, доступна шляхом читання атрибутів іменованого кортежу, доступного як sys.flags. Наприклад, атрибут verbose має значення true, якщо Python було виконано в детальному режимі, debug має значення true у режимі налагодження тощо. Усі ці атрибути доступні лише для читання. (Надано Крістіаном Хеймсом.)

    Нова функція, getsizeof(), приймає об’єкт Python і повертає обсяг пам’яті, який використовує об’єкт, виміряний у байтах. Вбудовані об’єкти повертають правильні результати; сторонні розширення можуть ні, але можуть визначити метод __sizeof__() для повернення розміру об’єкта. (Надано Робертом Шаппенісом; bpo-2898.)

    Тепер можна визначити поточні функції профайлера та трасувальника, викликавши sys.getprofile() і sys.gettrace(). (Надав Георг Брандл; bpo-1648.)

  • Модуль tarfile тепер підтримує tar-файли POSIX.1-2001 (pax) на додаток до форматів POSIX.1-1988 (ustar) і GNU tar, які вже підтримувалися. Типовим форматом є GNU tar; вкажіть параметр format, щоб відкрити файл в іншому форматі:

    tar = tarfile.open("output.tar", "w",
                       format=tarfile.PAX_FORMAT)
    

    Нові параметри encoding і errors визначають кодування та схему обробки помилок для перетворення символів. 'strict', 'ignore' і 'replace' є трьома стандартними способами, якими Python може обробляти помилки; 'utf-8'' — це спеціальне значення, яке замінює неправильні символи їх представленням UTF-8. (Перетворення символів відбувається через те, що формат PAX підтримує імена файлів Unicode із кодуванням UTF-8 за умовчанням.)

    The TarFile.add() method now accepts an exclude argument that’s a function that can be used to exclude certain filenames from an archive. The function must take a filename and return true if the file should be excluded or false if it should be archived. The function is applied to both the name initially passed to add() and to the names of files in recursively-added directories.

    (Усі зміни внесено Ларсом Густебелем).

  • До конструктора класу telnetlib.Telnet було додано необов’язковий параметр timeout, який визначає час очікування в секундах. (Додав Факундо Батіста.)

  • Клас tempfile.NamedTemporaryFile зазвичай видаляє створений ним тимчасовий файл, коли файл закривається. Цю поведінку тепер можна змінити, передавши delete=False конструктору. (Надав Деміен Міллер; bpo-1537850.)

    Новий клас, SpooledTemporaryFile, поводиться як тимчасовий файл, але зберігає свої дані в пам’яті, доки не буде перевищено максимальний розмір. Після досягнення цієї межі вміст буде записаний у тимчасовий файл на диску. (Надав Дастін Дж. Мітчелл.)

    Класи NamedTemporaryFile і SpooledTemporaryFile працюють як менеджери контексту, тому ви можете написати with tempfile.NamedTemporaryFile() як tmp: .... (Надав Олександр Бєлопольський; bpo-2021.)

  • Модуль test.test_support отримав низку контекстних менеджерів, корисних для написання тестів. EnvironmentVarGuard() — це контекстний менеджер, який тимчасово змінює змінні середовища та автоматично відновлює їхні старі значення.

    Інший контекстний менеджер, TransientResource, може охоплювати виклики ресурсів, які можуть бути або не бути доступними; він перехопить та проігнорує вказаний список винятків. Наприклад, тест мережі може ігнорувати певні збої під час підключення до зовнішнього веб-сайту:

    with test_support.TransientResource(IOError,
                                    errno=errno.ETIMEDOUT):
        f = urllib.urlopen('https://sf.net')
        ...
    

    Нарешті, check_warnings() скидає фільтри попереджень модуля warning і повертає об’єкт, який записуватиме всі викликані попередження (bpo-3781):

    with test_support.check_warnings() as wrec:
        warnings.simplefilter("always")
        # ... code that triggers a warning ...
        assert str(wrec.message) == "function is outdated"
        assert len(wrec.warnings) == 1, "Multiple warnings raised"
    

    (Надав Бретт Кеннон.)

  • The textwrap module can now preserve existing whitespace at the beginnings and ends of the newly-created lines by specifying drop_whitespace=False as an argument:

    >>> S = """This  sentence  has a bunch   of
    ...   extra   whitespace."""
    >>> print textwrap.fill(S, width=15)
    This  sentence
    has a bunch
    of    extra
    whitespace.
    >>> print textwrap.fill(S, drop_whitespace=False, width=15)
    This  sentence
      has a bunch
       of    extra
       whitespace.
    >>>
    

    (Надав Дуейн Бейлі; bpo-1581073.)

  • API модуля threading буде змінено для використання таких властивостей, як daemon замість методів setDaemon() і isDaemon(), а деякі методи були перейменовані, щоб замість них використовувати підкреслення з верблюда; наприклад, метод activeCount() перейменовано на active_count(). Обидві версії модуля 2.6 і 3.0 підтримують однакові властивості та перейменовані методи, але не видаляють старі методи. Не встановлено дати припинення підтримки старих API у Python 3.x; старі API не будуть видалені в жодній версії 2.x. (Здійснено кількома людьми, особливо Бенджаміном Петерсоном.)

    Об’єкти Thread модуля threading отримали властивість ident, яка повертає ідентифікатор потоку, ненульове ціле число. (Надав Грегорі П. Сміт; bpo-2871.)

  • Модуль timeit тепер приймає виклики, а також рядки для оператора, який хронометрується, і для коду налаштування. Було додано дві зручні функції для створення екземплярів Timer: repeat(stmt, setup, time, repeat, number) і timeit(stmt, setup, time, number) створити екземпляр і викликати відповідний метод. (Надав Ерік Демейн; bpo-1533909.)

  • Модуль Tkinter тепер приймає списки та кортежі для параметрів, розділяючи елементи пробілами перед передачею результуючого значення в Tcl/Tk. (Надав Гільєрме Поло; bpo-2906.)

  • Модуль turtle для черепахової графіки був значно вдосконалений Грегором Лінглом. Нові функції в модулі включають:

    • Краща анімація руху та обертання черепахи.

    • Керуйте рухом черепахи за допомогою нових методів delay(), tracer() і speed().

    • Можливість задавати нові форми для черепахи та визначати нову систему координат.

    • Turtles тепер мають метод undo(), який може відкочувати дії.

    • Проста підтримка реагування на події введення, такі як активність миші та клавіатури, що дає змогу писати прості ігри.

    • Файл turtle.cfg можна використовувати для налаштування початкового вигляду екрана черепахи.

    • Документаційні рядки модуля можна замінити новими документаційними рядками, перекладеними іншою мовою.

    (bpo-1513695)

  • До функції urllib.urlopen() і конструктора класу urllib.ftpwrapper, а також функції urllib2.urlopen() додано необов’язковий параметр timeout. Параметр визначає час очікування в секундах. Наприклад:

    >>> u = urllib2.urlopen("http://slow.example.com",
                            timeout=3)
    Traceback (most recent call last):
      ...
    urllib2.URLError: <urlopen error timed out>
    >>>
    

    (Додав Факундо Батіста.)

  • Базу даних Unicode, яку надає модуль unicodedata, оновлено до версії 5.1.0. (Оновлено Мартіном фон Льовісом; bpo-3811.)

  • Модулі warnings formatwarning() і showwarning() отримали додатковий аргумент line, який можна використовувати для надання рядка вихідного коду. (Додано як частину bpo-1631171, яка повторно реалізувала частину модуля warnings у коді C.)

    Нова функція, catch_warnings(), є контекстним менеджером, призначеним для цілей тестування, який дозволяє тимчасово змінювати фільтри попереджень, а потім відновлювати їхні вихідні значення (bpo-3781).

  • Класам XML-RPC SimpleXMLRPCServer і DocXMLRPCServer тепер можна запобігти негайному відкриттю та зв’язуванню з їхнім сокетом, передавши False як параметр конструктора bind_and_activate. Це можна використовувати для зміни атрибута екземпляра allow_reuse_address перед викликом методів server_bind() і server_activate(), щоб відкрити сокет і почати прослуховування з’єднань. (Надав Пітер Паренте; bpo-1599845.)

    SimpleXMLRPCServer також має атрибут _send_traceback_header; якщо істина, виняток і відформатована трасування повертаються як HTTP-заголовки «X-Exception» і «X-Traceback». Ця функція призначена лише для налагодження, і її не слід використовувати на робочих серверах, оскільки відстеження може виявити паролі чи іншу конфіденційну інформацію. (Надано Аланом Макінтайром у рамках його проекту Google Summer of Code 2007.)

  • Модуль xmlrpclib більше не перетворює автоматично datetime.date і datetime.time на тип xmlrpclib.DateTime; семантика перетворення не обов’язково була правильною для всіх програм. Код із використанням xmlrpclib має конвертувати екземпляри date і time. (bpo-1330538) Код також може обробляти дати до 1900 року (надано Ralf Schmitt; bpo-2014) і 64-розрядні цілі числа, представлені за допомогою <i8> у відповідях XML-RPC (надано Ріку Ліндблад; bpo-2985).

  • Клас ZipFile модуля zipfile тепер має методи extract() і extractall(), які розпаковують один або всі файли в архіві до поточного каталогу, або у вказаний каталог:

    z = zipfile.ZipFile('python-251.zip')
    
    # Unpack a single file, writing it relative
    # to the /tmp directory.
    z.extract('Python/sysmodule.c', '/tmp')
    
    # Unpack all the files in the archive.
    z.extractall()
    

    (Надав Алан Макінтайр; bpo-467924.)

    Методи open(), read() і extract() тепер можуть приймати ім’я файлу або об’єкт ZipInfo. Це корисно, коли архів випадково містить дубльоване ім’я файлу. (Надав Грем Хорлер; bpo-1775025.)

    Нарешті, zipfile тепер підтримує використання імен файлів Unicode для архівованих файлів. (Надав Олексій Борзенков; bpo-1734346.)

Модуль ast

Модуль ast забезпечує представлення коду Python у вигляді абстрактного синтаксичного дерева, а Армін Ронахер додав набір допоміжних функцій, які виконують різноманітні типові завдання. Вони будуть корисні для пакетів шаблонів HTML, аналізаторів коду та подібних інструментів, які обробляють код Python.

Функція parse() приймає вираз і повертає AST. Функція dump() виводить представлення дерева, придатне для налагодження:

import ast

t = ast.parse("""
d = {}
for i in 'abcdefghijklm':
    d[i + i] = ord(i) - ord('a') + 1
print d
""")
print ast.dump(t)

Це виводить глибоко вкладене дерево:

Module(body=[
  Assign(targets=[
    Name(id='d', ctx=Store())
   ], value=Dict(keys=[], values=[]))
  For(target=Name(id='i', ctx=Store()),
      iter=Str(s='abcdefghijklm'), body=[
    Assign(targets=[
      Subscript(value=
        Name(id='d', ctx=Load()),
          slice=
          Index(value=
            BinOp(left=Name(id='i', ctx=Load()), op=Add(),
             right=Name(id='i', ctx=Load()))), ctx=Store())
     ], value=
     BinOp(left=
      BinOp(left=
       Call(func=
        Name(id='ord', ctx=Load()), args=[
          Name(id='i', ctx=Load())
         ], keywords=[], starargs=None, kwargs=None),
       op=Sub(), right=Call(func=
        Name(id='ord', ctx=Load()), args=[
          Str(s='a')
         ], keywords=[], starargs=None, kwargs=None)),
       op=Add(), right=Num(n=1)))
    ], orelse=[])
   Print(dest=None, values=[
     Name(id='d', ctx=Load())
   ], nl=True)
 ])

Метод literal_eval() приймає рядок або AST, що представляє літеральний вираз, аналізує та обчислює його та повертає результуюче значення. Літеральний вираз — це вираз Python, який містить лише рядки, числа, словники тощо, але не містить операторів чи викликів функцій. Якщо вам потрібно оцінити вираз, але ви не можете прийняти загрозу безпеці використання виклику eval(), literal_eval() впорається з цим безпечно:

>>> literal = '("a", "b", {2:4, 3:8, 1:2})'
>>> print ast.literal_eval(literal)
('a', 'b', {1: 2, 2: 4, 3: 8})
>>> print ast.literal_eval('"a" + "b"')
Traceback (most recent call last):
  ...
ValueError: malformed string

Модуль також містить класи NodeVisitor і NodeTransformer для обходу та модифікації AST, а також функції для типових перетворень, таких як зміна номерів рядків.

Модуль future_builtins

Python 3.0 вносить багато змін до репертуару вбудованих функцій, і більшість змін не можна ввести в серії Python 2.x, оскільки вони порушать сумісність. Модуль future_builtins надає версії цих вбудованих функцій, які можна імпортувати під час написання коду, сумісного з 3.0.

Функції цього модуля наразі включають:

  • ascii(obj): еквівалент repr(). У Python 3.0 repr() поверне рядок Unicode, тоді як ascii() поверне чистий байтовий рядок ASCII.

  • filter(predicate, iterable), map(func, iterable1, ...): версії 3.0 повертають ітератори, на відміну від вбудованих 2.x, які повертають списки.

  • hex(value), oct(value): замість виклику методів __hex__() або __oct__() ці версії викличуть метод __index__() і перетворити результат у шістнадцяткове або вісімкове. oct() використовуватиме нову нотацію 0o для свого результату.

Модуль json: Нотація об’єктів JavaScript

Новий модуль json підтримує кодування та декодування типів Python у JSON (Javascript Object Notation). JSON — це легкий формат обміну, який часто використовується у веб-додатках. Для отримання додаткової інформації про JSON відвідайте http://www.json.org.

json підтримує декодування та кодування більшості вбудованих типів Python. У наступному прикладі кодується та декодується словник:

>>> import json
>>> data = {"spam": "foo", "parrot": 42}
>>> in_json = json.dumps(data) # Encode the data
>>> in_json
'{"parrot": 42, "spam": "foo"}'
>>> json.loads(in_json) # Decode into a Python object
{"spam": "foo", "parrot": 42}

Також можна написати власні декодери та кодери для підтримки більшої кількості типів. Також підтримується швидкий друк рядків JSON.

json (спочатку називався simplejson) був написаний Бобом Іпполіто.

Модуль plistlib: аналізатор списку властивостей

Формат .plist зазвичай використовується в Mac OS X для зберігання основних типів даних (чисел, рядків, списків і словників) шляхом їх серіалізації у формат на основі XML. Це нагадує серіалізацію типів даних XML-RPC.

Незважаючи на те, що в основному використовується в Mac OS X, цей формат не має нічого специфічного для Mac, а реалізація Python працює на будь-якій платформі, яку підтримує Python, тому модуль plistlib було підвищено до стандартної бібліотеки.

Користуватися модулем просто:

import sys
import plistlib
import datetime

# Create data structure
data_struct = dict(lastAccessed=datetime.datetime.now(),
                   version=1,
                   categories=('Personal','Shared','Private'))

# Create string containing XML.
plist_str = plistlib.writePlistToString(data_struct)
new_struct = plistlib.readPlistFromString(plist_str)
print data_struct
print new_struct

# Write data structure to a file and read it back.
plistlib.writePlist(data_struct, '/tmp/customizations.plist')
new_struct = plistlib.readPlist('/tmp/customizations.plist')

# read/writePlist accepts file-like objects as well as paths.
plistlib.writePlist(data_struct, sys.stdout)

Покращення ctypes

Томас Хеллер продовжував підтримувати та вдосконалювати модуль ctypes.

ctypes тепер підтримує тип даних c_bool, який представляє тип C99 bool. (Надав Девід Ремал; bpo-1649190.)

Типи рядків, буферів і масивів ctypes мають покращену підтримку розширеного синтаксису зрізу, де надаються різні комбінації (початок, зупинка, крок). (Реалізовано Томасом Воутерсом.)

Усі типи даних ctypes тепер підтримують методи from_buffer() і from_buffer_copy(), які створюють екземпляр ctypes на основі наданого об’єкта буфера. from_buffer_copy() копіює вміст об’єкта, тоді як from_buffer() буде використовувати ту саму область пам’яті.

Нова угода про виклики вказує ctypes очищати змінні errno або Win32 LastError на початку кожного обгорнутого виклику. (Реалізовано Томасом Геллером; bpo-1798.)

Тепер ви можете отримати змінну Unix errno після виклику функції. Під час створення обгорнутої функції ви можете вказати use_errno=True як ключовий параметр для функції DLL(), а потім викликати методи рівня модуля set_errno() і get_errno() щоб встановити та отримати значення помилки.

Змінна Win32 LastError так само підтримується функціями DLL(), OleDLL() і WinDLL(). Ви вказуєте use_last_error=True як параметр ключового слова, а потім викликаєте методи рівня модуля set_last_error() і get_last_error().

Функція byref(), яка використовується для отримання вказівника на екземпляр ctypes, тепер має необов’язковий параметр offset, який є кількістю байтів, яка буде додана до поверненого вказівника.

Покращена підтримка SSL

Білл Янссен значно покращив підтримку Python 2.6 для Secure Sockets Layer, додавши новий модуль, ssl, який побудовано поверх бібліотеки OpenSSL. Цей новий модуль забезпечує більше контролю над узгодженим протоколом, використовуваними сертифікатами X.509 і має кращу підтримку для написання серверів SSL (на відміну від клієнтів) на Python. Наявну підтримку SSL у модулі socket не було видалено та продовжує працювати, хоча її буде видалено в Python 3.0.

Щоб використовувати новий модуль, ви повинні спочатку створити з’єднання TCP у звичайний спосіб, а потім передати його функції ssl.wrap_socket(). Можна вказати, чи потрібен сертифікат, і отримати інформацію про сертифікат, викликавши метод getpeercert().

Дивись також

Документація для модуля ssl.

Скасування та видалення

  • Рядкові винятки видалено. Спроба використати їх викликає TypeError.

  • Зміни до інтерфейсу Exception відповідно до PEP 352 продовжуються. Для 2.6 атрибут message застарів на користь атрибута args.

  • (3.0-режим попередження) Python 3.0 матиме реорганізовану стандартну бібліотеку, яка видалить багато застарілих модулів і перейменує інші. Python 2.6, який працює в режимі попередження 3.0, попередить про ці модулі під час їх імпорту.

    Список застарілих модулів: audiodev, bgenlocations, buildtools, bundlebuilder, Canvas, compiler, dircache, dl, fpformat, gensuitemodule, ihooks, imageop, imgfile, linuxaudiodev, mhlib, mimetools, multifile, new, pure, statvfs, sunaudiodev, test.testall і toaiff.

  • Модуль gopherlib видалено.

  • Модулі MimeWriter і mimify були визнані застарілими; замість цього використовуйте пакет email.

  • Модуль md5 застарів; замість цього використовуйте модуль hashlib.

  • Модуль posixfile визнано застарілим; fcntl.lockf() забезпечує краще блокування.

  • Модуль popen2 застарів; використовуйте модуль subprocess.

  • Модуль rgbimg видалено.

  • Модуль sets визнано застарілим; краще використовувати вбудовані типи set і frozenset.

  • Модуль sha застарів; замість цього використовуйте модуль hashlib.

Зміни збірки та C API

Зміни в процесі збирання Python і в API C включають:

  • Тепер Python потрібно скомпілювати за допомогою компіляторів C89 (після 19 років!). Це означає, що вихідне дерево Python виключило власні реалізації memmove() і strerror(), які є в стандартній бібліотеці C89.

  • Python 2.6 можна створити за допомогою Microsoft Visual Studio 2008 (версія 9.0), і це новий компілятор за замовчуванням. Перегляньте каталог PCbuild для файлів збірки. (Реалізовано Крістіаном Хеймсом.)

  • У Mac OS X Python 2.6 можна скомпілювати як чотиристоронню універсальну збірку. Сценарій configure може приймати перемикач --with-universal-archs=[32-bit|64-bit|all], контролюючи, чи створено двійкові файли для 32-розрядних архітектур ( x86, PowerPC), 64-розрядні (x86-64 і PPC-64) або обидва. (Надав Рональд Уссорен.)

  • Модуль BerkeleyDB тепер має об’єкт C API, доступний як bsddb.db.api. Цей об’єкт може використовуватися іншими розширеннями C, які бажають використовувати модуль bsddb для власних цілей. (Надав Дункан Грісбі.)

  • Новий інтерфейс буфера, раніше описаний у розділі PEP 3118, додає PyObject_GetBuffer() і PyBuffer_Release(), а також кілька інших функцій.

  • Використання Python бібліотеки C stdio тепер безпечно для потоків або, принаймні, настільки ж безпечно для потоків, як і базова бібліотека. Тривала потенційна помилка виникла, якщо один потік закрив об’єкт файлу, а інший потік читав або записував об’єкт. У версії 2.6 файлові об’єкти мають кількість посилань, якою керують функції PyFile_IncUseCount() і PyFile_DecUseCount(). Файлові об’єкти не можна закрити, якщо кількість посилань не дорівнює нулю. PyFile_IncUseCount() слід викликати, поки GIL все ще утримується, перед виконанням операції введення/виведення за допомогою вказівника FILE *, а PyFile_DecUseCount() слід викликати відразу після GIL отримується повторно. (Надано Антуаном Пітру та Грегорі П. Смітом.)

  • Одночасне імпортування модулів у двох різних потоках більше не викликає взаємоблокувань; тепер це викличе ImportError. Нова функція API, PyImport_ImportModuleNoBlock(), спочатку шукатиме модуль у sys.modules, а потім намагатиметься імпортувати його після отримання блокування імпорту. Якщо блокування імпорту утримується іншим потоком, виникає ImportError. (Надано Крістіаном Хеймсом.)

  • Кілька функцій повертають інформацію про підтримку платформою операцій з плаваючою комою. PyFloat_GetMax() повертає максимальне значення з плаваючою комою, яке можна представити, а PyFloat_GetMin() повертає мінімальне позитивне значення. PyFloat_GetInfo() повертає об’єкт, що містить більше інформації з файлу float.h, як-от "mant_dig" (кількість цифр у мантисі), "epsilon" (найменша різниця між 1,0 і наступним найбільшим значенням, яке можна представити), і кілька інших. (Надав Крістіан Хаймес; bpo-1534.)

  • Функції та методи C, які використовують PyComplex_AsCComplex(), тепер прийматимуть аргументи, які мають метод __complex__(). Зокрема, функції в модулі cmath тепер прийматимуть об’єкти за допомогою цього методу. Це бекпорт зміни Python 3.0. (Надав Марк Дікінсон; bpo-1675423.)

  • C API Python тепер містить дві функції для порівняння рядків без урахування регістру: PyOS_stricmp(char*, char*) і PyOS_strnicmp(char*, char*, Py_ssize_t). (Надав Крістіан Хаймес; bpo-1635.)

  • Багато розширень C визначають власний маленький макрос для додавання цілих чисел і рядків до словника модуля у функції init*. Python 2.6 нарешті визначає стандартні макроси для додавання значень до модуля, PyModule_AddStringMacro і PyModule_AddIntMacro(). (Надано Крістіаном Хеймсом.)

  • Деякі макроси було перейменовано у версіях 3.0 і 2.6, щоб було зрозуміліше, що вони є макросами, а не функціями. Py_Size() став Py_SIZE(), Py_Type() став Py_TYPE(), а Py_Refcnt() став Py_REFCNT(). Макроси змішаного регістру все ще доступні в Python 2.6 для зворотної сумісності. (bpo-1629)

  • Distutils тепер розміщує створені ним розширення C в іншому каталозі під час роботи на налагодженій версії Python. (Надав Колін Вінтер; bpo-1530959.)

  • Кілька основних типів даних, таких як цілі числа та рядки, підтримують внутрішні вільні списки об’єктів, які можна повторно використовувати. Структури даних для цих вільних списків тепер дотримуються угоди про іменування: змінна завжди має назву free_list, лічильник завжди має назву numfree, а макрос Py <typename> _MAXFREELIST завжди визначено.

  • Нова ціль Makefile, «make patchcheck», готує вихідне дерево Python для створення виправлення: вона виправляє кінцеві пробіли в усіх змінених файлах .py, перевіряє, чи було змінено документацію, і повідомляє, чи Misc/ACKS і Misc/NEWS оновлено. (Надав Бретт Кеннон.)

    Інша нова ціль, «make profile-opt», компілює двійковий файл Python за допомогою оптимізації профілю GCC. Він компілює Python із увімкненим профілюванням, запускає набір тестів для отримання набору результатів профілювання, а потім компілює, використовуючи ці результати для оптимізації. (Надав Грегорі П. Сміт.)

Зміни, що стосуються порту: Windows

  • Підтримку Windows 95, 98, ME та NT4 припинено. Python 2.6 вимагає принаймні Windows 2000 SP4.

  • Новим компілятором за замовчуванням у Windows є Visual Studio 2008 (версія 9.0). Каталоги збірки для Visual Studio 2003 (версія 7.1) і 2005 (версія 8.0) переміщено в каталог PC/. Новий каталог PCbuild підтримує крос-компіляцію для X64, збірки для налагодження та керовану оптимізацію профілем (PGO). Збірки PGO приблизно на 10% швидші за звичайні. (Надано Крістіаном Хеймсом за допомогою Аморі Форже д’Арк і Мартіна фон Льовіса.)

  • Модуль msvcrt тепер підтримує як звичайні, так і широкі символьні варіанти API консолі вводу-виводу. Функція getwch() зчитує натискання клавіші та повертає значення Unicode, як і функція getwche(). Функція putwch() приймає символ Unicode і записує його на консоль. (Надано Крістіаном Хеймсом.)

  • os.path.expandvars() тепер розгорне змінні середовища у формі «%var%», а «~user» буде розгорнуто до шляху до домашнього каталогу користувача. (Надав Джосія Карлсон; bpo-957650.)

  • Об’єкти socket модуля socket тепер мають метод ioctl(), який забезпечує обмежений інтерфейс до системного інтерфейсу WSAIoctl().

  • Модуль _winreg тепер має функцію ExpandEnvironmentStrings(), яка розширює посилання на змінні середовища, такі як %NAME% у вхідному рядку. Об’єкти-дескриптори, надані цим модулем, тепер підтримують протокол контексту, тому їх можна використовувати в операторах with. (Надано Крістіаном Хеймсом.)

    _winreg також має кращу підтримку для систем x64, відкриваючи функції DisableReflectionKey(), EnableReflectionKey() і QueryReflectionKey(), які вмикають і вимикають відображення реєстру для 32-розрядних процесів працює на 64-розрядних системах. (bpo-1753245)

  • Об’єкт Record модуля msilib отримав методи GetInteger() і GetString(), які повертають значення полів як ціле число або рядок. (Надав Флоріс Бруйнуге; bpo-2125.)

Зміни, що стосуються порту: Mac OS X

  • Під час компіляції збірки фреймворка Python тепер ви можете вказати ім’я фреймворка, яке буде використовуватися, надавши параметр --with-framework-name= сценарію configure.

  • Модуль macfs видалено. Це, у свою чергу, вимагало видалення функції macostools.touched(), оскільки вона залежала від модуля macfs. (bpo-1490190)

  • Багато інших модулів Mac OS застаріли та будуть видалені в Python 3.0: _builtinSuites, aepack, aetools, aetypes, applesingle , appletrawmain, appletrunner, argvemulator, Audio_mac, autoGIL, Carbon, cfmfile, CodeWarrior, ColorPicker, EasyDialogs, Explorer, Finder, FrameWork, findertools, ic, icglue, icopen, macerrors, MacOS, macfs, macostools, macresource, MiniAEFrame, Nav, Netscape, OSATerminology, pimp, PixMapWrapper, StdSuites, SystemEvents, Terminal і terminalcommand.

Зміни, що стосуються порту: IRIX

Кілька старих модулів, специфічних для IRIX, застаріли та будуть видалені в Python 3.0: al і AL, cd, cddb, cdplayer, CL і cl, DEVICE, ERRNO, FILE, FL і fl, flp, fm, GET, GLWS, GL і gl, IN , IOCTL, jpeg, panelparser, readcd, SV і sv, torgb, videoreader і WAIT.

Перенесення на Python 2.6

У цьому розділі перераховані раніше описані зміни та інші виправлення помилок, які можуть потребувати змін у вашому коді:

  • Класи, які не мають бути хешованими, повинні встановити __hash__ = None у своїх визначеннях, щоб вказати цей факт.

  • Рядкові винятки видалено. Спроба використати їх викликає TypeError.

  • Метод __init__() collections.deque тепер очищає будь-який наявний вміст deque перед додаванням елементів із iterable. Ця зміна робить поведінку відповідною list.__init__().

  • object.__init__() раніше приймав довільні аргументи та ключові аргументи, ігноруючи їх. У Python 2.6 це більше не дозволено та призведе до TypeError. Це вплине на методи __init__(), які призводять до виклику відповідного методу в object (можливо, через використання super()). Перегляньте bpo-1683368 для обговорення.

  • Конструктор Decimal тепер приймає пробіли на початку та в кінці під час передачі рядка. Раніше це викликало виняток InvalidOperation. З іншого боку, метод create_decimal() об’єктів Context тепер явно забороняє додаткові пробіли, викликаючи виняток ConversionSyntax.

  • Через помилку реалізації, якщо ви передали шлях до файлу вбудованій функції __import__(), вона фактично імпортує вказаний файл. Однак це ніколи не планувалося працювати, і реалізація тепер явно перевіряє цей випадок і викликає ImportError.

  • C API: функції PyImport_Import() і PyImport_ImportModule() тепер за замовчуванням використовують абсолютний, а не відносний імпорт. Це вплине на розширення C, які імпортують інші модулі.

  • C API: типи даних розширення, які не можна хешувати, повинні визначити свій слот tp_hash як PyObject_HashNotImplemented().

  • Виняток модуля socket socket.error тепер успадковує від IOError. Раніше це не було підкласом StandardError, але тепер це є через IOError. (Реалізовано Грегорі П. Смітом; bpo-1706815.)

  • Модуль xmlrpclib більше не перетворює автоматично datetime.date і datetime.time на тип xmlrpclib.DateTime; семантика перетворення не обов’язково була правильною для всіх програм. Код із використанням xmlrpclib має конвертувати екземпляри date і time. (bpo-1330538)

  • (Режим попередження 3.0) Клас Exception тепер попереджає, коли до нього звертаються за допомогою доступу до фрагментів або індексу; наявність Exception поводиться як кортеж, який поступово припиняється.

  • (3.0-режим попередження) порівняння нерівності між двома словниками або двома об’єктами, які не реалізують методи порівняння, повідомляються як попередження. dict1 == dict2 все ще працює, але dict1 < dict2 поступово припиняється.

    Порівняння між клітинками, які є частиною реалізації правил визначення області дії Python, також викликають попередження, оскільки такі порівняння повністю заборонені в 3.0.

Подяки

Автор хотів би подякувати наступним людям за пропозиції, виправлення та допомогу з різними чернетками цієї статті: Георг Брандл, Стів Браун, Нік Коглан, Ральф Кордерой, Джим Джеветт, Кент Джонсон, Кріс Ламбакер, Мартін Міхлмайр, Антуан Пітру, Браян Ворнер.