Що нового в Python 2.6¶
- Автор
A.M. Kuchling (amk в amk.ca)
This article explains the new features in Python 2.6, released on October 1 2008. The release schedule is described in PEP 361.
Основною темою Python 2.6 є підготовка шляху міграції до Python 3.0, значного перероблення мови. Коли це можливо, Python 2.6 включає нові функції та синтаксис із 3.0, залишаючись сумісним із існуючим кодом, не видаляючи старіші функції чи синтаксис. Коли це неможливо зробити, Python 2.6 намагається зробити все, що може, додаючи функції сумісності в модуль future_builtins
і перемикач -3
, щоб попереджати про використання, яке стане непідтримуваним у 3.0. .
До стандартної бібліотеки додано кілька важливих нових пакетів, таких як модулі multiprocessing
і json
, але є не так багато нових функцій, які якимось чином не пов’язані з Python 3.0.
Python 2.6 також бачить ряд покращень і виправлень помилок у вихідному коді. Пошук у журналах змін виявив, що між Python 2.5 і 2.6 було застосовано 259 патчів і 612 виправлених помилок. Обидві цифри, ймовірно, занижені.
Ця стаття не намагається надати повну специфікацію нових функцій, натомість надає зручний огляд. Щоб отримати повну інформацію, зверніться до документації для Python 2.6. Якщо ви хочете зрозуміти обґрунтування дизайну та впровадження, зверніться до PEP для конкретної нової функції. Коли це можливо, «Що нового в Python» посилається на елемент помилки/виправлення для кожної зміни.
Python 3.0¶
Цикл розробки Python версій 2.6 і 3.0 був синхронізований, альфа- і бета-версії для обох версій були зроблені в ті самі дні. Розробка версії 3.0 вплинула на багато функцій версії 2.6.
Python 3.0 — це масштабна переробка Python, яка порушує сумісність із серією 2.x. Це означає, що існуючий код Python потребує певного перетворення, щоб працювати на Python 3.0. Однак не всі зміни в 3.0 обов’язково порушують сумісність. У випадках, коли нові функції не призведуть до поломки існуючого коду, їх було перенесено до версії 2.6 і описано у відповідному місці в цьому документі. Ось деякі з функцій версії 3.0:
Метод
__complex__()
для перетворення об’єктів на комплексне число.Альтернативний синтаксис для перехоплення винятків:
except TypeError as exc
.Додано
functools.reduce()
як синонім вбудованої функціїreduce()
.
Python 3.0 додає кілька нових вбудованих функцій і змінює семантику деяких існуючих вбудованих функцій. Функції, які є новими у версії 3.0, такі як bin()
, просто додано до Python 2.6, але існуючі вбудовані функції не змінено; натомість модуль future_builtins
має версії з новою семантикою 3.0. Код, написаний для сумісності з 3.0, може виконувати from future_builtins import hex, map
за потреби.
Новий параметр командного рядка -3
дозволяє попереджати про функції, які буде видалено в Python 3.0. Ви можете запустити код за допомогою цього перемикача, щоб побачити, скільки роботи знадобиться для перенесення коду на 3.0. Значення цього параметра доступне для коду Python як логічна змінна sys.py3kwarning
, а для коду розширення C як Py_Py3kWarningFlag
.
Зміни в процесі розробки¶
Поки розроблялася версія 2.6, процес розробки Python зазнав двох значних змін: ми перейшли від засобу відстеження проблем SourceForge до налаштованої інсталяції Roundup, а документацію було перетворено з LaTeX на reStructuredText.
Новий засіб відстеження проблем: огляд¶
Протягом тривалого часу розробники Python дедалі більше дратувалися програмою відстеження помилок SourceForge. Розміщене рішення SourceForge не дозволяє багато налаштовувати; наприклад, неможливо було налаштувати життєвий цикл проблем.
The infrastructure committee of the Python Software Foundation therefore posted a call for issue trackers, asking volunteers to set up different products and import some of the bugs and patches from SourceForge. Four different trackers were examined: Jira, Launchpad, Roundup, and Trac. The committee eventually settled on Jira and Roundup as the two candidates. Jira is a commercial product that offers no-cost hosted instances to free-software projects; Roundup is an open-source project that requires volunteers to administer it and a server to host it.
Після публікації заклику до волонтерів було встановлено нову установку Roundup на https://bugs.python.org. Одна інсталяція Roundup може розмістити кілька трекерів, і цей сервер тепер також розміщує трекери проблем для Jython і для веб-сайту Python. Він, безсумнівно, знайде інші застосування в майбутньому. Там, де це можливо, це видання «Що нового в Python» містить посилання на елемент помилки/виправлення для кожної зміни.
Hosting of the Python bug tracker is kindly provided by Upfront Systems of Stellenbosch, South Africa. Martin von Löwis put a lot of effort into importing existing bugs and patches from SourceForge; his scripts for this import operation are at http://svn.python.org/view/tracker/importer/ and may be useful to other projects wishing to move from SourceForge to Roundup.
Дивись також
- https://bugs.python.org
Відстежувач помилок Python.
- http://bugs.jython.org:
Відстежувач помилок Jython.
- http://roundup.sourceforge.net/
Зведення завантажень і документації.
- http://svn.python.org/view/tracker/importer/
Сценарії перетворення Мартіна фон Льовіса.
Новий формат документації: reStructuredText за допомогою Sphinx¶
Документація Python була написана з використанням LaTeX з моменту початку проекту приблизно в 1989 році. У 1980-х і на початку 1990-х більшість документації роздруковували для подальшого вивчення, а не переглядали в Інтернеті. LaTeX широко використовувався, тому що він забезпечував привабливий друкований результат, залишаючись простим для написання після вивчення основних правил розмітки.
Сьогодні LaTeX все ще використовується для написання публікацій, призначених для друку, але ландшафт інструментів програмування змінився. Ми більше не друкуємо купу документів; замість цього ми переглядаємо його в Інтернеті, і HTML став найважливішим форматом для підтримки. На жаль, перетворення LaTeX на HTML є досить складним, і Фред Л. Дрейк молодший, давній редактор документації Python, витратив багато часу на підтримку процесу перетворення. Час від часу люди пропонували конвертувати документацію в SGML, а пізніше в XML, але якісне перетворення є головним завданням, і ніхто ніколи не витрачав час, необхідний для завершення роботи.
During the 2.6 development cycle, Georg Brandl put a lot of effort into building a new toolchain for processing the documentation. The resulting package is called Sphinx, and is available from http://sphinx-doc.org/.
Sphinx зосереджується на виведенні HTML, виробляючи привабливий і сучасний HTML; друкований вихід все ще підтримується через перетворення на LaTeX. Формат введення – reStructuredText, синтаксис розмітки, який підтримує спеціальні розширення та директиви, який зазвичай використовується в спільноті Python.
Sphinx — це окремий пакет, який можна використовувати для написання, і майже два десятки інших проектів (зазначені на веб-сайті Sphinx) прийняли Sphinx як інструмент для документування.
Дивись також
- Документування Python
Описує, як писати документацію для Python.
- Sphinx
Документація та код для Sphinx toolchain.
- Docutils
Базовий аналізатор reStructuredText і набір інструментів.
PEP 343: оператор «з».¶
Попередня версія, Python 2.5, додала інструкцію „with
“ як необов’язкову функцію, яку можна було ввімкнути за допомогою директиви from __future__ import with_statement
. У версії 2.6 цей оператор більше не потрібно спеціально вмикати; це означає, що with
тепер завжди є ключовим словом. Решта цього розділу є копією відповідного розділу з документа «Що нового в Python 2.5»; якщо ви знайомі з оператором „with
“ з Python 2.5, ви можете пропустити цей розділ.
Інструкція „with
“ уточнює код, який раніше використовував блоки try...finally
, щоб забезпечити виконання коду очищення. У цьому розділі я обговорю твердження, як воно буде зазвичай використовуватися. У наступному розділі я розгляну деталі реалізації та покажу, як писати об’єкти для використання з цим оператором.
Оператор „with
“ — це структура потоку керування, основна структура якої:
with expression [as variable]:
with-block
Вираз обчислюється, і в результаті він має отримати об’єкт, який підтримує протокол керування контекстом (тобто має методи __enter__()
і __exit__()
).
__enter__()
об’єкта викликається перед виконанням with-block і тому може запускати код налаштування. Він також може повертати значення, яке прив’язане до імені змінної, якщо його задано. (Зверніть увагу, що змінній не присвоєно результат виразу.)
Після завершення виконання with-block викликається метод __exit__()
об’єкта, навіть якщо блок викликав виняткову ситуацію, і тому може запустити код очищення.
Деякі стандартні об’єкти Python тепер підтримують протокол керування контекстом і можуть використовуватися з оператором „with
“. Одним із прикладів є файлові об’єкти:
with open('/etc/passwd', 'r') as f:
for line in f:
print line
... more processing code ...
Після виконання цього оператора файловий об’єкт у f буде автоматично закрито, навіть якщо цикл for
викликав виняток під час проходження блоку.
Примітка
У цьому випадку f — це той самий об’єкт, створений open()
, оскільки file.__enter__()
повертає self.
Блокування та змінні умови модуля threading
також підтримують оператор „with
“:
lock = threading.Lock()
with lock:
# Critical section of code
...
Блокування встановлюється перед виконанням блоку та завжди знімається після завершення блоку.
Функція localcontext()
у модулі decimal
дозволяє легко зберігати та відновлювати поточний десятковий контекст, який інкапсулює бажану точність і характеристики округлення для обчислень:
from decimal import Decimal, Context, localcontext
# Displays with default precision of 28 digits
v = Decimal('578')
print v.sqrt()
with localcontext(Context(prec=16)):
# All code in this block uses a precision of 16 digits.
# The original context is restored on exiting the block.
print v.sqrt()
Написання менеджерів контексту¶
Під капотом оператор „with
“ досить складний. Більшість людей використовуватимуть „with
“ тільки в компанії з існуючими об’єктами, і їм не потрібно знати ці деталі, тому ви можете пропустити решту цього розділу, якщо хочете. Авторам нових об’єктів потрібно буде зрозуміти деталі базової реалізації та продовжувати читати.
Загальне пояснення протоколу керування контекстом таке:
Вираз обчислюється та має призвести до об’єкта, який називається «менеджер контексту». Менеджер контексту повинен мати методи
__enter__()
і__exit__()
.Викликається метод
__enter__()
контекстного менеджера. Повернуте значення присвоюється VAR. Якщо пропозиціїas VAR
немає, значення просто відкидається.Код у BLOCK виконується.
Якщо BLOCK викликає виняток, викликається метод
__exit__()
контекстного менеджера з трьома аргументами, деталями виключення (тип, значення, відстеження
, ті самі значення, що повертаютьсяsys.exc_info()
, який також може бутиNone
, якщо винятків не сталося). Значення, яке повертає метод, контролює, чи повторно виникає виняток: будь-яке значення false повторно викликає виняток, аTrue
призведе до його придушення. Ви рідко захочете придушити виняток, тому що, якщо ви це зробите, автор коду, що містить оператор „with
“, ніколи не зрозуміє, що щось пішло не так.Якщо BLOCK не викликає винятку, метод
__exit__()
все одно викликається, але type, value і traceback мають значенняNone
.
Давайте поміркуємо на прикладі. Я не буду представляти детальний код, а лише накидаю методи, необхідні для бази даних, яка підтримує транзакції.
(Для людей, які не знайомі з термінологією бази даних: набір змін до бази даних групується в транзакцію. Транзакції можуть бути або зафіксованими, тобто всі зміни записуються в базу даних, або відкоченими, тобто всі зміни скасовуються та база даних не змінена. Для отримання додаткової інформації зверніться до будь-якого підручника з баз даних.)
Припустімо, що є об’єкт, що представляє з’єднання з базою даних. Нашою метою буде дозволити користувачеві писати такий код:
db_connection = DatabaseConnection()
with db_connection as cursor:
cursor.execute('insert into ...')
cursor.execute('delete from ...')
# ... more operations ...
Транзакцію слід зафіксувати, якщо код у блоці працює бездоганно, або відкотити, якщо є виняткова ситуація. Ось базовий інтерфейс для DatabaseConnection
, який я припускаю:
class DatabaseConnection:
# Database interface
def cursor(self):
"Returns a cursor object and starts a new transaction"
def commit(self):
"Commits current transaction"
def rollback(self):
"Rolls back current transaction"
Метод __enter__()
досить простий, вам потрібно лише почати нову транзакцію. Для цієї програми отриманий об’єкт курсора буде корисним результатом, тому метод поверне його. Потім користувач може додати as cursor
до свого оператора „with
“, щоб прив’язати курсор до імені змінної.
class DatabaseConnection:
...
def __enter__(self):
# Code to start a new transaction
cursor = self.cursor()
return cursor
Метод __exit__()
є найскладнішим, тому що в ньому потрібно виконати більшу частину роботи. Метод повинен перевірити, чи сталася виняткова ситуація. Якщо не було винятку, транзакція зафіксована. Транзакція відкочується, якщо стався виняток.
У наведеному нижче коді виконання просто припиниться в кінці функції, повертаючи значення за замовчуванням None
. None
є хибним, тому виняток буде знову створено автоматично. Якщо ви бажаєте, ви можете бути більш чіткими та додати оператор return
у позначене місце.
class DatabaseConnection:
...
def __exit__(self, type, value, tb):
if tb is None:
# No exception, so commit
self.commit()
else:
# Exception occurred, so rollback.
self.rollback()
# return False
Модуль contextlib¶
Модуль contextlib
надає деякі функції та декоратор, корисні під час написання об’єктів для використання з оператором „with
“.
Декоратор називається contextmanager()
і дозволяє писати одну функцію-генератор замість визначення нового класу. Генератор повинен видавати рівно одне значення. Код до yield
буде виконано як метод __enter__()
, а отримане значення буде поверненим значенням методу, яке буде прив’язано до змінної в „with
„ оператора as
пункт, якщо такий є. Код після yield
буде виконано в методі __exit__()
. Будь-які винятки, викликані в блоці, будуть викликані оператором yield
.
Використовуючи цей декоратор, наш приклад бази даних із попереднього розділу можна записати так:
from contextlib import contextmanager
@contextmanager
def db_transaction(connection):
cursor = connection.cursor()
try:
yield cursor
except:
connection.rollback()
raise
else:
connection.commit()
db = DatabaseConnection()
with db_transaction(db) as cursor:
...
Модуль contextlib
також має функцію nested(mgr1, mgr2, ...)
, яка поєднує кілька контекстних менеджерів, тому вам не потрібно писати вкладений „with
“ заяви. У цьому прикладі один оператор „with
“ запускає транзакцію бази даних і отримує блокування потоку:
lock = threading.Lock()
with nested (db_transaction(db), lock) as (cursor, locked):
...
Нарешті, функція closing()
повертає свій аргумент, щоб його можна було прив’язати до змінної, і викликає метод .close()
аргументу в кінці блоку.
import urllib, sys
from contextlib import closing
with closing(urllib.urlopen('http://www.yahoo.com')) as f:
for line in f:
sys.stdout.write(line)
Дивись також
- PEP 343 - оператор «з».
PEP, написаний Гвідо ван Россумом і Ніком Когланом; реалізований Майком Блендом, Гвідо ван Россумом і Нілом Норвітцем. PEP показує код, згенерований для оператора „
with
“, який може бути корисним для вивчення того, як працює оператор.
Документація для модуля contextlib
.
PEP 366: Явний відносний імпорт із основного модуля¶
Перемикач Python -m
дозволяє запускати модуль як сценарій. Коли ви запускали модуль, який знаходився всередині пакета, відносний імпорт не працював належним чином.
Виправлення для Python 2.6 додає атрибут __package__
до модулів. Якщо цей атрибут присутній, відносні імпорти будуть відносними до значення цього атрибута замість атрибута __name__
.
Потім імпортери у стилі PEP 302 можуть за потреби встановити __package__
. Модуль runpy
, який реалізує перемикач -m
, тепер робить це, тож відносний імпорт тепер працюватиме правильно у сценаріях, що виконуються зсередини пакета.
PEP 370: каталог site-packages
для кожного користувача¶
When you run Python, the module search path sys.path
usually
includes a directory whose path ends in "site-packages"
. This
directory is intended to hold locally-installed packages available to
all users using a machine or a particular site installation.
Python 2.6 представляє конвенцію для каталогів сайтів, призначених для користувача. Каталог залежить від платформи:
Unix і Mac OS X:
~/.local/
Windows:
%APPDATA%/Python
У цьому каталозі будуть підкаталоги для певної версії, наприклад lib/python2.6/site-packages
в Unix/Mac OS і Python26/site-packages
у Windows.
Якщо вам не подобається каталог за замовчуванням, його можна замінити змінною середовища. PYTHONUSERBASE
встановлює кореневий каталог для всіх версій Python, які підтримують цю функцію. У Windows каталог для даних програми можна змінити, встановивши змінну середовища APPDATA
. Ви також можете змінити файл site.py
для інсталяції Python.
Цю функцію можна повністю вимкнути, запустивши Python із параметром -s
або встановивши змінну середовища PYTHONNOUSERSITE
.
Дивись також
- PEP 370 - каталог
site-packages
для кожного користувача PEP написаний і реалізований Крістіаном Хеймсом.
PEP 371: Пакет multiprocessing
¶
Новий пакет multiprocessing
дозволяє програмам Python створювати нові процеси, які виконуватимуть обчислення та повертатимуть результат батьківському. Батьківський і дочірній процеси можуть спілкуватися за допомогою черг і каналів, синхронізувати свої операції за допомогою блокувань і семафорів, а також можуть обмінюватися простими масивами даних.
Модуль multiprocessing
починався як точна емуляція модуля threading
із використанням процесів замість потоків. Ця мета була відкинута на шляху до Python 2.6, але загальний підхід модуля все ще подібний. Основним класом є Process
, якому передається об’єкт, що викликається, і набір аргументів. Метод start()
встановлює виклик, що виконується в підпроцесі, після чого ви можете викликати метод is_alive()
, щоб перевірити, чи підпроцес все ще працює, і метод join()
, щоб дочекатися процес для виходу.
Ось простий приклад, коли підпроцес обчислить факториал. Функція, яка виконує обчислення, написана дивним чином, тому вона займає значно більше часу, коли вхідний аргумент кратний 4.
import time
from multiprocessing import Process, Queue
def factorial(queue, N):
"Compute a factorial."
# If N is a multiple of 4, this function will take much longer.
if (N % 4) == 0:
time.sleep(.05 * N/4)
# Calculate the result
fact = 1L
for i in range(1, N+1):
fact = fact * i
# Put the result on the queue
queue.put(fact)
if __name__ == '__main__':
queue = Queue()
N = 5
p = Process(target=factorial, args=(queue, N))
p.start()
p.join()
result = queue.get()
print 'Factorial', N, '=', result
Queue
використовується для передачі результату факториалу. Об’єкт Queue
зберігається в глобальній змінній. Дочірній процес використовуватиме значення змінної, коли був створений дочірній процес; оскільки це Queue
, батько і дитина можуть використовувати об’єкт для спілкування. (Якщо батько змінить значення глобальної змінної, це не вплине на значення дочірньої системи, і навпаки.)
Два інших класи, Pool
і Manager
, забезпечують інтерфейси вищого рівня. Pool
створить фіксовану кількість робочих процесів, а потім запити можна розповсюджувати серед робочих, викликаючи apply()
або apply_async()
, щоб додати один запит, і map()
або map_async()
, щоб додати кілька запитів. Наступний код використовує Pool
для розподілу запитів між 5 робочими процесами та отримання списку результатів:
from multiprocessing import Pool
def factorial(N, dictionary):
"Compute a factorial."
...
p = Pool(5)
result = p.map(factorial, range(1, 1000, 10))
for v in result:
print v
Це дає такий вихід:
1
39916800
51090942171709440000
8222838654177922817725562880000000
33452526613163807108170062053440751665152000000000
...
Інший інтерфейс високого рівня, клас Manager
, створює окремий серверний процес, який може зберігати головні копії структур даних Python. Потім інші процеси можуть отримувати доступ до цих структур даних і змінювати їх за допомогою проксі-об’єктів. У наступному прикладі створюється спільний словник шляхом виклику методу dict()
; робочі процеси потім вставляють значення в словник. (Блокування не виконується автоматично, що не має значення в цьому прикладі. Методи Manager
також включають Lock()
, RLock()
і Semaphore()
для створення спільних блокувань.)
import time
from multiprocessing import Pool, Manager
def factorial(N, dictionary):
"Compute a factorial."
# Calculate the result
fact = 1L
for i in range(1, N+1):
fact = fact * i
# Store result in dictionary
dictionary[N] = fact
if __name__ == '__main__':
p = Pool(5)
mgr = Manager()
d = mgr.dict() # Create shared dictionary
# Run tasks using the pool
for N in range(1, 1000, 10):
p.apply_async(factorial, (N, d))
# Mark pool as closed -- no more tasks can be added.
p.close()
# Wait for tasks to exit
p.join()
# Output results
for k, v in sorted(d.items()):
print k, v
Це дасть результат:
1 1
11 39916800
21 51090942171709440000
31 8222838654177922817725562880000000
41 33452526613163807108170062053440751665152000000000
51 15511187532873822802242430164693032110632597200169861120000...
Дивись також
Документація для модуля multiprocessing
.
- PEP 371 - Додано багатопроцесорний пакет
PEP, написаний Джессі Ноллером і Річардом Оудкерком; реалізовано Річардом Оудкерком і Джессі Ноллером.
PEP 3101: Розширене форматування рядків¶
In Python 3.0, the % operator is supplemented by a more powerful string
formatting method, format()
. Support for the str.format()
method
has been backported to Python 2.6.
In 2.6, both 8-bit and Unicode strings have a .format() method that treats the string as a template and takes the arguments to be formatted. The formatting template uses curly brackets ({, }) as special characters:
>>> # Substitute positional argument 0 into the string.
>>> "User ID: {0}".format("root")
'User ID: root'
>>> # Use the named keyword arguments
>>> "User ID: {uid} Last seen: {last_login}".format(
... uid="root",
... last_login = "5 Mar 2008 07:20")
'User ID: root Last seen: 5 Mar 2008 07:20'
Фігурні дужки можна екранувати, подвоюючи їх:
>>> "Empty dict: {{}}".format()
"Empty dict: {}"
Імена полів можуть бути цілими числами, що вказують на позиційні аргументи, такі як {0}, {1 тощо, або назви ключових аргументів. Ви також можете надати складені назви полів, які зчитують атрибути або мають доступ до ключів словника:
>>> import sys
>>> print 'Platform: {0.platform}\nPython version: {0.version}'.format(sys)
Platform: darwin
Python version: 2.6a1+ (trunk:61261M, Mar 5 2008, 20:29:41)
[GCC 4.0.1 (Apple Computer, Inc. build 5367)]'
>>> import mimetypes
>>> 'Content-type: {0[.mp4]}'.format(mimetypes.types_map)
'Content-type: video/mp4'
Зауважте, що використовуючи нотацію у стилі словника, наприклад [.mp4]
, вам не потрібно брати лапки навколо рядка; він шукатиме значення, використовуючи .mp4
як ключ. Рядки, що починаються з числа, будуть перетворені на ціле число. Ви не можете писати складніші вирази всередині рядка форматування.
Поки що ми показали, як вказати, яке поле підставляти в результуючий рядок. Використовуване точне форматування також можна контролювати, додавши двокрапку, за якою йде специфікатор формату. Наприклад:
>>> # Field 0: left justify, pad to 15 characters
>>> # Field 1: right justify, pad to 6 characters
>>> fmt = '{0:15} ${1:>6}'
>>> fmt.format('Registration', 35)
'Registration $ 35'
>>> fmt.format('Tutorial', 50)
'Tutorial $ 50'
>>> fmt.format('Banquet', 125)
'Banquet $ 125'
Специфікатори формату можуть посилатися на інші поля через вкладення:
>>> fmt = '{0:{1}}'
>>> width = 15
>>> fmt.format('Invoice #1234', width)
'Invoice #1234 '
>>> width = 35
>>> fmt.format('Invoice #1234', width)
'Invoice #1234 '
Можна вказати вирівнювання поля в межах бажаної ширини:
характер |
Ефект |
---|---|
< (за умовчанням) |
Вирівнювання по лівому краю |
> |
Вирівнювання по правому краю |
^ |
центр |
= |
(Лише для числових типів) Додайте після знака. |
Специфікатори формату також можуть містити тип представлення, який керує форматуванням значення. Наприклад, числа з плаваючою комою можна відформатувати як загальне число або в експоненціальній системі:
>>> '{0:g}'.format(3.75)
'3.75'
>>> '{0:e}'.format(3.75)
'3.750000e+00'
Доступні різноманітні типи презентацій. Зверніться до документації 2.6, щоб отримати повний список; ось зразок:
|
Двійковий. Виводить число за основою 2. |
|
характер. Перетворює ціле число на відповідний символ Unicode перед друком. |
|
Десяткове ціле число. Виводить число за основою 10. |
|
Вісімковий формат. Виводить число за основою 8. |
|
Шістнадцятковий формат. Виводить число за основою 16, використовуючи малі літери для цифр над 9. |
|
Запис степеня. Друкує число в науковому записі, використовуючи літеру «e» для позначення степеня. |
|
Загальний формат. Це друкує число як число з фіксованою комою, за винятком випадків, коли число надто велике, і в цьому випадку воно перемикається на позначення ступеня «e». |
|
Номер. Це те саме, що «g» (для чисел з плаваючою точкою) або «d» (для цілих чисел), за винятком того, що для вставки відповідних символів-роздільників використовуються поточні параметри мови. |
|
Відсоток. Множить число на 100 і відображається у фіксованому форматі („f“) із знаком відсотка. |
Класи та типи можуть визначати метод __format__()
для керування їх форматуванням. Він отримує єдиний аргумент, специфікатор формату:
def __format__(self, format_spec):
if isinstance(format_spec, unicode):
return unicode(str(self))
else:
return str(self)
Існує також вбудований format()
, який форматує одне значення. Він викликає метод типу __format__()
із наданим специфікатором:
>>> format(75.6564, '.2f')
'75.66'
Дивись також
- Синтаксис рядка формату
Довідкова документація для полів формату.
- PEP 3101 - Розширене форматування рядків
PEP, написаний Таліним. Реалізовано Еріком Смітом.
PEP 3105: друк
як функція¶
Оператор print
стає функцією print()
у Python 3.0. Зробивши print()
функцією, можна замінити функцію, виконавши def print(...)
або імпортувавши нову функцію з іншого місця.
У Python 2.6 є імпорт __future__
, який видаляє print
як синтаксис мови, дозволяючи замість цього використовувати функціональну форму. Наприклад:
>>> from __future__ import print_function
>>> print('# of entries', len(dictionary), file=sys.stderr)
Сигнатура нової функції:
def print(*args, sep=' ', end='\n', file=None)
Параметри такі:
args: позиційні аргументи, значення яких буде роздруковано.
sep: роздільник, який буде надруковано між аргументами.
end: кінцевий текст, який буде надруковано після виведення всіх аргументів.
file: файловий об’єкт, до якого буде надіслано вивід.
Дивись також
- PEP 3105 - Зробити друк функцією
PEP, написаний Георгом Брандлом.
PEP 3110: Зміни обробки винятків¶
Однією з помилок, яку іноді роблять програмісти Python, є написання наступного коду:
try:
...
except TypeError, ValueError: # Wrong!
...
Автор, ймовірно, намагається перехопити винятки TypeError
і ValueError
, але цей код насправді робить щось інше: він перехопить TypeError
і прив’яже отриманий об’єкт винятку до локальної назви "ValueError"
. Виняток ValueError
не буде перехоплено взагалі. Правильний код визначає кортеж винятків:
try:
...
except (TypeError, ValueError):
...
Ця помилка виникає через те, що використання коми тут неоднозначне: чи вказує вона на два різні вузли в дереві розбору, чи на один вузол, який є кортежем?
Python 3.0 робить це однозначним, замінюючи кому словом «як». Щоб перехопити виняток і зберегти об’єкт винятку в змінній exc
, ви повинні написати:
try:
...
except TypeError as exc:
...
Python 3.0 підтримуватиме лише використання «as», і тому інтерпретує перший приклад як перехоплення двох різних винятків. Python 2.6 підтримує як кому, так і «as», тому наявний код працюватиме й надалі. Тому ми пропонуємо використовувати «as» під час написання нового коду Python, який виконуватиметься лише з 2.6.
Дивись також
- PEP 3110 - Перехоплення винятків у Python 3000
PEP написав і реалізував Колін Вінтер.
PEP 3112: Байтові літерали¶
Python 3.0 використовує Unicode як основний рядковий тип мови та позначає 8-бітні літерали по-різному, або як b'string'
, або за допомогою конструктора bytes
. Для майбутньої сумісності Python 2.6 додає bytes
як синонім для типу str
, а також підтримує нотацію b''
.
Тип str
2.6 відрізняється від типу bytes
3.0 різними способами; головне, що конструктор зовсім інший. У 3.0 bytes([65, 66, 67])
складається з 3 елементів, які містять байти, що представляють ABC
; у версії 2.6 bytes([65, 66, 67])
повертає 12-байтовий рядок, який представляє str()
списку.
Основним використанням bytes
у 2.6 буде написання тестів типу об’єкта, наприклад isinstance(x, bytes)
. Це допоможе конвертеру 2to3, який не може визначити, чи код 2.x передбачає, що рядки містять символи чи 8-бітні байти; Тепер ви можете використовувати або bytes
, або str
, щоб точно представити свій намір, і отриманий код також буде правильним у Python 3.0.
Існує також імпорт __future__
, завдяки якому всі рядкові літерали стають рядками Unicode. Це означає, що керуючі послідовності \u
можна використовувати для включення символів Unicode:
from __future__ import unicode_literals
s = ('\u751f\u3080\u304e\u3000\u751f\u3054'
'\u3081\u3000\u751f\u305f\u307e\u3054')
print len(s) # 12 Unicode characters
На рівні C Python 3.0 перейменує існуючий 8-бітний рядковий тип, що називається PyStringObject
у Python 2.x, на PyBytesObject
. Python 2.6 використовує #define
для підтримки використання імен PyBytesObject()
, PyBytes_Check()
, PyBytes_FromStringAndSize()
, а також усіх інших функцій і макросів, які використовуються з рядки.
Екземпляри типу bytes
незмінні, як і рядки. Новий тип bytearray
зберігає змінну послідовність байтів:
>>> bytearray([65, 66, 67])
bytearray(b'ABC')
>>> b = bytearray(u'\u21ef\u3244', 'utf-8')
>>> b
bytearray(b'\xe2\x87\xaf\xe3\x89\x84')
>>> b[0] = '\xe3'
>>> b
bytearray(b'\xe3\x87\xaf\xe3\x89\x84')
>>> unicode(str(b), 'utf-8')
u'\u31ef \u3244'
Байтові масиви підтримують більшість методів типів рядків, таких як startswith()
/endswith()
, find()
/rfind()
, а також деякі методи списків, наприклад як append()
, pop()
і reverse()
.
>>> b = bytearray('ABC')
>>> b.append('d')
>>> b.append(ord('e'))
>>> b
bytearray(b'ABCde')
Існує також відповідний C API з PyByteArray_FromObject()
, PyByteArray_FromStringAndSize()
та різними іншими функціями.
Дивись також
- PEP 3112 - Байтові літерали в Python 3000
PEP, написаний Джейсоном Орендорфом; перенесено до 2.6 Крістіаном Хеймсом.
PEP 3116: Нова бібліотека введення-виведення¶
Вбудовані файлові об’єкти Python підтримують низку методів, але файлоподібні об’єкти не обов’язково підтримують усі з них. Об’єкти, які імітують файли, зазвичай підтримують read()
і write()
, але вони можуть не підтримувати, наприклад, readline()
. Python 3.0 представляє багаторівневу бібліотеку вводу-виводу в модулі io
, яка відокремлює функції буферизації та обробки тексту від основних операцій читання та запису.
Модуль io
пропонує три рівні абстрактних базових класів:
RawIOBase
визначає необроблені операції введення-виведення:read()
,readinto()
,write()
,seek()
,tell()
,truncate()
іclose()
. Більшість методів цього класу часто відображаються на один системний виклик. Існують також методиreadable()
,writable()
іseekable()
для визначення того, які операції дозволятиме певний об’єкт.У Python 3.0 є конкретні реалізації цього класу для файлів і сокетів, але Python 2.6 не реструктурував свої об’єкти файлів і сокетів таким чином.
BufferedIOBase
— це абстрактний базовий клас, який буферизує дані в пам’яті, щоб зменшити кількість використовуваних системних викликів, що робить обробку вводу-виводу більш ефективною. Він підтримує всі методиRawIOBase
і додає атрибутraw
, що містить базовий необроблений об’єкт.Є п’ять конкретних класів, що реалізують цю ABC.
BufferedWriter
іBufferedReader
призначені для об’єктів, які підтримують використання лише для запису або лише для читання, які мають методseek()
для довільного доступу. Об’єктиBufferedRandom
підтримують доступ для читання та запису до одного основного потоку, аBufferedRWPair
призначений для таких об’єктів, як TTY, які мають операції читання та запису, що діють на незв’язані потоки даних. КласBytesIO
підтримує читання, запис і пошук у буфері в пам’яті.TextIOBase
: забезпечує функції для читання та запису рядків (пам’ятайте, що рядки будуть Unicode в Python 3.0), а також підтримує universal newlines.TextIOBase
визначає методreadline()
і підтримує ітерацію по об’єктах.Є дві конкретні реалізації.
TextIOWrapper
обгортає буферизований об’єкт введення-виведення, підтримуючи всі методи текстового вводу-виводу та додаючи атрибутbuffer
для доступу до основного об’єкта.StringIO
просто буферизує все в пам’яті, не записуючи нічого на диск.(У Python 2.6
io.StringIO
реалізовано на чистому Python, тому він досить повільний. Тому наразі вам слід дотримуватися існуючого модуляStringIO
абоcStringIO
. вказуйте на те, що модуль Python 3.0io
буде переписано на C для підвищення швидкості, і, можливо, реалізацію C буде перенесено до випусків 2.x.)
У Python 2.6 базові реалізації не були реструктуризовані для створення поверх класів модуля io
. Модуль надається, щоб спростити написання коду, сумісного з версією 3.0, і позбавити розробників від зусиль написання власних реалізацій буферизації та текстового введення-виведення.
Дивись також
- PEP 3116 - Новий I/O
PEP, написаний Даніелем Штуцбахом, Майком Вердоне та Гвідо ван Россумом. Код Гвідо ван Россума, Георга Брандла, Уолтера Доервальда, Джеремі Гілтона, Мартіна фон Льовіса, Тоні Лоундса та інших.
PEP 3118: Переглянутий буферний протокол¶
Буферний протокол — це API рівня C, який дозволяє типам Python обмінюватися покажчиками на свої внутрішні представлення. Файл із відображенням пам’яті можна розглядати, наприклад, як буфер символів, і це дозволяє іншому модулю, такому як re
розглядати файли, відображені в пам’яті, як рядок символів для пошуку.
Основними користувачами протоколу буфера є пакети числової обробки, такі як NumPy, які відкривають внутрішнє представлення масивів, щоб абоненти могли записувати дані безпосередньо в масив замість використання повільнішого API. Цей PEP оновлює протокол буфера в світлі досвіду розробки NumPy, додаючи ряд нових функцій, таких як вказівка форми масиву або блокування області пам’яті.
Найважливішою новою функцією C API є PyObject_GetBuffer(PyObject *obj, Py_buffer *view, int flags)
, яка приймає об’єкт і набір прапорів і заповнює структуру Py_buffer
інформацією про представлення пам’яті об’єкта. Об’єкти можуть використовувати цю операцію для блокування пам’яті на місці, поки зовнішній виклик може модифікувати вміст, тому існує відповідний PyBuffer_Release(Py_buffer *view)
, щоб вказати, що зовнішній виклик завершив роботу.
Аргумент flags для PyObject_GetBuffer()
визначає обмеження щодо пам’яті, що повертається. Деякі приклади:
PyBUF_WRITABLE
вказує, що пам’ять має бути доступною для запису.
PyBUF_LOCK
запитує блокування пам’яті лише для читання або виключного блокування.
PyBUF_C_CONTIGUOUS
іPyBUF_F_CONTIGUOUS
запитує C-суміжний (останній вимір змінюється найшвидше) або Fortran-суміжний (перший вимір змінюється найшвидше) макет масиву.
Два нові коди аргументів для PyArg_ParseTuple()
, s*
і z*
повертають заблоковані об’єкти буфера для параметра.
Дивись також
- PEP 3118 - Перегляд буферного протоколу
PEP, написаний Тревісом Оліфантом і Карлом Бенксом; реалізований Тревісом Оліфантом.
PEP 3119: Абстрактні базові класи¶
Деякі об’єктно-орієнтовані мови, такі як Java, підтримують інтерфейси, декларуючи, що клас має заданий набір методів або підтримує певний протокол доступу. Абстрактні базові класи (або ABC) є еквівалентною функцією для Python. Підтримка ABC складається з модуля abc
, який містить метаклас під назвою ABCMeta
, спеціальну обробку цього метакласу вбудованими модулями isinstance()
і issubclass()
, а також колекцію основні азбуки, які, на думку розробників Python, будуть широко корисними. Майбутні версії Python, ймовірно, додадуть більше азбуки.
Припустімо, у вас є певний клас і ви бажаєте знати, чи підтримує він доступ у стилі словника. Проте фраза «словниковий стиль» розпливчаста. Можливо, це означає, що доступ до елементів за допомогою obj[1]
працює. Чи означає це, що встановлення елементів за допомогою obj[2] = value
працює? Або що об’єкт матиме методи keys()
, values()
і items()
? А як щодо ітеративних варіантів, таких як iterkeys()
? copy()
і update()
? Ітерація об’єкта за допомогою iter()
?
Модуль Python 2.6 collections
містить кілька різних азбуки, які представляють ці відмінності. Iterable
вказує, що клас визначає __iter__()
, а Container
означає, що клас визначає метод __contains__()
і тому підтримує вирази x в y
. Базовий інтерфейс словника для отримання елементів, налаштування елементів і keys()
, values()
і items()
визначається MutableMapping
ABC.
Ви можете вивести власні класи з конкретного ABC, щоб вказати, що вони підтримують цей інтерфейс ABC:
import collections
class Storage(collections.MutableMapping):
...
Крім того, ви можете написати клас, не виходячи з бажаного ABC, а замість цього зареєструвати клас, викликавши метод register()
ABC:
import collections
class Storage:
...
collections.MutableMapping.register(Storage)
Для класів, які ви пишете, виведення з ABC, ймовірно, більш зрозуміле. Метод register()
корисний, коли ви написали новий ABC, який може описати існуючий тип або клас, або якщо ви хочете оголосити, що якийсь сторонній клас реалізує ABC. Наприклад, якщо ви визначили PrintableType
ABC, це законно:
# Register Python's types
PrintableType.register(int)
PrintableType.register(float)
PrintableType.register(str)
Класи повинні підкорятися семантиці, визначеній ABC, але Python не може перевірити це; автор класу повинен зрозуміти вимоги ABC і відповідним чином реалізувати код.
Щоб перевірити, чи підтримує об’єкт певний інтерфейс, тепер можна написати:
def func(d):
if not isinstance(d, collections.MutableMapping):
raise ValueError("Mapping object expected, not %r" % d)
Не думайте, що вам потрібно починати виписувати багато чеків, як у наведеному вище прикладі. Python має сильну традицію качиного введення, коли явна перевірка типу ніколи не виконується, а код просто викликає методи об’єкта, вірячи, що ці методи будуть присутні, і створює виняток, якщо їх немає. Будьте розсудливими, перевіряючи наявність азбуки, і робіть це лише там, де це абсолютно необхідно.
Ви можете написати власні азбуки, використовуючи abc.ABCMeta
як метаклас у визначенні класу:
from abc import ABCMeta, abstractmethod
class Drawable():
__metaclass__ = ABCMeta
@abstractmethod
def draw(self, x, y, scale=1.0):
pass
def draw_doubled(self, x, y):
self.draw(x, y, scale=2.0)
class Square(Drawable):
def draw(self, x, y, scale):
...
У Drawable
ABC вище метод draw_doubled()
відтворює об’єкт у удвічі більшому розмірі та може бути реалізований у термінах інших методів, описаних у Drawable
. Тому класам, що реалізують цей ABC, не потрібно надавати власну реалізацію draw_doubled()
, хоча вони можуть це зробити. Однак реалізація draw()
необхідна; ABC не може забезпечити корисну загальну реалізацію.
Ви можете застосувати декоратор @abstractmethod
до таких методів, як draw()
, які повинні бути реалізовані; Потім Python викличе виняток для класів, які не визначають метод. Зауважте, що виняток виникає лише тоді, коли ви фактично намагаєтеся створити екземпляр підкласу без методу:
>>> class Circle(Drawable):
... pass
...
>>> c = Circle()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Can't instantiate abstract class Circle with abstract methods draw
>>>
Атрибути абстрактних даних можна оголосити за допомогою декоратора @abstractproperty
:
from abc import abstractproperty
...
@abstractproperty
def readonly(self):
return self._x
Тоді підкласи повинні визначати властивість readonly()
.
Дивись також
- PEP 3119 - Представляємо абстрактні базові класи
PEP, написаний Гвідо ван Россумом і Таліном. Реалізовано Гвідо ван Россумом. Перенесено до 2.6 Бенджаміном Арангуреном разом з Алексом Мартеллі.
PEP 3127: Підтримка цілочисельного літералу та синтаксис¶
Python 3.0 змінює синтаксис для вісімкових (за основою 8) цілих літералів, додаючи до них префікс «0o» або «0O» замість початкового нуля, і додає підтримку двійкових (за основою 2) цілих літералів, що позначаються «0b» або префікс «0B».
Python 2.6 не припиняє підтримку початкового 0, що сигналізує про вісімкове число, але додає підтримку «0o» і «0b»:
>>> 0o21, 2*8 + 1
(17, 17)
>>> 0b101111
47
Вбудована функція oct()
все ще повертає числа з префіксом нуля на початку, а нова вбудована функція bin()
повертає двійкове представлення числа:
>>> oct(42)
'052'
>>> future_builtins.oct(42)
'0o52'
>>> bin(173)
'0b10101101'
Вбудовані модулі int()
і long()
тепер прийматимуть префікси «0o» і «0b», коли надсилається запит base-8 або base-2 або коли аргумент base дорівнює нулю (сигналізуючи про те, що використовувану базу слід визначати з рядка):
>>> int ('0o52', 0)
42
>>> int('1101', 2)
13
>>> int('0b1101', 2)
13
>>> int('0b1101', 0)
13
Дивись також
- PEP 3127 - Підтримка цілочисельного літералу та синтаксис
PEP, написаний Патріком Мопіном; повернуто до 2.6 Еріком Смітом.
PEP 3129: Декоратори класу¶
Декоратори були розширені з функцій до класів. Тепер можна писати:
@foo
@bar
class A:
pass
Це еквівалентно:
class A:
pass
A = foo(bar(A))
Дивись також
- PEP 3129 - Декоратори класу
PEP, автор Колін Вінтер.
PEP 3141: Ієрархія типів чисел¶
Python 3.0 додає кілька абстрактних базових класів для числових типів, натхненних числовою вежею Scheme. Ці класи було перенесено до версії 2.6 як модуль numbers
.
Найбільш загальна ABC – це Number
. Він не визначає жодних операцій і існує лише для того, щоб дозволити перевірити, чи є об’єкт числом, виконавши isinstance(obj, Number)
.
Complex
є підкласом Number
. З комплексними числами можна виконувати основні операції додавання, віднімання, множення, ділення та піднесення до степеня, і ви можете отримати дійсну та уявну частини та отримати сполучене число. Вбудований комплексний тип Python є реалізацією Complex
.
Real
далі походить від Complex
і додає операції, які працюють лише з дійсними числами: floor()
, trunc()
, округлення, отримання залишку за модулем N, поверхове ділення , і порівняння.
Rational
числа походять від Real
, мають властивості numerator
і denominator
і можуть бути перетворені на числа з плаваючою точкою. Python 2.6 додає простий клас раціональних чисел, Fraction
, у модуль fractions
. (Це називається Fraction
замість Rational
, щоб уникнути зіткнення назв із numbers.Rational
.)
Integral
числа походять від Rational
і можуть бути зсунуті ліворуч і праворуч за допомогою <<
and >>
, поєднані за допомогою побітових операцій, таких як &
і |
, і можна використовувати як індекси масиву та межі зрізів.
У Python 3.0 PEP дещо перевизначає існуючі вбудовані функції round()
, math.floor()
, math.ceil()
і додає нову, math.trunc()
, який було перенесено на Python 2.6. math.trunc()
округляє до нуля, повертаючи найближчий Integral
, який знаходиться між аргументом функції та нулем.
Дивись також
- PEP 3141 - Ієрархія типів для чисел
PEP, написаний Джеффрі Яскіним.
Числова вежа схеми, з посібника Guile.
Scheme’s number datatypes from the R5RS Scheme specification.
Модуль fractions
¶
Щоб заповнити ієрархію числових типів, модуль fractions
надає клас раціональних чисел. Раціональні числа зберігають свої значення як чисельник і знаменник, утворюючи дріб, і можуть точно представляти числа, такі як 2/3
, які числа з плаваючою комою можуть лише приблизно оцінити.
Конструктор Fraction
приймає два значення Integral
, які будуть чисельником і знаменником отриманого дробу.
>>> from fractions import Fraction
>>> a = Fraction(2, 3)
>>> b = Fraction(2, 5)
>>> float(a), float(b)
(0.66666666666666663, 0.40000000000000002)
>>> a+b
Fraction(16, 15)
>>> a/b
Fraction(5, 3)
Для перетворення чисел з плаваючою комою на раціональні числа тип float тепер має метод as_integer_ratio()
, який повертає чисельник і знаменник для дробу, який має однакове значення з плаваючою комою:
>>> (2.5) .as_integer_ratio()
(5, 2)
>>> (3.1415) .as_integer_ratio()
(7074029114692207L, 2251799813685248L)
>>> (1./3) .as_integer_ratio()
(6004799503160661L, 18014398509481984L)
Зауважте, що значення, які можна апроксимувати лише числами з плаваючою комою, наприклад 1./3, не спрощуються до числа, яке апроксимується; дріб намагається точно збігатися зі значенням з плаваючою комою.
Модуль fractions
базується на реалізації Sjoerd Mullender, яка довгий час була в каталозі Demo/classes/
Python. Ця реалізація була значно оновлена Джеффрі Яскіним.
Інші зміни мови¶
Деякі менші зміни, внесені до основної мови Python:
Каталоги та zip-архіви, що містять файл
__main__.py
, тепер можна виконувати безпосередньо, передавши їх імена інтерпретатору. Каталог або zip-архів автоматично вставляється як перший запис у sys.path. (Пропозиція та початковий патч Енді Чу, згодом переглянуті Філіпом Дж. Ебі та Ніком Когланом; bpo-1739468.)Функція
hasattr()
виловлювала та ігнорувала всі помилки, припускаючи, що вони означають, що метод__getattr__()
якимось чином не працює, і значення, яке повертаєhasattr()
, будеFalse
. Однак цю логіку не слід застосовувати доKeyboardInterrupt
іSystemExit
; Python 2.6 більше не відкидає такі винятки, колиhasattr()
зустрічає їх. (Виправлено Бенджаміном Петерсоном; bpo-2196.)Під час виклику функції за допомогою синтаксису
**
для надання ключових аргументів вам більше не потрібно використовувати словник Python; будь-яке відображення тепер працюватиме:>>> def f(**kw): ... print sorted(kw) ... >>> ud=UserDict.UserDict() >>> ud['a'] = 1 >>> ud['b'] = 'string' >>> f(**ud) ['a', 'b']
(Надав Олександр Бєлопольський; bpo-1686487.)
Також стало законним надавати аргументи ключового слова після аргументу
*args
для виклику функції.>>> def f(*args, **kw): ... print args, kw ... >>> f(1,2,3, *(4,5,6), keyword=13) (1, 2, 3, 4, 5, 6) {'keyword': 13}
Раніше це була синтаксична помилка. (Надав Аморі Форже д’Арк; bpo-3473.)
Нова вбудована функція
next(iterator, [default])
повертає наступний елемент із зазначеного ітератора. Якщо вказано аргумент default, він буде повернений, якщо iterator вичерпано; інакше буде викликано винятокStopIteration
. (Бекпортовано в bpo-2719.)Кортежі тепер мають методи
index()
іcount()
, що відповідають методамindex()
іcount()
типу списку:>>> t = (0,1,2,3,4,0,1,2) >>> t.index(3) 3 >>> t.count(0) 2
(Надав Реймонд Геттінгер)
Вбудовані типи тепер мають покращену підтримку розширеного синтаксису нарізки, приймаючи різні комбінації
(початок, зупинка, крок)
. Раніше підтримка була частковою, і певні кутові випадки не працювали. (Реалізовано Томасом Воутерсом.)Властивості тепер мають три атрибути,
getter
,setter
іdeleter
, які є декораторами, що надають корисні ярлики для додавання функції отримання, налаштування або видалення до існуючої властивості. Ви б використали їх так:class C(object): @property def x(self): return self._x @x.setter def x(self, value): self._x = value @x.deleter def x(self): del self._x class D(C): @C.x.getter def x(self): return self._x * 2 @x.setter def x(self, value): self._x = value / 2
Кілька методів вбудованих типів наборів тепер приймають кілька ітерацій:
intersection()
,intersection_update()
,union()
,update()
,difference()
іdifference_update()
.>>> s=set('1234567890') >>> s.intersection('abc123', 'cdf246') # Intersection between all inputs set(['2']) >>> s.difference('246', '789') set(['1', '0', '3', '5'])
(Надав Реймонд Геттінгер.)
Було додано багато функцій з плаваючою комою. Функція
float()
тепер перетворить рядокnan
на значення IEEE 754 Not A Number, а+inf
і-inf
на позитивну або негативну нескінченність. Це працює на будь-якій платформі із семантикою IEEE 754. (Надав Крістіан Хаймес; bpo-1635.)Інші функції в модулі
math
,isinf()
іisnan()
, повертають істину, якщо їхній аргумент із плаваючою комою є нескінченним або не є числом. (bpo-1640)Було додано функції перетворення для перетворення чисел з плаваючою комою в шістнадцяткові рядки (bpo-3008). Ці функції перетворюють числа з плаваючою точкою в рядкове представлення та з нього, не вводячи помилок округлення через перетворення між десятковим і двійковим. Поплавки мають метод
hex()
, який повертає представлення рядка, а методfloat.fromhex()
перетворює рядок назад у число:>>> a = 3.75 >>> a.hex() '0x1.e000000000000p+1' >>> float.fromhex('0x1.e000000000000p+1') 3.75 >>> b=1./3 >>> b.hex() '0x1.5555555555555p-2'
Числова тонкість: під час створення комплексного числа з двох чисел з плаваючою точкою в системах, які підтримують нулі зі знаком (-0 і +0), конструктор
complex()
тепер збереже знак нуля. (Виправлено Марком Т. Дікінсоном; bpo-1507.)Класи, які успадковують метод
__hash__()
від батьківського класу, можуть встановити__hash__ = None
, щоб вказати, що клас не можна хешувати. Це змуситьhash(obj)
викликатиTypeError
і клас не буде вказано як реалізованийHashable
ABC.Ви повинні зробити це, коли ви визначили метод
__cmp__()
або__eq__()
, який порівнює об’єкти за їх значенням, а не за ідентичністю. Усі об’єкти мають хеш-метод за замовчуванням, який використовуєid(obj)
як хеш-значення. Немає простого способу видалити метод__hash__()
, успадкований від батьківського класу, тому призначенняNone
було реалізовано як перевизначення. На рівні C розширення можуть встановитиtp_hash
наPyObject_HashNotImplemented()
. (Виправлено Ніком Когланом і Аморі Форже д’Арк; bpo-2235.)Виняток
GeneratorExit
тепер є підкласамиBaseException
замістьException
. Це означає, що обробник винятків, який виконуєexcept Exception:
, не буде випадково перехоплюватиGeneratorExit
. (Надав Чед Остін; bpo-1537.)Об’єкти генератора тепер мають атрибут
gi_code
, який посилається на оригінальний об’єкт коду, що підтримує генератор. (Надав Колін Вінтер; bpo-1473257.)Вбудована функція
compile()
тепер приймає аргументи ключових слів, а також позиційні параметри. (Надав Томас Воутерс; bpo-1444529.)Конструктор
complex()
тепер приймає рядки, що містять комплексні числа в круглих дужках, що означає, щоcomplex(repr(cplx))
тепер передаватиме значення. Наприклад,complex('(3+4j)')
тепер повертає значення (3+4j). (bpo-1491866)Метод string
translate()
тепер приймаєNone
як параметр таблиці перекладу, який розглядається як трансформація ідентичності. Це полегшує виконання операцій, які видаляють лише символи. (Надано Бенгтом Ріхтером і реалізовано Раймондом Геттінгером; bpo-1193128.)Вбудована функція
dir()
тепер перевіряє наявність методу__dir__()
для об’єктів, які вона отримує. Цей метод має повертати список рядків, що містять назви дійсних атрибутів для об’єкта, і дозволяє об’єкту контролювати значення, яке створюєdir()
. Об’єкти, які мають методи__getattr__()
або__getattribute__()
, можуть використовувати це для реклами псевдоатрибутів, які вони вважатимуть. (bpo-1591665)Об’єкти методу екземпляра мають нові атрибути для об’єкта та функції, що включає метод; новий синонім
im_self
—__self__
, аim_func
також доступний як__func__
. Старі назви все ще підтримуються в Python 2.6, але зникли в 3.0.Незрозуміла зміна: коли ви використовуєте функцію
locals()
всередині оператораclass
, отриманий словник більше не повертає вільні змінні. (У цьому випадку вільні змінні — це змінні, на які посилається операторclass
, які не є атрибутами класу.)
Оптимізації¶
Модуль
warnings
було переписано мовою C. Це дає змогу викликати попередження від аналізатора, а також може пришвидшити запуск інтерпретатора. (Надано Нілом Норвітцем і Бреттом Кенноном; bpo-1631171.)Об’єкти типу тепер мають кеш методів, що може зменшити роботу, необхідну для пошуку правильної реалізації методу для певного класу; після кешування інтерпретатору не потрібно проходити базові класи, щоб визначити правильний метод для виклику. Кеш очищається, якщо базовий клас або сам клас змінено, тому кеш має залишатися правильним навіть з огляду на динамічну природу Python. (Оригінальна оптимізація реалізована Арміном Ріго, оновлена для Python 2.6 Кевіном Джейкобсом; bpo-1700288.)
За замовчуванням ця зміна застосовується лише до типів, які входять до складу ядра Python. Модулі розширення можуть не обов’язково бути сумісними з цим кешем, тому вони повинні явно додати
Py_TPFLAGS_HAVE_VERSION_TAG
до поляtp_flags
модуля, щоб увімкнути кеш методів. (Щоб бути сумісним із кешем методів, код модуля розширення не повинен напряму отримувати доступ до членаtp_dict
будь-якого з типів, які він реалізує, і змінювати його. Більшість модулів цього не роблять, але інтерпретатор Python не може визначте це. Перегляньте bpo-1878 для деякого обговорення.)Виклики функцій, які використовують ключові аргументи, значно пришвидшуються завдяки швидкому порівнянню вказівників, що зазвичай економить час на повне порівняння рядків. (Надано Реймондом Геттінгером, після початкової реалізації Антуаном Пітру; bpo-1819.)
Усі функції в модулі
struct
були переписані мовою C завдяки роботі над спринтом Need For Speed. (Надав Реймонд Геттінгер.)Деякі зі стандартних вбудованих типів тепер встановлюють біт у своїх об’єктах типу. Це прискорює перевірку того, чи є об’єкт підкласом одного з цих типів. (Надав Ніл Норвіц.)
Рядки Unicode тепер використовують швидший код для виявлення пробілів і розривів рядків; це прискорює метод
split()
приблизно на 25% іsplitlines()
на 35%. (Надано Антуаном Пітру.) Використання пам’яті зменшується завдяки використанню pymalloc для даних рядка Unicode.Оператор
with
тепер зберігає метод__exit__()
у стеку, створюючи невелике прискорення. (Реалізовано Джеффрі Яскіним.)Щоб зменшити використання пам’яті, збирач сміття тепер очищатиме внутрішні вільні списки під час збирання сміття найвищого покоління об’єктів. Це може швидше повернути пам’ять операційній системі.
Зміни перекладача¶
Два параметри командного рядка були зарезервовані для використання іншими реалізаціями Python. Перемикач -J
було зарезервовано для використання Jython для параметрів Jython, таких як перемикачі, які передаються базовій JVM. -X
було зарезервовано для параметрів, специфічних для конкретної реалізації Python, наприклад CPython, Jython або IronPython. Якщо будь-яка з опцій використовується з Python 2.6, інтерпретатор повідомить, що ця опція наразі не використовується.
Тепер Python можна заборонити записувати файли .pyc
або .pyo
, вказавши перемикач -B
інтерпретатору Python або налаштувавши середовище PYTHONDONTWRITEBYTECODE
перед запуском інтерпретатора. Цей параметр доступний для програм Python як змінна sys.dont_write_bytecode
, і код Python може змінити значення, щоб змінити поведінку інтерпретатора. (Надано Нілом Норвітцем і Георгом Брандлом.)
Кодування, що використовується для стандартного введення, виведення та стандартної помилки, можна вказати, встановивши змінну середовища PYTHONIOENCODING
перед запуском інтерпретатора. Значення має бути рядком у формі <encoding>
або <encoding> : <errorhandler>
. Частина encoding визначає назву кодування, напр. utf-8
або latin-1
; необов’язкова частина errorhandler визначає, що робити з символами, які не можуть бути оброблені кодуванням, і має бути одним із «помилка», «ігнорувати» або «замінити». (Надав Мартін фон Льовіс.)
Нові та вдосконалені модулі¶
Як і в кожному випуску, стандартна бібліотека Python отримала низку вдосконалень і виправлень помилок. Ось неповний список найбільш помітних змін, відсортованих за алфавітом назв модулів. Зверніться до файлу Misc/NEWS
у дереві вихідних кодів, щоб отримати більш повний список змін, або перегляньте журнали Subversion, щоб отримати всі деталі.
Модулі
asyncore
іasynchat
знову активно обслуговуються, і було застосовано ряд патчів і виправлень помилок. (Підтримується Josiah Carlson; див. bpo-1736190 для одного патча.)Модуль
bsddb
також має новий супроводжувач, Jesús Cea Avión, і пакет тепер доступний як окремий пакет. Веб-сторінка пакета – www.jcea.es/programacion/pybsddb.htm. Планується видалити пакет зі стандартної бібліотеки Python 3.0, оскільки його випуски виходять набагато частіше, ніж у Python.Модуль
bsddb.dbshelve
тепер використовує найвищий доступний протокол травлення, замість того, щоб обмежуватися протоколом 1. (Надано W. Barnes.)Модуль
cgi
тепер читатиме змінні з рядка запиту запиту HTTP POST. Це дає змогу використовувати дії форми з URL-адресами, які містять рядки запиту, такі як «/cgi-bin/add.py?category=1». (Надано Александром Фіорі та Nubis; bpo-1817.)Функції
parse_qs()
іparse_qsl()
було переміщено з модуляcgi
до модуляurlparse
. Версії, які все ще доступні в модуліcgi
, запускатимуть повідомленняPendingDeprecationWarning
у 2.6 (bpo-600362).Модуль
cmath
зазнав значної редакції, внесеної Марком Дікінсоном і Крістіаном Хеймсом. Додано п’ять нових функцій:polar()
перетворює комплексне число на полярну форму, повертаючи модуль і аргумент комплексного числа.rect()
робить навпаки, перетворюючи модуль, пару аргументів назад у відповідне комплексне число.phase()
повертає аргумент (також званий кутом) комплексного числа.isnan()
повертає True, якщо дійсна чи уявна частина його аргументу є NaN.isinf()
повертає True, якщо дійсна чи уявна частина аргументу нескінченна.
Ревізії також покращили чисельну надійність модуля
cmath
. Для всіх функцій дійсна та уявна частини результатів мають точність у межах кількох одиниць найменшої точності (ulps), коли це можливо. Докладніше див. bpo-1381. Також було виправлено скорочення гілок дляasinh()
,atanh()
: іatan()
.Значно розширено тести для модуля; Майже 2000 нових тестів використовують алгебраїчні функції.
На платформах IEEE 754 модуль
cmath
тепер обробляє спеціальні значення IEEE 754 і винятки з плаваючою комою відповідно до додатку „G“ стандарту C99.Новий тип даних у модулі
collections
:namedtuple(typename, fieldnames)
— це фабрична функція, яка створює підкласи стандартного кортежу, поля якого доступні як за іменем, так і за індексом. Наприклад:>>> var_type = collections.namedtuple('variable', ... 'id name type size') >>> # Names are separated by spaces or commas. >>> # 'id, name, type, size' would also work. >>> var_type._fields ('id', 'name', 'type', 'size') >>> var = var_type(1, 'frequency', 'int', 4) >>> print var[0], var.id # Equivalent 1 1 >>> print var[2], var.type # Equivalent int int >>> var._asdict() {'size': 4, 'type': 'int', 'id': 1, 'name': 'frequency'} >>> v2 = var._replace(name='amplitude') >>> v2 variable(id=1, name='amplitude', type='int', size=4)
Кілька місць у стандартній бібліотеці, які повертали кортежі, було змінено, щоб повертати екземпляри
namedtuple
. Наприклад, методDecimal.as_tuple()
тепер повертає іменований кортеж із полямиsign
,digits
іexponent
.(Надав Реймонд Геттінгер.)
Ще одна зміна в модулі
collections
полягає в тому, що типdeque
тепер підтримує додатковий параметр maxlen; якщо надано, розмір дек буде обмежено не більше ніж maxlen елементів. Додавання більшої кількості предметів до повного ряду спричиняє відкидання старих предметів.>>> from collections import deque >>> dq=deque(maxlen=3) >>> dq deque([], maxlen=3) >>> dq.append(1); dq.append(2); dq.append(3) >>> dq deque([1, 2, 3], maxlen=3) >>> dq.append(4) >>> dq deque([2, 3, 4], maxlen=3)
(Надав Реймонд Геттінгер.)
Об’єкти
Morsel
модуляCookie
тепер підтримують атрибутhttponly
. У деяких браузерах. до файлів cookie з цим набором атрибутів неможливо отримати доступ або маніпулювати кодом JavaScript. (Надав Арвін Шнелл; bpo-1638033.)Новий метод вікна в модулі
curses
,chgat()
, змінює атрибути відображення для певної кількості символів в одному рядку. (Надав Фабіан Кройц.)# Boldface text starting at y=0,x=21 # and affecting the rest of the line. stdscr.chgat(0, 21, curses.A_BOLD)
Клас
Textbox
у модуліcurses.textpad
тепер підтримує редагування в режимі вставки, а також режимі перезапису. Режим вставки вмикається шляхом надання дійсного значення для параметра insert_mode під час створення екземпляраTextbox
.Методи
strftime()
модуляdatetime
тепер підтримують код формату%f
, який розширюється до кількості мікросекунд в об’єкті, з доповненням нуля зліва до шести позицій. (Надав Скіп Монтанаро; bpo-1158.)The
decimal
module was updated to version 1.66 of the General Decimal Specification. New features include some methods for some basic mathematical functions such asexp()
andlog10()
:>>> Decimal(1).exp() Decimal("2.718281828459045235360287471") >>> Decimal("2.7182818").ln() Decimal("0.9999999895305022877376682436") >>> Decimal(1000).log10() Decimal("3")
Метод
as_tuple()
об’єктівDecimal
тепер повертає іменований кортеж із полямиsign
,digits
іexponent
.(Реалізовано Факундо Батістою та Марком Дікінсоном. Підтримку іменованих кортежів додав Реймонд Геттінгер.)
Клас
SequenceMatcher
модуляdifflib
тепер повертає іменовані кортежі, що представляють збіги, з атрибутамиa
,b
іsize
. (Надав Реймонд Геттінгер.)До конструктора класу
ftplib.FTP
, а також методуconnect()
було додано необов’язковий параметрtimeout
, який визначає час очікування в секундах. (Додано Факундо Батіста.) Крім того,storbinary()
іstorlines()
класуFTP
тепер приймають необов’язковий параметр callback, який буде викликатися з кожним блоком даних після даних був відправлений. (Надав Філ Шварц; bpo-1221598.)Вбудована функція
reduce()
також доступна в модуліfunctools
. У Python 3.0 вбудований компонент було видалено, іreduce()
доступний лише зfunctools
; наразі немає планів відмовлятися від вбудованої версії 2.x. (Виправлено Крістіаном Хеймсом; bpo-1739906.)Коли це можливо, модуль
getpass
тепер використовуватиме/dev/tty
для друку підказки та читання пароля, повертаючись до стандартної помилки та стандартного введення. Якщо пароль може відтворюватися на терміналі, перед відображенням підказки друкується попередження. (Надав Грегорі П. Сміт.)Функція
glob.glob()
тепер може повертати назви файлів у кодуванні Unicode, якщо було використано шлях у кодуванні Unicode і назви файлів у кодуванні Unicode збігаються в каталозі. (bpo-1001604)Нова функція в модулі
heapq
,merge(iter1, iter2, ...)
, приймає будь-яку кількість ітерацій, які повертають дані в порядку сортування, і повертає новий генератор, який повертає вміст усіх ітератори, також у відсортованому порядку. Наприклад:>>> list(heapq.merge([1, 3, 5, 9], [2, 8, 16])) [1, 2, 3, 5, 8, 9, 16]
Інша нова функція,
heappushpop(heap, item)
, надсилає item на heap, потім виривається та повертає найменший елемент. Це ефективніше, ніж викликheappush()
, а потімheappop()
.heapq
тепер реалізовано для використання лише порівняння менше ніж, замість порівняння менше або рівно, яке використовувалося раніше. Завдяки цьому використання типуheapq
відповідає методуlist.sort()
. (Надав Реймонд Геттінгер.)До конструкторів класів
httplib.HTTPConnection
іHTTPSConnection
було додано необов’язковий параметрtimeout
, який визначає час очікування в секундах. (Додав Факундо Батіста.)Більшість функцій модуля
inspect
, наприкладgetmoduleinfo()
іgetargs()
, тепер повертають іменовані кортежі. Окрім того, що вони ведуть себе як кортежі, до елементів значення, що повертається, також можна отримати доступ як до атрибутів. (Надав Реймонд Геттінгер.)Деякі нові функції в модулі включають
isgenerator()
,isgeneratorfunction()
іisabstract()
.Модуль
itertools
отримав кілька нових функцій.izip_longest(iter1, iter2, ...[, fillvalue])
створює кортежі з кожного з елементів; якщо деякі з ітерацій коротші за інші, відсутні значення встановлюються як fillvalue. Наприклад:>>> tuple(itertools.izip_longest([1,2,3], [1,2,3,4,5])) ((1, 1), (2, 2), (3, 3), (None, 4), (None, 5))
product(iter1, iter2, ..., [repeat=N])
повертає декартовий добуток наданих ітераторів, набір кортежів, що містить усі можливі комбінації елементів, що повертаються з кожного ітератора.>>> list(itertools.product([1,2,3], [4,5,6])) [(1, 4), (1, 5), (1, 6), (2, 4), (2, 5), (2, 6), (3, 4), (3, 5), (3, 6)]
Необов’язковий аргумент ключового слова repeat використовується для взяття продукту iterable або набору iterables із собою, повторюваних N разів. З одним ітерованим аргументом повертаються N-кортежі:
>>> list(itertools.product([1,2], repeat=3)) [(1, 1, 1), (1, 1, 2), (1, 2, 1), (1, 2, 2), (2, 1, 1), (2, 1, 2), (2, 2, 1), (2, 2, 2)]
З двома ітераціями повертаються 2N-кортежі.
>>> list(itertools.product([1,2], [3,4], repeat=2)) [(1, 3, 1, 3), (1, 3, 1, 4), (1, 3, 2, 3), (1, 3, 2, 4), (1, 4, 1, 3), (1, 4, 1, 4), (1, 4, 2, 3), (1, 4, 2, 4), (2, 3, 1, 3), (2, 3, 1, 4), (2, 3, 2, 3), (2, 3, 2, 4), (2, 4, 1, 3), (2, 4, 1, 4), (2, 4, 2, 3), (2, 4, 2, 4)]
combinations(iterable, r)
повертає підпослідовності довжиною r з елементів iterable.>>> list(itertools.combinations('123', 2)) [('1', '2'), ('1', '3'), ('2', '3')] >>> list(itertools.combinations('123', 3)) [('1', '2', '3')] >>> list(itertools.combinations('1234', 3)) [('1', '2', '3'), ('1', '2', '4'), ('1', '3', '4'), ('2', '3', '4')]
permutations(iter[, r])
повертає всі перестановки довжиною r елементів iterable. Якщо r не вказано, за замовчуванням використовуватиметься кількість елементів, створених iterable.>>> list(itertools.permutations([1,2,3,4], 2)) [(1, 2), (1, 3), (1, 4), (2, 1), (2, 3), (2, 4), (3, 1), (3, 2), (3, 4), (4, 1), (4, 2), (4, 3)]
itertools.chain(*iterables)
— це існуюча функція вitertools
, яка отримала новий конструктор у Python 2.6.itertools.chain.from_iterable(iterable)
приймає один ітератор, який має повертати інші ітератори.chain()
потім поверне всі елементи першого ітератора, потім усі елементи другого і так далі.>>> list(itertools.chain.from_iterable([[1,2,3], [4,5,6]])) [1, 2, 3, 4, 5, 6]
(Усі внесено Реймондом Геттінгером.)
Клас
FileHandler
модуляlogging
і його підкласиWatchedFileHandler
,RotatingFileHandler
іTimedRotatingFileHandler
тепер мають додатковий параметр delay для своїх конструкторів . Якщо delay має значення true, відкриття файлу журналу відкладено до першого викликуemit()
. (Надав Віней Саджип.)TimedRotatingFileHandler
також має параметр конструктора utc. Якщо аргумент істинний, час UTC використовуватиметься для визначення часу настання опівночі та для створення назв файлів; інакше використовуватиметься місцевий час.До модуля
math
додано кілька нових функцій:isinf()
іisnan()
визначають, чи є даний float нескінченністю (позитивною чи від’ємною) чи NaN (не числом) відповідно.copysign()
копіює знаковий біт числа IEEE 754, повертаючи абсолютне значення x у поєднанні зі знаковим бітом y. Наприклад,math.copysign(1, -0.0)
повертає -1.0. (Надано Крістіаном Хеймсом.)factorial()
обчислює факториал числа. (Надав Реймонд Геттінгер; bpo-2138.)fsum()
додає потік чисел із ітерованого об’єкта та обережно, щоб уникнути втрати точності через використання часткових сум. (Надано Жаном Брауерсом, Реймондом Геттінгером і Марком Дікінсоном; bpo-2819.)acosh()
,asinh()
іatanh()
обчислюють обернені гіперболічні функції.log1p()
повертає натуральний логарифм 1+x (за основою e).trunc()
округлює число до нуля, повертаючи найближчийIntegral
, який знаходиться між аргументом функції та нулем. Додано як частину бекпорту ієрархії типів PEP 3141 для номерів.
Модуль
math
було покращено, щоб забезпечити більш узгоджену поведінку на різних платформах, особливо щодо обробки винятків із плаваючою комою та спеціальних значень IEEE 754.За можливості модуль дотримується рекомендацій стандарту C99 щодо спеціальних значень 754. Наприклад,
sqrt(-1.)
тепер має видаватиValueError
майже на всіх платформах, тоді якsqrt(float('NaN'))
має повертати NaN на всіх IEEE 754 платформи. Там, де Додаток «F» стандарту C99 рекомендує сигналізувати «ділить на нуль» або «недійсний», Python викличеValueError
. Там, де додаток «F» стандарту C99 рекомендує сигналізувати «переповнення», Python викличеOverflowError
. (Див. bpo-711019 і bpo-1640.)(Надано Крістіаном Хеймсом і Марком Дікінсоном.)
Об’єкти
mmap
тепер мають методrfind()
, який шукає підрядок, що починається в кінці рядка, і виконує пошук у зворотному напрямку. Методfind()
також отримав параметр end, що вказує індекс, на якому потрібно припинити пошук. (Надав Джон Лентон.)Модуль
operator
отримав функціюmethodcaller()
, яка приймає ім’я та необов’язковий набір аргументів, повертаючи виклик, який викликає названу функцію за будь-якими переданими їй аргументами. Наприклад:>>> # Equivalent to lambda s: s.replace('old', 'new') >>> replacer = operator.methodcaller('replace', 'old', 'new') >>> replacer('old wine in old bottles') 'new wine in new bottles'
(Надав Георг Брандл за пропозицією Григорія Петросяна.)
Функція
attrgetter()
тепер приймає імена з крапками та виконує відповідні пошуки атрибутів:>>> inst_name = operator.attrgetter( ... '__class__.__name__') >>> inst_name('') 'str' >>> inst_name(help) '_Helper'
(Надано Георгом Брандлом за пропозицією Баррі Варшави.)
Модуль
os
тепер обертає кілька нових системних викликів.fchmod(fd, mode)
іfchown(fd, uid, gid)
змінюють режим і право власності на відкритий файл, аlchmod(path, mode)
змінює режим символічного посилання . (Надано Георгом Брандлом і Крістіаном Хаймсом.)chflags()
іlchflags()
є обгортками для відповідних системних викликів (де вони доступні), змінюючи прапорці, встановлені для файлу. Константи для значень прапорців визначені в модуліstat
; деякі можливі значення включаютьUF_IMMUTABLE
, щоб повідомити, що файл не може бути змінено, іUF_APPEND
, щоб вказати, що дані можуть бути лише додані до файлу. (Надав М. Левінсон.)os.closerange(low, high)
ефективно закриває всі файлові дескриптори від low до high, ігноруючи будь-які помилки та не включаючи сам high. Ця функція тепер використовується модулемsubprocess
для пришвидшення запуску процесів. (Надав Георг Брандл; bpo-1663329.)Метод
clear()
об’єктаos.environ
тепер скасовуватиме змінні середовища за допомогоюos.unsetenv()
на додаток до очищення ключів об’єкта. (Надав Martin Horcicka; bpo-1181.)Функція
os.walk()
тепер має параметрfollowlinks
. Якщо встановлено значення True, він переходитиме за символічними посиланнями на каталоги та відвідуватиме вміст каталогу. Для зворотної сумісності значення параметра за замовчуванням — false. Зверніть увагу, що функція може впасти в нескінченну рекурсію, якщо є символічне посилання, яке вказує на батьківський каталог. (bpo-1273829)У модулі
os.path
функціюsplitext()
було змінено так, що вона не розділяється на початкові символи крапок. Це дає кращі результати під час роботи з dot-файлами Unix. Наприклад,os.path.splitext('.ipython')
тепер повертає('.ipython', '')
замість('', '.ipython')
. (bpo-1115886)Нова функція,
os.path.relpath(path, start='.')
, повертає відносний шлях від шляхуstart
, якщо він надається, або від поточного робочого каталогу до пункту призначенняшлях
. (Надав Річард Барран; bpo-1339796.)У Windows
os.path.expandvars()
тепер розширюватиме змінні середовища, подані у формі «%var%», а «~user» буде розгорнуто до шляху до домашнього каталогу користувача. (Надав Джосія Карлсон; bpo-957650.)Налагоджувач Python, наданий модулем
pdb
, отримав нову команду: «запустити» перезапускає програму Python, яка налагоджується, і може додатково приймати нові аргументи командного рядка для програми. (Надав Роккі Бернштейн; bpo-1393667.)Функція
pdb.post_mortem()
, яка використовується для початку налагодження зворотного відстеження, тепер використовуватиме відстеження, яке повертаєsys.exc_info()
, якщо відстеження не надано. (Надав Факундо Батіста; bpo-1106316.)Модуль
pickletools
тепер має функціюoptimize()
, яка приймає рядок, що містить pickle, і видаляє деякі невикористані коди операцій, повертаючи коротший pickle, який містить ту саму структуру даних. (Надав Реймонд Геттінгер.)До модуля
pkgutil
додано функціюget_data()
, яка повертає вміст файлів ресурсів, що входять до встановленого пакета Python. Наприклад:>>> import pkgutil >>> print pkgutil.get_data('test', 'exception_hierarchy.txt') BaseException +-- SystemExit +-- KeyboardInterrupt +-- GeneratorExit +-- Exception +-- StopIteration +-- StandardError ...
(Надав Пол Мур; bpo-2439.)
Об’єкти
Parser
модуляpyexpat
тепер дозволяють установлювати атрибутbuffer_size
, щоб змінити розмір буфера, який використовується для зберігання символьних даних. (Надав Ахім Гаедке; bpo-1137.)Модуль
Queue
тепер надає варіанти черги, які отримують записи в різному порядку. КласPriorityQueue
зберігає елементи в черзі в купі та отримує їх у порядку пріоритету, аLifoQueue
спочатку отримує останні додані записи, тобто він поводиться як стек. (Надав Реймонд Геттінгер.)Об’єкти
Random
модуляrandom
тепер можна вибирати в 32-бітній системі та скасовувати в 64-бітній системі, і навпаки. На жаль, ця зміна також означає, що об’єктиRandom
Python 2.6 не можна правильно вилучити в попередніх версіях Python. (Надав Шон Лігокі; bpo-1727780.)Нова функція
triangular(low, high, mode)
повертає випадкові числа за трикутним розподілом. Повернуті значення знаходяться в діапазоні від low до high, не враховуючи самого high, і з mode як значенням, що найчастіше зустрічається в розподілі. (Надано Володимиром ван дер Ланом і Раймондом Геттінгером; bpo-1681432.)Довгі пошуки регулярних виразів, які виконує модуль
re
, перевірятимуть сигнали, які доставляються, тому трудомісткі пошуки тепер можна перервати. (Надано Джошем Хойтом і Ральфом Шміттом; bpo-846388.)Модуль регулярного виразу реалізовано шляхом компіляції байт-кодів для крихітної віртуальної машини, специфічної для регулярного виразу. Ненадійний код може безпосередньо створювати шкідливі рядки байт-коду та спричиняти збої, тому Python 2.6 включає верифікатор для байт-коду регулярного виразу. (Надано Гвідо ван Россумом із роботи в Google App Engine; bpo-3487.)
Метод
Completer.complete()
модуляrlcompleter
тепер ігноруватиме винятки, викликані під час оцінювання імені. (Виправлено Lorenz Quack; bpo-2250.)Екземпляри
scheduler
модуляsched
тепер мають атрибутqueue
лише для читання, який повертає вміст черги планувальника, представлений у вигляді списку іменованих кортежів із полями( час, пріоритет, дія, аргумент)
. (Надав Раймонд Геттінгер; bpo-1861.)Модуль
select
тепер має функції оболонки для системних викликів Linuxepoll()
і BSDkqueue()
. Методmodify()
додано до існуючих об’єктівpoll
;pollobj.modify(fd, eventmask)
приймає дескриптор файлу або файловий об’єкт і маску події, змінюючи записану маску події для цього файлу. (Надав Крістіан Хаймес; bpo-1657.)Функція
shutil.copytree()
тепер має додатковий аргумент ignore, який приймає об’єкт, що викликається. Цей виклик отримає кожен шлях до каталогу та список вмісту каталогу, а також поверне список імен, які будуть проігноровані, не скопійовані.Модуль
shutil
також надає функціюignore_patterns()
для використання з цим новим параметром.ignore_patterns()
приймає довільну кількість шаблонів у стилі glob і повертає виклик, який ігноруватиме будь-які файли та каталоги, що відповідають будь-якому з цих шаблонів. У наступному прикладі копіюється дерево каталогів, але пропускаються каталоги.svn
і резервні файли Emacs, імена яких закінчуються на „~“:shutil.copytree('Doc/library', '/tmp/library', ignore=shutil.ignore_patterns('*~', '.svn'))
(Надав Тарек Зіаде; bpo-2663.)
Інтеграція обробки сигналів із циклами обробки подій GUI, подібними до тих, що використовуються Tkinter або GTk+, давно була проблемою; більшість програм закінчується опитуванням, прокидаючись кожну частку секунди, щоб перевірити, чи відбулися якісь події GUI. Модуль
signal
тепер може зробити це ефективнішим. Викликsignal.set_wakeup_fd(fd)
встановлює дескриптор файлу для використання; коли сигнал отримано, байт записується в цей файловий дескриптор. Існує також функція C-рівня,PySignal_SetWakeupFd()
, для встановлення дескриптора.Цикли подій використовуватимуть це шляхом відкриття каналу для створення двох дескрипторів, одного для читання та іншого для запису. Дескриптор, доступний для запису, буде передано до
set_wakeup_fd()
, а дескриптор, доступний для читання, буде додано до списку дескрипторів, які відстежуються циклом подій черезselect()
абоpoll()
. Після отримання сигналу буде записаний байт, і основний цикл подій буде активовано, уникаючи необхідності опитування.(Надав Адам Олсен; bpo-1583.)
Функція
siginterrupt()
тепер доступна з коду Python і дозволяє змінювати, чи можуть сигнали переривати системні виклики чи ні. (Надав Ральф Шмітт.)Також додано функції
setitimer()
іgetitimer()
(де вони доступні).setitimer()
дозволяє встановлювати інтервальні таймери, які спричинять доставку сигналу до процесу після визначеного часу, виміряного за часом настінного годинника, спожитим часом процесу або комбінованим часом процесу+системи. (Надав Гільєрме Поло; bpo-2240.)Модуль
smtplib
тепер підтримує SMTP через SSL завдяки додаванню класуSMTP_SSL
. Цей клас підтримує інтерфейс, ідентичний існуючому класуSMTP
. (Надано Монті Тейлором.) Обидва конструктори класів також мають додатковий параметрtimeout
, який визначає час очікування для початкової спроби підключення, виміряний у секундах. (Надав Факундо Батіста.)Також до модуля додано реалізацію протоколу LMTP (RFC 2033). LMTP використовується замість SMTP під час передачі електронної пошти між агентами, які не керують чергою пошти. (LMTP реалізовано Leif Hedstrom; bpo-957003.)
SMTP.starttls()
тепер відповідає RFC 3207 і забуває будь-яку інформацію, отриману від сервера, не отриману в результаті узгодження TLS. (Патч надав Білл Феннер; bpo-829951.)Модуль
socket
тепер підтримує TIPC (http://tipc.sourceforge.net/), високопродуктивний протокол не на основі IP, розроблений для використання в кластерних середовищах. Адреси TIPC складаються з 4 або 5 кортежів. (Надав Альберто Бертоглі; bpo-1646.)Нова функція,
create_connection()
, приймає адресу та підключається до неї, використовуючи додаткове значення тайм-ауту, повертаючи підключений об’єкт сокета. Ця функція також шукає тип адреси та підключається до неї за допомогою IPv4 або IPv6 відповідно. Зміна коду на використанняcreate_connection()
замістьsocket(socket.AF_INET, ...)
— це все, що потрібно, щоб ваш код працював з IPv6.Базові класи в модулі
SocketServer
тепер підтримують виклик методуhandle_timeout()
після періоду бездіяльності, визначеного атрибутомtimeout
сервера. (Надано Майклом Помранінгом.) Методserve_forever()
тепер використовує додатковий інтервал опитування, виміряний у секундах, контролюючи, як часто сервер перевірятиме запит на завершення роботи. (Надано Педро Вернеком і Джеффрі Яскіним; bpo-742598, bpo-1193577.)Модуль
sqlite3
, який підтримує Gerhard Häring, було оновлено з версії 2.3.2 у Python 2.5 до версії 2.4.1.The
struct
module now supports the C99_Bool
type, using the format character'?'
. (Contributed by David Remahl.)Об’єкти
Popen
, надані модулемsubprocess
, тепер мають методиterminate()
,kill()
іsend_signal()
. У Windowssend_signal()
підтримує лише сигналSIGTERM
, і всі ці методи є псевдонімами для функції Win32 APITerminateProcess()
. (Надано Крістіаном Хеймсом.)Нова змінна в модулі
sys
,float_info
, є об’єктом, що містить інформацію, отриману з файлуfloat.h
про підтримку платформою операцій з плаваючою комою. Атрибути цього об’єкта включаютьmant_dig
(кількість цифр у мантисі),epsilon
(найменша різниця між 1,0 і наступним найбільшим значенням, яке можна представити), і кілька інших. (Надав Крістіан Хаймес; bpo-1534.)Інша нова змінна,
dont_write_bytecode
, контролює, чи Python записує файли.pyc
або.pyo
під час імпортування модуля. Якщо ця змінна має значення true, скомпільовані файли не записуються. Змінна спочатку встановлюється під час запуску шляхом надання перемикача-B
інтерпретатору Python або встановленням змінної середовищаPYTHONDONTWRITEBYTECODE
перед запуском інтерпретатора. Код Python може згодом змінити значення цієї змінної, щоб контролювати, записуються чи ні файли байт-коду. (Надано Нілом Норвітцем і Георгом Брандлом.)Інформація про аргументи командного рядка, які надаються інтерпретатору Python, доступна шляхом читання атрибутів іменованого кортежу, доступного як
sys.flags
. Наприклад, атрибутverbose
має значення true, якщо Python було виконано в детальному режимі,debug
має значення true у режимі налагодження тощо. Усі ці атрибути доступні лише для читання. (Надано Крістіаном Хеймсом.)Нова функція,
getsizeof()
, приймає об’єкт Python і повертає обсяг пам’яті, який використовує об’єкт, виміряний у байтах. Вбудовані об’єкти повертають правильні результати; сторонні розширення можуть ні, але можуть визначити метод__sizeof__()
для повернення розміру об’єкта. (Надано Робертом Шаппенісом; bpo-2898.)Тепер можна визначити поточні функції профайлера та трасувальника, викликавши
sys.getprofile()
іsys.gettrace()
. (Надав Георг Брандл; bpo-1648.)Модуль
tarfile
тепер підтримує tar-файли POSIX.1-2001 (pax) на додаток до форматів POSIX.1-1988 (ustar) і GNU tar, які вже підтримувалися. Типовим форматом є GNU tar; вкажіть параметрformat
, щоб відкрити файл в іншому форматі:tar = tarfile.open("output.tar", "w", format=tarfile.PAX_FORMAT)
Нові параметри
encoding
іerrors
визначають кодування та схему обробки помилок для перетворення символів.'strict'
,'ignore'
і'replace'
є трьома стандартними способами, якими Python може обробляти помилки;'utf-8''
— це спеціальне значення, яке замінює неправильні символи їх представленням UTF-8. (Перетворення символів відбувається через те, що формат PAX підтримує імена файлів Unicode із кодуванням UTF-8 за умовчанням.)The
TarFile.add()
method now accepts anexclude
argument that’s a function that can be used to exclude certain filenames from an archive. The function must take a filename and return true if the file should be excluded or false if it should be archived. The function is applied to both the name initially passed toadd()
and to the names of files in recursively-added directories.(Усі зміни внесено Ларсом Густебелем).
До конструктора класу
telnetlib.Telnet
було додано необов’язковий параметрtimeout
, який визначає час очікування в секундах. (Додав Факундо Батіста.)Клас
tempfile.NamedTemporaryFile
зазвичай видаляє створений ним тимчасовий файл, коли файл закривається. Цю поведінку тепер можна змінити, передавшиdelete=False
конструктору. (Надав Деміен Міллер; bpo-1537850.)Новий клас,
SpooledTemporaryFile
, поводиться як тимчасовий файл, але зберігає свої дані в пам’яті, доки не буде перевищено максимальний розмір. Після досягнення цієї межі вміст буде записаний у тимчасовий файл на диску. (Надав Дастін Дж. Мітчелл.)Класи
NamedTemporaryFile
іSpooledTemporaryFile
працюють як менеджери контексту, тому ви можете написатиwith tempfile.NamedTemporaryFile() як tmp: ...
. (Надав Олександр Бєлопольський; bpo-2021.)Модуль
test.test_support
отримав низку контекстних менеджерів, корисних для написання тестів.EnvironmentVarGuard()
— це контекстний менеджер, який тимчасово змінює змінні середовища та автоматично відновлює їхні старі значення.Інший контекстний менеджер,
TransientResource
, може охоплювати виклики ресурсів, які можуть бути або не бути доступними; він перехопить та проігнорує вказаний список винятків. Наприклад, тест мережі може ігнорувати певні збої під час підключення до зовнішнього веб-сайту:with test_support.TransientResource(IOError, errno=errno.ETIMEDOUT): f = urllib.urlopen('https://sf.net') ...
Нарешті,
check_warnings()
скидає фільтри попереджень модуляwarning
і повертає об’єкт, який записуватиме всі викликані попередження (bpo-3781):with test_support.check_warnings() as wrec: warnings.simplefilter("always") # ... code that triggers a warning ... assert str(wrec.message) == "function is outdated" assert len(wrec.warnings) == 1, "Multiple warnings raised"
(Надав Бретт Кеннон.)
The
textwrap
module can now preserve existing whitespace at the beginnings and ends of the newly-created lines by specifyingdrop_whitespace=False
as an argument:>>> S = """This sentence has a bunch of ... extra whitespace.""" >>> print textwrap.fill(S, width=15) This sentence has a bunch of extra whitespace. >>> print textwrap.fill(S, drop_whitespace=False, width=15) This sentence has a bunch of extra whitespace. >>>
(Надав Дуейн Бейлі; bpo-1581073.)
API модуля
threading
буде змінено для використання таких властивостей, якdaemon
замість методівsetDaemon()
іisDaemon()
, а деякі методи були перейменовані, щоб замість них використовувати підкреслення з верблюда; наприклад, методactiveCount()
перейменовано наactive_count()
. Обидві версії модуля 2.6 і 3.0 підтримують однакові властивості та перейменовані методи, але не видаляють старі методи. Не встановлено дати припинення підтримки старих API у Python 3.x; старі API не будуть видалені в жодній версії 2.x. (Здійснено кількома людьми, особливо Бенджаміном Петерсоном.)Об’єкти
Thread
модуляthreading
отримали властивістьident
, яка повертає ідентифікатор потоку, ненульове ціле число. (Надав Грегорі П. Сміт; bpo-2871.)Модуль
timeit
тепер приймає виклики, а також рядки для оператора, який хронометрується, і для коду налаштування. Було додано дві зручні функції для створення екземплярівTimer
:repeat(stmt, setup, time, repeat, number)
іtimeit(stmt, setup, time, number)
створити екземпляр і викликати відповідний метод. (Надав Ерік Демейн; bpo-1533909.)Модуль
Tkinter
тепер приймає списки та кортежі для параметрів, розділяючи елементи пробілами перед передачею результуючого значення в Tcl/Tk. (Надав Гільєрме Поло; bpo-2906.)Модуль
turtle
для черепахової графіки був значно вдосконалений Грегором Лінглом. Нові функції в модулі включають:Краща анімація руху та обертання черепахи.
Керуйте рухом черепахи за допомогою нових методів
delay()
,tracer()
іspeed()
.Можливість задавати нові форми для черепахи та визначати нову систему координат.
Turtles тепер мають метод
undo()
, який може відкочувати дії.Проста підтримка реагування на події введення, такі як активність миші та клавіатури, що дає змогу писати прості ігри.
Файл
turtle.cfg
можна використовувати для налаштування початкового вигляду екрана черепахи.Документаційні рядки модуля можна замінити новими документаційними рядками, перекладеними іншою мовою.
До функції
urllib.urlopen()
і конструктора класуurllib.ftpwrapper
, а також функціїurllib2.urlopen()
додано необов’язковий параметрtimeout
. Параметр визначає час очікування в секундах. Наприклад:>>> u = urllib2.urlopen("http://slow.example.com", timeout=3) Traceback (most recent call last): ... urllib2.URLError: <urlopen error timed out> >>>
(Додав Факундо Батіста.)
Базу даних Unicode, яку надає модуль
unicodedata
, оновлено до версії 5.1.0. (Оновлено Мартіном фон Льовісом; bpo-3811.)Модулі
warnings
formatwarning()
іshowwarning()
отримали додатковий аргумент line, який можна використовувати для надання рядка вихідного коду. (Додано як частину bpo-1631171, яка повторно реалізувала частину модуляwarnings
у коді C.)Нова функція,
catch_warnings()
, є контекстним менеджером, призначеним для цілей тестування, який дозволяє тимчасово змінювати фільтри попереджень, а потім відновлювати їхні вихідні значення (bpo-3781).Класам XML-RPC
SimpleXMLRPCServer
іDocXMLRPCServer
тепер можна запобігти негайному відкриттю та зв’язуванню з їхнім сокетом, передавшиFalse
як параметр конструктора bind_and_activate. Це можна використовувати для зміни атрибута екземпляраallow_reuse_address
перед викликом методівserver_bind()
іserver_activate()
, щоб відкрити сокет і почати прослуховування з’єднань. (Надав Пітер Паренте; bpo-1599845.)SimpleXMLRPCServer
також має атрибут_send_traceback_header
; якщо істина, виняток і відформатована трасування повертаються як HTTP-заголовки «X-Exception» і «X-Traceback». Ця функція призначена лише для налагодження, і її не слід використовувати на робочих серверах, оскільки відстеження може виявити паролі чи іншу конфіденційну інформацію. (Надано Аланом Макінтайром у рамках його проекту Google Summer of Code 2007.)Модуль
xmlrpclib
більше не перетворює автоматичноdatetime.date
іdatetime.time
на типxmlrpclib.DateTime
; семантика перетворення не обов’язково була правильною для всіх програм. Код із використаннямxmlrpclib
має конвертувати екземпляриdate
іtime
. (bpo-1330538) Код також може обробляти дати до 1900 року (надано Ralf Schmitt; bpo-2014) і 64-розрядні цілі числа, представлені за допомогою<i8>
у відповідях XML-RPC (надано Ріку Ліндблад; bpo-2985).Клас
ZipFile
модуляzipfile
тепер має методиextract()
іextractall()
, які розпаковують один або всі файли в архіві до поточного каталогу, або у вказаний каталог:z = zipfile.ZipFile('python-251.zip') # Unpack a single file, writing it relative # to the /tmp directory. z.extract('Python/sysmodule.c', '/tmp') # Unpack all the files in the archive. z.extractall()
(Надав Алан Макінтайр; bpo-467924.)
Методи
open()
,read()
іextract()
тепер можуть приймати ім’я файлу або об’єктZipInfo
. Це корисно, коли архів випадково містить дубльоване ім’я файлу. (Надав Грем Хорлер; bpo-1775025.)Нарешті,
zipfile
тепер підтримує використання імен файлів Unicode для архівованих файлів. (Надав Олексій Борзенков; bpo-1734346.)
Модуль ast
¶
Модуль ast
забезпечує представлення коду Python у вигляді абстрактного синтаксичного дерева, а Армін Ронахер додав набір допоміжних функцій, які виконують різноманітні типові завдання. Вони будуть корисні для пакетів шаблонів HTML, аналізаторів коду та подібних інструментів, які обробляють код Python.
Функція parse()
приймає вираз і повертає AST. Функція dump()
виводить представлення дерева, придатне для налагодження:
import ast
t = ast.parse("""
d = {}
for i in 'abcdefghijklm':
d[i + i] = ord(i) - ord('a') + 1
print d
""")
print ast.dump(t)
Це виводить глибоко вкладене дерево:
Module(body=[
Assign(targets=[
Name(id='d', ctx=Store())
], value=Dict(keys=[], values=[]))
For(target=Name(id='i', ctx=Store()),
iter=Str(s='abcdefghijklm'), body=[
Assign(targets=[
Subscript(value=
Name(id='d', ctx=Load()),
slice=
Index(value=
BinOp(left=Name(id='i', ctx=Load()), op=Add(),
right=Name(id='i', ctx=Load()))), ctx=Store())
], value=
BinOp(left=
BinOp(left=
Call(func=
Name(id='ord', ctx=Load()), args=[
Name(id='i', ctx=Load())
], keywords=[], starargs=None, kwargs=None),
op=Sub(), right=Call(func=
Name(id='ord', ctx=Load()), args=[
Str(s='a')
], keywords=[], starargs=None, kwargs=None)),
op=Add(), right=Num(n=1)))
], orelse=[])
Print(dest=None, values=[
Name(id='d', ctx=Load())
], nl=True)
])
Метод literal_eval()
приймає рядок або AST, що представляє літеральний вираз, аналізує та обчислює його та повертає результуюче значення. Літеральний вираз — це вираз Python, який містить лише рядки, числа, словники тощо, але не містить операторів чи викликів функцій. Якщо вам потрібно оцінити вираз, але ви не можете прийняти загрозу безпеці використання виклику eval()
, literal_eval()
впорається з цим безпечно:
>>> literal = '("a", "b", {2:4, 3:8, 1:2})'
>>> print ast.literal_eval(literal)
('a', 'b', {1: 2, 2: 4, 3: 8})
>>> print ast.literal_eval('"a" + "b"')
Traceback (most recent call last):
...
ValueError: malformed string
Модуль також містить класи NodeVisitor
і NodeTransformer
для обходу та модифікації AST, а також функції для типових перетворень, таких як зміна номерів рядків.
Модуль future_builtins
¶
Python 3.0 вносить багато змін до репертуару вбудованих функцій, і більшість змін не можна ввести в серії Python 2.x, оскільки вони порушать сумісність. Модуль future_builtins
надає версії цих вбудованих функцій, які можна імпортувати під час написання коду, сумісного з 3.0.
Функції цього модуля наразі включають:
ascii(obj)
: еквівалентrepr()
. У Python 3.0repr()
поверне рядок Unicode, тоді якascii()
поверне чистий байтовий рядок ASCII.filter(predicate, iterable)
,map(func, iterable1, ...)
: версії 3.0 повертають ітератори, на відміну від вбудованих 2.x, які повертають списки.hex(value)
,oct(value)
: замість виклику методів__hex__()
або__oct__()
ці версії викличуть метод__index__()
і перетворити результат у шістнадцяткове або вісімкове.oct()
використовуватиме нову нотацію0o
для свого результату.
Модуль json
: Нотація об’єктів JavaScript¶
Новий модуль json
підтримує кодування та декодування типів Python у JSON (Javascript Object Notation). JSON — це легкий формат обміну, який часто використовується у веб-додатках. Для отримання додаткової інформації про JSON відвідайте http://www.json.org.
json
підтримує декодування та кодування більшості вбудованих типів Python. У наступному прикладі кодується та декодується словник:
>>> import json
>>> data = {"spam": "foo", "parrot": 42}
>>> in_json = json.dumps(data) # Encode the data
>>> in_json
'{"parrot": 42, "spam": "foo"}'
>>> json.loads(in_json) # Decode into a Python object
{"spam": "foo", "parrot": 42}
Також можна написати власні декодери та кодери для підтримки більшої кількості типів. Також підтримується швидкий друк рядків JSON.
json
(спочатку називався simplejson) був написаний Бобом Іпполіто.
Модуль plistlib
: аналізатор списку властивостей¶
Формат .plist
зазвичай використовується в Mac OS X для зберігання основних типів даних (чисел, рядків, списків і словників) шляхом їх серіалізації у формат на основі XML. Це нагадує серіалізацію типів даних XML-RPC.
Незважаючи на те, що в основному використовується в Mac OS X, цей формат не має нічого специфічного для Mac, а реалізація Python працює на будь-якій платформі, яку підтримує Python, тому модуль plistlib
було підвищено до стандартної бібліотеки.
Користуватися модулем просто:
import sys
import plistlib
import datetime
# Create data structure
data_struct = dict(lastAccessed=datetime.datetime.now(),
version=1,
categories=('Personal','Shared','Private'))
# Create string containing XML.
plist_str = plistlib.writePlistToString(data_struct)
new_struct = plistlib.readPlistFromString(plist_str)
print data_struct
print new_struct
# Write data structure to a file and read it back.
plistlib.writePlist(data_struct, '/tmp/customizations.plist')
new_struct = plistlib.readPlist('/tmp/customizations.plist')
# read/writePlist accepts file-like objects as well as paths.
plistlib.writePlist(data_struct, sys.stdout)
Покращення ctypes¶
Томас Хеллер продовжував підтримувати та вдосконалювати модуль ctypes
.
ctypes
тепер підтримує тип даних c_bool
, який представляє тип C99 bool
. (Надав Девід Ремал; bpo-1649190.)
Типи рядків, буферів і масивів ctypes
мають покращену підтримку розширеного синтаксису зрізу, де надаються різні комбінації (початок, зупинка, крок)
. (Реалізовано Томасом Воутерсом.)
Усі типи даних ctypes
тепер підтримують методи from_buffer()
і from_buffer_copy()
, які створюють екземпляр ctypes на основі наданого об’єкта буфера. from_buffer_copy()
копіює вміст об’єкта, тоді як from_buffer()
буде використовувати ту саму область пам’яті.
Нова угода про виклики вказує ctypes
очищати змінні errno
або Win32 LastError на початку кожного обгорнутого виклику. (Реалізовано Томасом Геллером; bpo-1798.)
Тепер ви можете отримати змінну Unix errno
після виклику функції. Під час створення обгорнутої функції ви можете вказати use_errno=True
як ключовий параметр для функції DLL()
, а потім викликати методи рівня модуля set_errno()
і get_errno()
щоб встановити та отримати значення помилки.
Змінна Win32 LastError так само підтримується функціями DLL()
, OleDLL()
і WinDLL()
. Ви вказуєте use_last_error=True
як параметр ключового слова, а потім викликаєте методи рівня модуля set_last_error()
і get_last_error()
.
Функція byref()
, яка використовується для отримання вказівника на екземпляр ctypes, тепер має необов’язковий параметр offset, який є кількістю байтів, яка буде додана до поверненого вказівника.
Покращена підтримка SSL¶
Білл Янссен значно покращив підтримку Python 2.6 для Secure Sockets Layer, додавши новий модуль, ssl
, який побудовано поверх бібліотеки OpenSSL. Цей новий модуль забезпечує більше контролю над узгодженим протоколом, використовуваними сертифікатами X.509 і має кращу підтримку для написання серверів SSL (на відміну від клієнтів) на Python. Наявну підтримку SSL у модулі socket
не було видалено та продовжує працювати, хоча її буде видалено в Python 3.0.
Щоб використовувати новий модуль, ви повинні спочатку створити з’єднання TCP у звичайний спосіб, а потім передати його функції ssl.wrap_socket()
. Можна вказати, чи потрібен сертифікат, і отримати інформацію про сертифікат, викликавши метод getpeercert()
.
Дивись також
Документація для модуля ssl
.
Скасування та видалення¶
Рядкові винятки видалено. Спроба використати їх викликає
TypeError
.Зміни до інтерфейсу
Exception
відповідно до PEP 352 продовжуються. Для 2.6 атрибутmessage
застарів на користь атрибутаargs
.(3.0-режим попередження) Python 3.0 матиме реорганізовану стандартну бібліотеку, яка видалить багато застарілих модулів і перейменує інші. Python 2.6, який працює в режимі попередження 3.0, попередить про ці модулі під час їх імпорту.
Список застарілих модулів:
audiodev
,bgenlocations
,buildtools
,bundlebuilder
,Canvas
,compiler
,dircache
,dl
,fpformat
,gensuitemodule
,ihooks
,imageop
,imgfile
,linuxaudiodev
,mhlib
,mimetools
,multifile
,new
,pure
,statvfs
,sunaudiodev
,test.testall
іtoaiff
.Модуль
gopherlib
видалено.Модулі
MimeWriter
іmimify
були визнані застарілими; замість цього використовуйте пакетemail
.Модуль
md5
застарів; замість цього використовуйте модульhashlib
.Модуль
posixfile
визнано застарілим;fcntl.lockf()
забезпечує краще блокування.Модуль
popen2
застарів; використовуйте модульsubprocess
.Модуль
rgbimg
видалено.Модуль
sets
визнано застарілим; краще використовувати вбудовані типиset
іfrozenset
.Модуль
sha
застарів; замість цього використовуйте модульhashlib
.
Зміни збірки та C API¶
Зміни в процесі збирання Python і в API C включають:
Тепер Python потрібно скомпілювати за допомогою компіляторів C89 (після 19 років!). Це означає, що вихідне дерево Python виключило власні реалізації
memmove()
іstrerror()
, які є в стандартній бібліотеці C89.Python 2.6 можна створити за допомогою Microsoft Visual Studio 2008 (версія 9.0), і це новий компілятор за замовчуванням. Перегляньте каталог
PCbuild
для файлів збірки. (Реалізовано Крістіаном Хеймсом.)У Mac OS X Python 2.6 можна скомпілювати як чотиристоронню універсальну збірку. Сценарій configure може приймати перемикач
--with-universal-archs=[32-bit|64-bit|all]
, контролюючи, чи створено двійкові файли для 32-розрядних архітектур ( x86, PowerPC), 64-розрядні (x86-64 і PPC-64) або обидва. (Надав Рональд Уссорен.)Модуль BerkeleyDB тепер має об’єкт C API, доступний як
bsddb.db.api
. Цей об’єкт може використовуватися іншими розширеннями C, які бажають використовувати модульbsddb
для власних цілей. (Надав Дункан Грісбі.)Новий інтерфейс буфера, раніше описаний у розділі PEP 3118, додає
PyObject_GetBuffer()
іPyBuffer_Release()
, а також кілька інших функцій.Використання Python бібліотеки C stdio тепер безпечно для потоків або, принаймні, настільки ж безпечно для потоків, як і базова бібліотека. Тривала потенційна помилка виникла, якщо один потік закрив об’єкт файлу, а інший потік читав або записував об’єкт. У версії 2.6 файлові об’єкти мають кількість посилань, якою керують функції
PyFile_IncUseCount()
іPyFile_DecUseCount()
. Файлові об’єкти не можна закрити, якщо кількість посилань не дорівнює нулю.PyFile_IncUseCount()
слід викликати, поки GIL все ще утримується, перед виконанням операції введення/виведення за допомогою вказівникаFILE *
, аPyFile_DecUseCount()
слід викликати відразу після GIL отримується повторно. (Надано Антуаном Пітру та Грегорі П. Смітом.)Одночасне імпортування модулів у двох різних потоках більше не викликає взаємоблокувань; тепер це викличе
ImportError
. Нова функція API,PyImport_ImportModuleNoBlock()
, спочатку шукатиме модуль уsys.modules
, а потім намагатиметься імпортувати його після отримання блокування імпорту. Якщо блокування імпорту утримується іншим потоком, виникаєImportError
. (Надано Крістіаном Хеймсом.)Кілька функцій повертають інформацію про підтримку платформою операцій з плаваючою комою.
PyFloat_GetMax()
повертає максимальне значення з плаваючою комою, яке можна представити, аPyFloat_GetMin()
повертає мінімальне позитивне значення.PyFloat_GetInfo()
повертає об’єкт, що містить більше інформації з файлуfloat.h
, як-от"mant_dig"
(кількість цифр у мантисі),"epsilon"
(найменша різниця між 1,0 і наступним найбільшим значенням, яке можна представити), і кілька інших. (Надав Крістіан Хаймес; bpo-1534.)Функції та методи C, які використовують
PyComplex_AsCComplex()
, тепер прийматимуть аргументи, які мають метод__complex__()
. Зокрема, функції в модуліcmath
тепер прийматимуть об’єкти за допомогою цього методу. Це бекпорт зміни Python 3.0. (Надав Марк Дікінсон; bpo-1675423.)C API Python тепер містить дві функції для порівняння рядків без урахування регістру:
PyOS_stricmp(char*, char*)
іPyOS_strnicmp(char*, char*, Py_ssize_t)
. (Надав Крістіан Хаймес; bpo-1635.)Багато розширень C визначають власний маленький макрос для додавання цілих чисел і рядків до словника модуля у функції
init*
. Python 2.6 нарешті визначає стандартні макроси для додавання значень до модуля,PyModule_AddStringMacro
іPyModule_AddIntMacro()
. (Надано Крістіаном Хеймсом.)Деякі макроси було перейменовано у версіях 3.0 і 2.6, щоб було зрозуміліше, що вони є макросами, а не функціями.
Py_Size()
ставPy_SIZE()
,Py_Type()
ставPy_TYPE()
, аPy_Refcnt()
ставPy_REFCNT()
. Макроси змішаного регістру все ще доступні в Python 2.6 для зворотної сумісності. (bpo-1629)Distutils тепер розміщує створені ним розширення C в іншому каталозі під час роботи на налагодженій версії Python. (Надав Колін Вінтер; bpo-1530959.)
Кілька основних типів даних, таких як цілі числа та рядки, підтримують внутрішні вільні списки об’єктів, які можна повторно використовувати. Структури даних для цих вільних списків тепер дотримуються угоди про іменування: змінна завжди має назву
free_list
, лічильник завжди має назвуnumfree
, а макросPy <typename> _MAXFREELIST
завжди визначено.Нова ціль Makefile, «make patchcheck», готує вихідне дерево Python для створення виправлення: вона виправляє кінцеві пробіли в усіх змінених файлах
.py
, перевіряє, чи було змінено документацію, і повідомляє, чиMisc/ACKS
іMisc/NEWS
оновлено. (Надав Бретт Кеннон.)Інша нова ціль, «make profile-opt», компілює двійковий файл Python за допомогою оптимізації профілю GCC. Він компілює Python із увімкненим профілюванням, запускає набір тестів для отримання набору результатів профілювання, а потім компілює, використовуючи ці результати для оптимізації. (Надав Грегорі П. Сміт.)
Зміни, що стосуються порту: Windows¶
Підтримку Windows 95, 98, ME та NT4 припинено. Python 2.6 вимагає принаймні Windows 2000 SP4.
Новим компілятором за замовчуванням у Windows є Visual Studio 2008 (версія 9.0). Каталоги збірки для Visual Studio 2003 (версія 7.1) і 2005 (версія 8.0) переміщено в каталог PC/. Новий каталог
PCbuild
підтримує крос-компіляцію для X64, збірки для налагодження та керовану оптимізацію профілем (PGO). Збірки PGO приблизно на 10% швидші за звичайні. (Надано Крістіаном Хеймсом за допомогою Аморі Форже д’Арк і Мартіна фон Льовіса.)Модуль
msvcrt
тепер підтримує як звичайні, так і широкі символьні варіанти API консолі вводу-виводу. Функціяgetwch()
зчитує натискання клавіші та повертає значення Unicode, як і функціяgetwche()
. Функціяputwch()
приймає символ Unicode і записує його на консоль. (Надано Крістіаном Хеймсом.)os.path.expandvars()
тепер розгорне змінні середовища у формі «%var%», а «~user» буде розгорнуто до шляху до домашнього каталогу користувача. (Надав Джосія Карлсон; bpo-957650.)Об’єкти socket модуля
socket
тепер мають методioctl()
, який забезпечує обмежений інтерфейс до системного інтерфейсуWSAIoctl()
.Модуль
_winreg
тепер має функціюExpandEnvironmentStrings()
, яка розширює посилання на змінні середовища, такі як%NAME%
у вхідному рядку. Об’єкти-дескриптори, надані цим модулем, тепер підтримують протокол контексту, тому їх можна використовувати в операторахwith
. (Надано Крістіаном Хеймсом.)_winreg
також має кращу підтримку для систем x64, відкриваючи функціїDisableReflectionKey()
,EnableReflectionKey()
іQueryReflectionKey()
, які вмикають і вимикають відображення реєстру для 32-розрядних процесів працює на 64-розрядних системах. (bpo-1753245)Об’єкт
Record
модуляmsilib
отримав методиGetInteger()
іGetString()
, які повертають значення полів як ціле число або рядок. (Надав Флоріс Бруйнуге; bpo-2125.)
Зміни, що стосуються порту: Mac OS X¶
Під час компіляції збірки фреймворка Python тепер ви можете вказати ім’я фреймворка, яке буде використовуватися, надавши параметр
--with-framework-name=
сценарію configure.Модуль
macfs
видалено. Це, у свою чергу, вимагало видалення функціїmacostools.touched()
, оскільки вона залежала від модуляmacfs
. (bpo-1490190)Багато інших модулів Mac OS застаріли та будуть видалені в Python 3.0:
_builtinSuites
,aepack
,aetools
,aetypes
,applesingle
,appletrawmain
,appletrunner
,argvemulator
,Audio_mac
,autoGIL
,Carbon
,cfmfile
,CodeWarrior
,ColorPicker
,EasyDialogs
,Explorer
,Finder
,FrameWork
,findertools
,ic
,icglue
,icopen
,macerrors
,MacOS
,macfs
,macostools
,macresource
,MiniAEFrame
,Nav
,Netscape
,OSATerminology
,pimp
,PixMapWrapper
,StdSuites
,SystemEvents
,Terminal
іterminalcommand
.
Зміни, що стосуються порту: IRIX¶
Кілька старих модулів, специфічних для IRIX, застаріли та будуть видалені в Python 3.0: al
і AL
, cd
, cddb
, cdplayer
, CL
і cl
, DEVICE
, ERRNO
, FILE
, FL
і fl
, flp
, fm
, GET
, GLWS
, GL
і gl
, IN
, IOCTL
, jpeg
, panelparser
, readcd
, SV
і sv
, torgb
, videoreader
і WAIT
.
Перенесення на Python 2.6¶
У цьому розділі перераховані раніше описані зміни та інші виправлення помилок, які можуть потребувати змін у вашому коді:
Класи, які не мають бути хешованими, повинні встановити
__hash__ = None
у своїх визначеннях, щоб вказати цей факт.Рядкові винятки видалено. Спроба використати їх викликає
TypeError
.Метод
__init__()
collections.deque
тепер очищає будь-який наявний вміст deque перед додаванням елементів із iterable. Ця зміна робить поведінку відповідноюlist.__init__()
.object.__init__()
раніше приймав довільні аргументи та ключові аргументи, ігноруючи їх. У Python 2.6 це більше не дозволено та призведе доTypeError
. Це вплине на методи__init__()
, які призводять до виклику відповідного методу вobject
(можливо, через використанняsuper()
). Перегляньте bpo-1683368 для обговорення.Конструктор
Decimal
тепер приймає пробіли на початку та в кінці під час передачі рядка. Раніше це викликало винятокInvalidOperation
. З іншого боку, методcreate_decimal()
об’єктівContext
тепер явно забороняє додаткові пробіли, викликаючи винятокConversionSyntax
.Через помилку реалізації, якщо ви передали шлях до файлу вбудованій функції
__import__()
, вона фактично імпортує вказаний файл. Однак це ніколи не планувалося працювати, і реалізація тепер явно перевіряє цей випадок і викликаєImportError
.C API: функції
PyImport_Import()
іPyImport_ImportModule()
тепер за замовчуванням використовують абсолютний, а не відносний імпорт. Це вплине на розширення C, які імпортують інші модулі.C API: типи даних розширення, які не можна хешувати, повинні визначити свій слот
tp_hash
якPyObject_HashNotImplemented()
.Виняток модуля
socket
socket.error
тепер успадковує відIOError
. Раніше це не було підкласомStandardError
, але тепер це є черезIOError
. (Реалізовано Грегорі П. Смітом; bpo-1706815.)Модуль
xmlrpclib
більше не перетворює автоматичноdatetime.date
іdatetime.time
на типxmlrpclib.DateTime
; семантика перетворення не обов’язково була правильною для всіх програм. Код із використаннямxmlrpclib
має конвертувати екземпляриdate
іtime
. (bpo-1330538)(Режим попередження 3.0) Клас
Exception
тепер попереджає, коли до нього звертаються за допомогою доступу до фрагментів або індексу; наявністьException
поводиться як кортеж, який поступово припиняється.(3.0-режим попередження) порівняння нерівності між двома словниками або двома об’єктами, які не реалізують методи порівняння, повідомляються як попередження.
dict1 == dict2
все ще працює, алеdict1 < dict2
поступово припиняється.Порівняння між клітинками, які є частиною реалізації правил визначення області дії Python, також викликають попередження, оскільки такі порівняння повністю заборонені в 3.0.
Подяки¶
Автор хотів би подякувати наступним людям за пропозиції, виправлення та допомогу з різними чернетками цієї статті: Георг Брандл, Стів Браун, Нік Коглан, Ральф Кордерой, Джим Джеветт, Кент Джонсон, Кріс Ламбакер, Мартін Міхлмайр, Антуан Пітру, Браян Ворнер.