Що нового в Python 3.1¶
- Автор
Raymond Hettinger
This article explains the new features in Python 3.1, compared to 3.0.
PEP 372: Упорядковані словники¶
Звичайні словники Python перебирають пари ключ/значення в довільному порядку. Протягом багатьох років кілька авторів написали альтернативні реалізації, які запам’ятовують порядок початкового вставлення ключів. На основі досвіду цих реалізацій було введено новий клас collections.OrderedDict
.
API OrderedDict практично такий же, як і звичайні словники, але перебиратиме ключі та значення в гарантованому порядку залежно від того, коли ключ було вперше вставлено. Якщо новий запис перезаписує існуючий запис, початкова позиція вставки залишається незмінною. Видалення запису та його повторне вставлення перемістить його в кінець.
The standard library now supports use of ordered dictionaries in several
modules. The configparser
module uses them by default. This lets
configuration files be read, modified, and then written back in their original
order. The _asdict() method for collections.namedtuple()
now
returns an ordered dictionary with the values appearing in the same order as
the underlying tuple indices. The json
module is being built-out with
an object_pairs_hook to allow OrderedDicts to be built by the decoder.
Support was also added for third-party tools like PyYAML.
Дивись також
- PEP 372 - Впорядковані словники
PEP, автори Армін Роначер і Раймонд Геттінгер. Реалізацію написав Раймонд Хеттінгер.
PEP 378: Специфікатор формату для розділювача тисяч¶
Вбудована функція format()
і метод str.format()
використовують міні-мову, яка тепер містить простий спосіб форматування числа з роздільником тисяч, який не залежить від локалі. Це надає спосіб гуманізувати вихідні дані програми, покращуючи її професійний вигляд і читабельність:
>>> format(1234567, ',d')
'1,234,567'
>>> format(1234567.89, ',.2f')
'1,234,567.89'
>>> format(12345.6 + 8901234.12j, ',f')
'12,345.600000+8,901,234.120000j'
>>> format(Decimal('1234567.89'), ',f')
'1,234,567.89'
Підтримувані типи: int
, float
, complex
і decimal.Decimal
.
Ведуться дискусії про те, як вказати альтернативні роздільники, такі як крапки, пробіли, апострофи або підкреслення. Програми з розпізнаванням локалі повинні використовувати існуючий специфікатор формату n, який уже підтримує певну підтримку роздільників тисяч.
Дивись також
- PEP 378 - Специфікатор формату для розділювача тисяч
PEP, написаний Реймондом Геттінгером і реалізований Еріком Смітом і Марком Дікінсоном.
Інші зміни мови¶
Деякі менші зміни, внесені до основної мови Python:
Каталоги та zip-архіви, що містять файл
__main__.py
, тепер можна виконувати безпосередньо, передавши їх імена інтерпретатору. Каталог/файл zip автоматично вставляється як перший запис у sys.path. (Пропозиція та початковий патч від Енді Чу; переглянуте патч від Філіпа Дж. Ебі та Ніка Коглана; bpo-1739468.)Тип
int()
отримав методbit_length
, який повертає кількість бітів, необхідних для представлення свого аргументу в двійковому вигляді:>>> n = 37 >>> bin(37) '0b100101' >>> n.bit_length() 6 >>> n = 2**123-1 >>> n.bit_length() 123 >>> (n+1).bit_length() 124
(Надано Фредріком Йоханссоном, Віктором Стіннером, Реймондом Геттінгером і Марком Дікінсоном; bpo-3439.)
Поля в рядках
format()
тепер можуть бути автоматично пронумеровані:>>> 'Sir {} of {}'.format('Gallahad', 'Camelot') 'Sir Gallahad of Camelot'
Раніше рядок вимагав пронумерованих полів, таких як:
'Sir {0} of {1}''
.(Надав Ерік Сміт; bpo-5237.)
Функція
string.maketrans()
є застарілою та замінена новими статичними методами,bytes.maketrans()
іbytearray.maketrans()
. Ця зміна вирішує плутанину навколо того, які типи підтримувалися модулемstring
. Теперstr
,bytes
іbytearray
кожен має власні методи maketrans і translate із проміжними таблицями перекладу відповідного типу.(Надав Георг Брандл; bpo-5675.)
Синтаксис оператора
with
тепер дозволяє використовувати декілька менеджерів контексту в одному операторі:>>> with open('mylog.txt') as infile, open('a.out', 'w') as outfile: ... for line in infile: ... if '<critical>' in line: ... outfile.write(line)
З новим синтаксисом функція
contextlib.nested()
більше не потрібна, і тепер вона застаріла.(Надано Георгом Брандлом і Маттіасом Брендстремом; appspot issue 53094.)
round(x, n)
тепер повертає ціле число, якщо x є цілим числом. Раніше він повертав float:>>> round(1123, -2) 1100
(Надав Марк Дікінсон; bpo-4707.)
Тепер Python використовує алгоритм Девіда Гея для пошуку найкоротшого представлення з плаваючою комою, яке не змінює свого значення. Це має допомогти пом’якшити плутанину навколо двійкових чисел з плаваючою комою.
Значення легко побачити за допомогою числа на зразок
1,1
, яке не має точного еквівалента в двійковій формі з плаваючою комою. Оскільки немає точного еквівалента, вираз на кшталтfloat('1.1')
обчислюється до найближчого значення, яке можна представити, яке є0x1.199999999999ap+0
у шістнадцятковому або1.100000000000000088817841970012523233890533447265625
в десятковому. Це найближче значення використовувалося і досі використовується в наступних обчисленнях з плаваючою комою.Новим є спосіб відображення номера. Раніше Python використовував простий підхід. Значення
repr(1.1)
було обчислено якformat(1.1, '.17g')
, яке оцінювалося як'1,1000000000000001''
. Перевага використання 17 цифр полягала в тому, що він покладався на гарантії IEEE-754, щоб гарантувати, щоeval(repr(1.1))
повертатиме точно до початкового значення. Недоліком є те, що багато людей вважали результат заплутаним (вважаючи, що внутрішні обмеження двійкового представлення з плаваючою комою є проблемою самого Python).Новий алгоритм для
repr(1.1)
розумніший і повертає'1.1'
. По суті, він шукає всі еквівалентні представлення рядків (ті, які зберігаються з тим самим базовим значенням з плаваючою точкою) і повертає найкоротше представлення.Новий алгоритм має тенденцію видавати чіткіші представлення, коли це можливо, але він не змінює основні значення. Таким чином, це все ще так, що
1.1 + 2.2 != 3.3
, навіть якщо представлення можуть припускати інше.Новий алгоритм залежить від певних особливостей базової реалізації з плаваючою комою. Якщо потрібні функції не знайдено, продовжуватиме використовуватися старий алгоритм. Крім того, протоколи піклування тексту забезпечують міжплатформну переносимість за допомогою старого алгоритму.
(Надано Еріком Смітом і Марком Дікінсоном; bpo-1580)
Нові, покращені та застарілі модулі¶
Додано клас
collections.Counter
для підтримки зручного підрахунку унікальних елементів у послідовності або ітерації:>>> Counter(['red', 'blue', 'red', 'green', 'blue', 'blue']) Counter({'blue': 3, 'red': 2, 'green': 1})
(Надав Реймонд Геттінгер; bpo-1696199.)
Додано новий модуль
tkinter.ttk
для доступу до набору тематичних віджетів Tk. Основна ідея ttk полягає в тому, щоб відокремити, наскільки це можливо, код, що реалізує поведінку віджета, від коду, що реалізує його зовнішній вигляд.(Надав Гільєрме Поло; bpo-2983.)
Класи
gzip.GzipFile
іbz2.BZ2File
тепер підтримують протокол керування контекстом:>>> # Automatically close file after writing >>> with gzip.GzipFile(filename, "wb") as f: ... f.write(b"xxx")
(Надав Антуан Пітру.)
Модуль
decimal
тепер підтримує методи для створення десяткового об’єкта з двійковогоfloat
. Перетворення точне, але іноді може бути несподіваним:>>> Decimal.from_float(1.1) Decimal('1.100000000000000088817841970012523233890533447265625')
Довгий десятковий результат показує фактичний двійковий дріб, який зберігається для 1,1. Дріб має багато цифр, оскільки 1.1 не може бути точно представлений у двійковому вигляді.
(Надано Реймондом Геттінгером і Марком Дікінсоном.)
Модуль
itertools
розширив дві нові функції. Функціяitertools.combinations_with_replacement()
є однією з чотирьох для створення комбінаторики, включаючи перестановки та декартові добутки. Функціяitertools.compress()
імітує свою тезку з APL. Крім того, наявна функціяitertools.count()
тепер має додатковий аргумент step і може приймати будь-який тип послідовності підрахунку, включаючиfractions.Fraction
іdecimal.Decimal
:>>> [p+q for p,q in combinations_with_replacement('LOVE', 2)] ['LL', 'LO', 'LV', 'LE', 'OO', 'OV', 'OE', 'VV', 'VE', 'EE'] >>> list(compress(data=range(10), selectors=[0,0,1,1,0,1,0,1,0,0])) [2, 3, 5, 7] >>> c = count(start=Fraction(1,2), step=Fraction(1,6)) >>> [next(c), next(c), next(c), next(c)] [Fraction(1, 2), Fraction(2, 3), Fraction(5, 6), Fraction(1, 1)]
(Надав Реймонд Геттінгер.)
collections.namedtuple()
тепер підтримує аргумент ключового слова rename, який дозволяє автоматично перетворювати недійсні назви полів на позиційні імена у формі _0, _1 тощо. Це корисно, коли назви полів створюються зовнішнім джерелом, наприклад як заголовок CSV, список полів SQL або введення користувача:>>> query = input() SELECT region, dept, count(*) FROM main GROUPBY region, dept >>> cursor.execute(query) >>> query_fields = [desc[0] for desc in cursor.description] >>> UserQuery = namedtuple('UserQuery', query_fields, rename=True) >>> pprint.pprint([UserQuery(*row) for row in cursor]) [UserQuery(region='South', dept='Shipping', _2=185), UserQuery(region='North', dept='Accounting', _2=37), UserQuery(region='West', dept='Sales', _2=419)]
(Надав Раймонд Геттінгер; bpo-1818.)
Функції
re.sub()
,re.subn()
іre.split()
тепер приймають параметр flags.(Надав Грегорі Сміт.)
Модуль
logging
тепер реалізує простий класlogging.NullHandler
для програм, які не використовують журналювання, але викликають код бібліотеки, який це робить. Налаштування нульового обробника придушить фальшиві попередження, такі як «Не вдалося знайти обробників для logger foo»:>>> h = logging.NullHandler() >>> logging.getLogger("foo").addHandler(h)
(Надав Віней Саджип; bpo-4384).
Модуль
runpy
, який підтримує перемикач командного рядка-m
, тепер підтримує виконання пакетів шляхом пошуку та виконання субмодуля__main__
, коли надається ім’я пакета.(Надав Анді Вайда; bpo-4195.)
Модуль
pdb
тепер може отримувати доступ і відображати вихідний код, завантажений черезzipimport
(або будь-який інший відповідний завантажувач PEP 302).(Надав Олександр Бєлопольський; bpo-4201.)
functools.partial
об’єкти тепер можна маринувати.
(Запропоновано Антуаном Пітру та Джессі Ноллером. Реалізовано Джеком Дідеріхом; bpo-5228.)
Додайте теми довідки
pydoc
для символів, щобhelp('@')
працював належним чином в інтерактивному середовищі.(Надав Девід Лабан; bpo-4739.)
Модуль
unittest
тепер підтримує пропуски окремих тестів або класів тестів. І він підтримує позначення тесту як очікуваної невдачі, тесту, який, як відомо, зламаний, але не повинен вважатися невдалим у TestResult:class TestGizmo(unittest.TestCase): @unittest.skipUnless(sys.platform.startswith("win"), "requires Windows") def test_gizmo_on_windows(self): ... @unittest.expectedFailure def test_gimzo_without_required_library(self): ...
Крім того, для роботи з менеджерами контексту за допомогою оператора
with
:def test_division_by_zero(self): with self.assertRaises(ZeroDivisionError): x / 0
Крім того, було додано кілька нових методів твердження, зокрема
assertSetEqual()
,assertDictEqual()
,assertDictContainsSubset()
,assertListEqual()
,assertTupleEqual()
,assertSequenceEqual()
,assertRaisesRegexp()
,assertIsNone()
іassertIsNotNone()
.(Надано Бенджаміном Петерсоном і Антуаном Пітру.)
Модуль
io
має три нові константи для методуseek()
SEEK_SET
,SEEK_CUR
іSEEK_END
.Кортеж
sys.version_info
тепер є іменованим кортежем:>>> sys.version_info sys.version_info(major=3, minor=1, micro=0, releaselevel='alpha', serial=2)
(Надав Росс Лайт; bpo-4285.)
Модуль
pickle
було адаптовано для кращої сумісності з Python 2.x при використанні протоколу 2 або нижчого. Реорганізація стандартної бібліотеки змінила формальне посилання для багатьох об’єктів. Наприклад,__builtin__.set
у Python 2 називаєтьсяbuiltins.set
у Python 3. Ця зміна збентежила спроби обмінюватися даними між різними версіями Python. Але тепер, коли вибрано протокол 2 або нижчий, піклер автоматично використовуватиме старі назви Python 2 як для завантаження, так і для вивантаження. Це перевідображення ввімкнено за замовчуванням, але його можна вимкнути за допомогою опції fix_imports:>>> s = {1, 2, 3} >>> pickle.dumps(s, protocol=0) b'c__builtin__\nset\np0\n((lp1\nL1L\naL2L\naL3L\natp2\nRp3\n.' >>> pickle.dumps(s, protocol=0, fix_imports=False) b'cbuiltins\nset\np0\n((lp1\nL1L\naL2L\naL3L\natp2\nRp3\n.'
Неприємний, але неминучий побічний ефект цієї зміни полягає в тому, що піклі протоколу 2, створені Python 3.1, не можна буде прочитати з Python 3.0. Найновіший протокол pickle, протокол 3, слід використовувати під час переміщення даних між реалізаціями Python 3.x, оскільки він не намагається зберегти сумісність із Python 2.x.
(Надано Александром Вассалотті та Антуаном Пітру, bpo-6137.)
Додано новий модуль
importlib
. Він забезпечує повну, портативну, чисту довідкову реалізацію на Python оператораimport
і його відповідника, функції__import__()
. Це значний крок вперед у документуванні та визначенні дій, які відбуваються під час імпорту.(Надав Бретт Кеннон.)
Оптимізації¶
Додано основні покращення продуктивності:
Нова бібліотека введення-виведення (як визначено в PEP 3116) була здебільшого написана на Python і швидко виявилася проблемним вузьким місцем у Python 3.0. У Python 3.1 бібліотеку вводу/виводу було повністю переписано на C і вона працює від 2 до 20 разів швидше залежно від поставленого завдання. Чиста версія Python все ще доступна для експериментальних цілей через модуль
_pyio
.(Надано Аморі Форже д’Арк і Антуаном Пітру.)
Додано евристику, щоб кортежі та dicts, що містять лише невідстежувані об’єкти, не відстежувалися збирачем сміття. Це може зменшити розмір колекцій і, отже, накладні витрати на збирання сміття в програмах, що працюють довго, залежно від конкретного використання типів даних.
(Надав Антуан Пітру, bpo-4688.)
Увімкнувши параметр конфігурації під назвою
--with-computed-gotos
на компіляторах, які його підтримують (зокрема, gcc, SunPro, icc), цикл оцінки байт-коду компілюється з новим механізмом відправки, який забезпечує прискорення до 20% , залежно від системи, компілятора та тесту.(Надано Антуаном Пітру та низкою інших учасників, bpo-4753).
Декодування UTF-8, UTF-16 і LATIN-1 тепер у два-чотири рази швидше.
(Надано Антуаном Пітру та Аморі Форже д’Арк, bpo-4868.)
The
json
module now has a C extension to substantially improve its performance. In addition, the API was modified so that json works only withstr
, not withbytes
. That change makes the module closely match the JSON specification which is defined in terms of Unicode.(Надано Бобом Іполіто та перетворено на Py3.1 Антуаном Пітру та Бенджаміном Петерсоном; bpo-4136.)
Unpickling тепер інтернує назви атрибутів маринованих об’єктів. Це економить пам’ять і дозволяє зробити солоні огірки меншими.
(Надано Джейком Макгуайром і Антуаном Пітру; bpo-5084.)
ПРОСТОЮЧИЙ¶
Меню форматування IDLE тепер надає можливість видаляти кінцеві пробіли з вихідного файлу.
(Надав Роджер Д. Серві; bpo-5150.)
Зміни збірки та C API¶
Зміни в процесі збирання Python і в API C включають:
Цілі числа тепер зберігаються внутрішньо або в базі
2**15
, або в базі2**30
, причому база визначається під час створення. Раніше вони завжди зберігалися в базі2**15
. Використання бази2**30
дає значне покращення продуктивності на 64-розрядних машинах, але результати порівняльного тестування на 32-розрядних машинах були неоднозначними. Тому за замовчуванням на 64-розрядних машинах використовується основа2**30
і основа2**15
на 32-розрядних машинах; в Unix є новий параметр конфігурації--enable-big-digits
, який можна використовувати для заміни цього значення за замовчуванням.Окрім підвищення продуктивності, ця зміна має бути непомітною для кінцевих користувачів, за одним винятком: для цілей тестування та налагодження є новий
sys.int_info
, який надає інформацію про внутрішній формат, надаючи кількість бітів на цифру та розмір у байтах типу C, що використовується для зберігання кожної цифри:>>> import sys >>> sys.int_info sys.int_info(bits_per_digit=30, sizeof_digit=4)
(Надав Марк Дікінсон; bpo-4258.)
Функція
PyLong_AsUnsignedLongLong()
тепер обробляє негативний pylong, викликаючиOverflowError
замістьTypeError
.(Надано Марком Дікінсоном і Лісандро Далкріном; bpo-5175.)
Застаріле
PyNumber_Int()
. Натомість використовуйтеPyNumber_Long()
.(Надав Марк Дікінсон; bpo-4910.)
Додано нову функцію
PyOS_string_to_double()
для заміни застарілих функційPyOS_ascii_strtod()
іPyOS_ascii_atof()
.(Надав Марк Дікінсон; bpo-5914.)
Додано
PyCapsule
як заміну APIPyCObject
. Принципова відмінність полягає в тому, що новий тип має чітко визначений інтерфейс для передачі інформації про безпеку введення та менш складний підпис для виклику деструктора. Старий тип мав проблемний API, і тепер він застарів.(Надав Ларрі Гастінгс; bpo-5630.)
Перенесення на Python 3.1¶
У цьому розділі перераховані раніше описані зміни та інші виправлення помилок, які можуть потребувати змін у вашому коді:
Нові представлення рядків із плаваючою комою можуть порушити існуючі тести документів. Наприклад:
def e(): '''Compute the base of natural logarithms. >>> e() 2.7182818284590451 ''' return sum(1/math.factorial(x) for x in reversed(range(30))) doctest.testmod() ********************************************************************** Failed example: e() Expected: 2.7182818284590451 Got: 2.718281828459045 **********************************************************************
Автоматичне перевідображення імен у модулі pickle для протоколу 2 або нижчої версії може зробити pickles Python 3.1 нечитабельними в Python 3.0. Одним із рішень є використання протоколу 3. Іншим рішенням є встановлення опції fix_imports на
False
. Дивіться обговорення вище для отримання додаткової інформації.