Що нового в Python 2.4

Автор:

A.M. Kuchling

У цій статті пояснюються нові функції Python 2.4.1, випущеного 30 березня 2005 року.

Python 2.4 — випуск середнього розміру. Він не вносить стільки змін, як радикальний Python 2.2, але пропонує більше функцій, ніж консервативний випуск 2.3. Найважливішими новими можливостями мови є декоратори функцій і вирази-генератори; більшість інших змін стосуються стандартної бібліотеки.

Згідно з журналами змін CVS, було застосовано 481 патч і 502 виправлені помилки між Python 2.3 і 2.4. Обидві цифри, ймовірно, занижені.

Ця стаття не намагається надати повну специфікацію кожної окремої нової функції, а натомість містить короткий вступ до кожної функції. Щоб отримати повну інформацію, зверніться до документації для Python 2.4, наприклад довідника бібліотеки Python і довідкового посібника Python. Часто вас направлять до PEP щодо конкретної нової функції для пояснень реалізації та обґрунтування дизайну.

PEP 218: Вбудовані об’єкти

Python 2.3 представив модуль sets. Реалізації C типів даних set тепер додано до ядра Python у вигляді двох нових вбудованих типів, set(iterable) і frozenset(iterable). Вони забезпечують високу швидкість виконання операцій для тестування членства, для усунення дублікатів із послідовностей і для математичних операцій, таких як об’єднання, перетини, різниці та симетричні різниці.

>>> a = set('abracadabra')              # form a set from a string
>>> 'z' in a                            # fast membership testing
False
>>> a                                   # unique letters in a
set(['a', 'r', 'b', 'c', 'd'])
>>> ''.join(a)                          # convert back into a string
'arbcd'

>>> b = set('alacazam')                 # form a second set
>>> a - b                               # letters in a but not in b
set(['r', 'd', 'b'])
>>> a | b                               # letters in either a or b
set(['a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'])
>>> a & b                               # letters in both a and b
set(['a', 'c'])
>>> a ^ b                               # letters in a or b but not both
set(['r', 'd', 'b', 'm', 'z', 'l'])

>>> a.add('z')                          # add a new element
>>> a.update('wxy')                     # add multiple new elements
>>> a
set(['a', 'c', 'b', 'd', 'r', 'w', 'y', 'x', 'z'])
>>> a.remove('x')                       # take one element out
>>> a
set(['a', 'c', 'b', 'd', 'r', 'w', 'y', 'z'])

Тип frozenset() є незмінною версією set(). Оскільки він незмінний і хешується, його можна використовувати як ключ словника або як член іншого набору.

Модуль sets залишається в стандартній бібліотеці та може бути корисним, якщо ви бажаєте створити підклас класів Set або ImmutableSet. Наразі немає планів припинення підтримки модуля.

Дивись також

PEP 218 - Додавання вбудованого типу об’єкта Set

Спочатку запропонований Грегом Вілсоном і остаточно реалізований Реймондом Геттінгером.

PEP 237: Об’єднання довгих і цілих чисел

Тривалий процес переходу для цього PEP, розпочатий у Python 2.2, робить ще один крок вперед у Python 2.4. У версії 2.3 певні цілочисельні операції, які поводилися б інакше після об’єднання int/long, викликали попередження FutureWarning і повертали значення, обмежені 32 або 64 бітами (залежно від вашої платформи). У версії 2.4 ці вирази більше не створюють попередження, а натомість створюють інший результат, який зазвичай є довгим цілим числом.

Проблемними виразами є, перш за все, зрушення вліво та довгі шістнадцяткові та вісімкові константи. Наприклад, 2 << 32 призводить до попередження у 2.3, оцінюючи 0 на 32-розрядних платформах. У Python 2.4 цей вираз тепер повертає правильну відповідь, 8589934592.

Дивись також

PEP 237 - Об’єднання довгих і цілих чисел

Оригінальний PEP, написаний Моше Цадка та GvR. Зміни у версії 2.4 вніс Калле Свенссон.

PEP 289: Генератор виразів

The iterator feature introduced in Python 2.2 and the itertools module make it easier to write programs that loop through large data sets without having the entire data set in memory at one time. List comprehensions don’t fit into this picture very well because they produce a Python list object containing all of the items. This unavoidably pulls all of the objects into memory, which can be a problem if your data set is very large. When trying to write a functionally styled program, it would be natural to write something like:

links = [link for link in get_all_links() if not link.followed]
for link in links:
    ...

замість

for link in get_all_links():
    if link.followed:
        continue
    ...

Перша форма більш лаконічна і, можливо, більш читабельна, але якщо ви маєте справу з великою кількістю об’єктів посилань, вам доведеться написати другу форму, щоб уникнути одночасного зберігання всіх об’єктів посилань у пам’яті.

Вирази генератора працюють так само, як і розуміння списків, але не матеріалізують весь список; натомість вони створюють генератор, який повертатиме елементи один за одним. Наведений вище приклад можна записати так:

links = (link for link in get_all_links() if not link.followed)
for link in links:
    ...

Вирази-генератори завжди мають бути записані в круглих дужках, як у прикладі вище. Дужки, що сигналізують про виклик функції, також враховуються, тому, якщо ви хочете створити ітератор, який буде негайно передано функції, ви можете написати:

print sum(obj.count for obj in list_all_objects())

Вирази генератора відрізняються від розуміння списків кількома дрібницями. Зокрема, змінна циклу (obj у наведеному вище прикладі) недоступна поза виразом генератора. Розуміння списків залишає змінну присвоєною її останньому значенню; майбутні версії Python змінять це, зробивши розуміння списку відповідним виразам генератора в цьому відношенні.

Дивись також

PEP 289 - Генератор виразів

Запропоновано Raymond Hettinger і реалізовано Jiwon Seo з ранніми зусиллями під керівництвом Hye-Shik Chang.

PEP 292: Простіші заміни рядків

Деякі нові класи в стандартній бібліотеці забезпечують альтернативний механізм для підстановки змінних у рядки; цей стиль заміни може бути кращим для додатків, де ненавченим користувачам потрібно редагувати шаблони.

Звичайним способом заміни змінних за іменем є оператор %:

>>> '%(page)i: %(title)s' % {'page':2, 'title': 'The Best of Times'}
'2: The Best of Times'

Під час написання рядка шаблону може бути легко забути i або s після закриваючої дужки. Це не є великою проблемою, якщо шаблон міститься в модулі Python, тому що ви запускаєте код, отримуєте «Символ непідтримуваного формату» ValueError і вирішуєте проблему. Однак розгляньте такий додаток, як Mailman, у якому рядки шаблону або переклади редагуються користувачами, які не знають мови Python. Синтаксис форматного рядка складно пояснити таким користувачам, і якщо вони роблять помилку, їм важко надати корисний відгук.

PEP 292 додає клас Template до модуля string, який використовує $ для позначення заміни:

>>> import string
>>> t = string.Template('$page: $title')
>>> t.substitute({'page':2, 'title': 'The Best of Times'})
'2: The Best of Times'

Якщо в словнику відсутній ключ, метод substitute() викличе KeyError. Існує також метод safe_substitute(), який ігнорує відсутні ключі:

>>> t = string.Template('$page: $title')
>>> t.safe_substitute({'page':3})
'3: $title'

Дивись також

PEP 292 - Простіші підстановки рядків

Написав і реалізував Баррі Варшау.

PEP 318: Декоратори для функцій і методів

Python 2.2 розширив об’єктну модель Python, додавши статичні методи та методи класу, але не розширив синтаксис Python, щоб надати новий спосіб визначення статичних методів або методів класу. Замість цього вам потрібно було написати оператор def у звичайний спосіб і передати отриманий метод у функцію staticmethod() або classmethod(), яка завершувала б функцію як метод новий тип. Ваш код виглядатиме так:

class C:
   def meth (cls):
       ...

   meth = classmethod(meth)   # Rebind name to wrapped-up class method

Якби метод був дуже довгим, було б легко пропустити або забути виклик classmethod() після тіла функції.

Намір завжди полягав у тому, щоб додати певний синтаксис, щоб зробити такі визначення більш читабельними, але на момент випуску версії 2.2 хороший синтаксис не був очевидним. Сьогодні хороший синтаксис все ще неочевидний, але користувачі просять полегшити доступ до функції; для задоволення цієї потреби додано нову синтаксичну функцію.

Нова функція називається «декоратори функцій». Назва походить від ідеї, що classmethod(), staticmethod() та друзі зберігають додаткову інформацію про об’єкт функції; вони прикрашають функції більшою кількістю деталей.

Позначення запозичено з Java і використовує символ '@' як індикатор. Використовуючи новий синтаксис, приклад вище буде написаний:

class C:

   @classmethod
   def meth (cls):
       ...

@classmethod є скороченням для meth=classmethod(meth) призначення. Загалом, якщо у вас є:

@A
@B
@C
def f ():
    ...

Це еквівалентно такому попередньому коду декоратора:

def f(): ...
f = A(B(C(f)))

Декоратори мають бути в рядку перед визначенням функції, по одному декоратору на рядок, і не можуть бути в одному рядку з інструкцією def, тобто @A def f(): ... є незаконним. Ви можете лише прикрашати визначення функцій на рівні модуля або всередині класу; ви не можете прикрасити визначення класу.

Декоратор — це лише функція, яка приймає декоровану функцію як аргумент і повертає або ту саму функцію, або новий об’єкт. Значення, що повертається декоратором, не повинно бути викликаним (хоча зазвичай це так), якщо до результату не будуть застосовані інші декоратори. Легко написати власні декоратори. Наступний простий приклад просто встановлює атрибут для об’єкта функції:

>>> def deco(func):
...    func.attr = 'decorated'
...    return func
...
>>> @deco
... def f(): pass
...
>>> f
<function f at 0x402ef0d4>
>>> f.attr
'decorated'
>>>

Як трохи більш реалістичний приклад, наступний декоратор перевіряє, що наданий аргумент є цілим числом:

def require_int (func):
    def wrapper (arg):
        assert isinstance(arg, int)
        return func(arg)

    return wrapper

@require_int
def p1 (arg):
    print arg

@require_int
def p2(arg):
    print arg*2

Приклад у PEP 318 містить моднішу версію цієї ідеї, яка дозволяє як вказати необхідний тип, так і перевірити повернутий тип.

Функції-декоратори можуть приймати аргументи. Якщо надано аргументи, ваша функція-декоратор викликається лише з цими аргументами та має повернути нову функцію-декоратор; ця функція повинна приймати одну функцію та повертати функцію, як описано раніше. Іншими словами, @A @B @C(args) стає:

def f(): ...
_deco = C(args)
f = A(B(_deco(f)))

Зробити це правильно може трохи заморочити мозок, але це не надто складно.

A small related change makes the func_name attribute of functions writable. This attribute is used to display function names in tracebacks, so decorators should change the name of any new function that’s constructed and returned.

Дивись також

PEP 318 - Декоратори для функцій, методів і класів

Автори: Кевін Д. Сміт, Джим Джеветт і Скіп Монтанаро. Кілька людей написали патчі, що реалізують декоратори функцій, але фактично зареєстровано патч №979728, написаний Марком Расселом.

https://wiki.python.org/moin/PythonDecoratorLibrary

Ця сторінка Wiki містить кілька прикладів декораторів.

PEP 322: Зворотна ітерація

Нова вбудована функція, reversed(seq), приймає послідовність і повертає ітератор, який перебирає елементи послідовності у зворотному порядку.

>>> for i in reversed(xrange(1,4)):
...    print i
...
3
2
1

Порівняно з розширеним нарізанням, таким як range(1,4)[::-1], reversed() легше читати, працює швидше та використовує значно менше пам’яті.

Зауважте, що reversed() приймає лише послідовності, а не довільні ітератори. Якщо ви хочете змінити ітератор, спочатку перетворіть його на список за допомогою list().

>>> input = open('/etc/passwd', 'r')
>>> for line in reversed(list(input)):
...   print line
...
root:*:0:0:System Administrator:/var/root:/bin/tcsh
  ...

Дивись також

PEP 322 - Зворотна ітерація

Написаний і реалізований Раймондом Геттінгером.

PEP 324: Новий модуль підпроцесу

The standard library provides a number of ways to execute a subprocess, offering different features and different levels of complexity. os.system(command) is easy to use, but slow (it runs a shell process which executes the command) and dangerous (you have to be careful about escaping the shell’s metacharacters). The popen2 module offers classes that can capture standard output and standard error from the subprocess, but the naming is confusing. The subprocess module cleans this up, providing a unified interface that offers all the features you might need.

Instead of popen2’s collection of classes, subprocess contains a single class called subprocess.Popen whose constructor supports a number of different keyword arguments.

class Popen(args, bufsize=0, executable=None,
            stdin=None, stdout=None, stderr=None,
            preexec_fn=None, close_fds=False, shell=False,
            cwd=None, env=None, universal_newlines=False,
            startupinfo=None, creationflags=0):

args зазвичай є послідовністю рядків, які будуть аргументами програми, що виконується як підпроцес. (Якщо аргумент shell має значення true, args може бути рядком, який потім буде передано в оболонку для інтерпретації, як це робить os.system().)

stdin, stdout і stderr визначають, якими будуть вхідні, вихідні та помилкові потоки підпроцесу. Ви можете надати файловий об’єкт або дескриптор файлу, або ви можете використовувати константу subprocess.PIPE для створення каналу між підпроцесом і батьківським процесом.

Конструктор має ряд зручних опцій:

  • close_fds просить закрити всі файлові дескриптори перед запуском підпроцесу.

  • cwd визначає робочий каталог, у якому виконуватиметься підпроцес (за замовчуванням це будь-який робочий каталог батьківського процесу).

  • env — це словник, який визначає змінні середовища.

  • preexec_fn — це функція, яка викликається перед запуском дочірнього елемента.

  • universal_newlines відкриває введення та виведення дочірнього елемента за допомогою функції Python universal newlines.

Створивши екземпляр Popen, ви можете викликати його метод wait(), щоб призупинити підпроцес, доки підпроцес не завершить роботу, poll(), щоб перевірити, чи він вийшов без паузи, або communicate(data), щоб надіслати рядок data на стандартний вхід підпроцесу. communicate(data) потім зчитує всі дані, які підпроцес надіслав на свій стандартний вихід або стандартну помилку, повертаючи кортеж (stdout_data, stderr_data).

call() — це ярлик, який передає свої аргументи конструктору Popen, очікує на завершення команди та повертає код статусу підпроцесу. Він може служити безпечнішим аналогом os.system():

sts = subprocess.call(['dpkg', '-i', '/tmp/new-package.deb'])
if sts == 0:
    # Success
    ...
else:
    # dpkg returned an error
    ...

Команда викликається без використання оболонки. Якщо ви дійсно хочете використовувати оболонку, ви можете додати shell=True як ключовий аргумент і надати рядок замість послідовності:

sts = subprocess.call('dpkg -i /tmp/new-package.deb', shell=True)

PEP бере різні приклади оболонки та коду Python і показує, як вони можуть бути переведені в код Python, який використовує subprocess. Настійно рекомендується прочитати цей розділ PEP.

Дивись також

PEP 324 - підпроцес - Новий модуль процесу

Написано та реалізовано Пітером Естрандом за сприяння Фредріка Лунда та інших.

PEP 327: десятковий тип даних

Python has always supported floating-point (FP) numbers, based on the underlying C double type, as a data type. However, while most programming languages provide a floating-point type, many people (even programmers) are unaware that floating-point numbers don’t represent certain decimal fractions accurately. The new Decimal type can represent these fractions accurately, up to a user-specified precision limit.

Навіщо потрібен Decimal?

Обмеження виникають через представлення чисел з плаваючою комою. Номери FP складаються з трьох компонентів:

  • Знак, який є позитивним чи негативним.

  • Мантиса, яка є одноцифровим двійковим числом, після якого йде дробова частина. Наприклад, «1,01» у нотації з основою 2 — це «1 + 0/2 + 1/4» або 1,25 у десятковій системі числення.

  • Експонента, яка вказує, де в представленому числі розташована кома.

Наприклад, число 1,25 має додатний знак, значення мантиси 1,01 (у двійковій системі) і експоненту 0 (десяткову кому не потрібно зміщувати). Число 5 має той самий знак і мантису, але показник степеня дорівнює 2, оскільки мантиса множиться на 4 (2 у ступені степеня 2); 1,25 * 4 дорівнює 5.

Modern systems usually provide floating-point support that conforms to a standard called IEEE 754. C’s double type is usually implemented as a 64-bit IEEE 754 number, which uses 52 bits of space for the mantissa. This means that numbers can only be specified to 52 bits of precision. If you’re trying to represent numbers whose expansion repeats endlessly, the expansion is cut off after 52 bits. Unfortunately, most software needs to produce output in base 10, and common fractions in base 10 are often repeating decimals in binary. For example, 1.1 decimal is binary 1.0001100110011 ...; .1 = 1/16 + 1/32 + 1/256 plus an infinite number of additional terms. IEEE 754 has to chop off that infinitely repeated decimal after 52 digits, so the representation is slightly inaccurate.

Іноді ви можете побачити цю неточність, коли надруковано номер:

>>> 1.1
1.1000000000000001

Неточність не завжди помітна, коли ви друкуєте число, тому що перетворення FP-рядка в десятковий рядок забезпечується бібліотекою C, і більшість бібліотек C намагаються створити розумний результат. Однак навіть якщо вона не відображається, неточність все одно існує, і наступні операції можуть збільшити помилку.

Для багатьох програм це не має значення. Якщо я малюю точки та відображаю їх на моніторі, різниця між 1,1 і 1,1000000000000001 надто мала, щоб її було видно. Звіти часто обмежують виведення певною кількістю знаків після коми, і якщо округлити число до двох, трьох або навіть восьми знаків після коми, помилка ніколи не буде очевидною. Однак для додатків, де це має значення, реалізація власних користувацьких арифметичних процедур вимагає багато роботи.

Таким чином, був створений тип Decimal.

Тип Decimal

Новий модуль, decimal, було додано до стандартної бібліотеки Python. Він містить два класи, Decimal і Context. Екземпляри Decimal представляють числа, а екземпляри Context використовуються для завершення різних налаштувань, таких як точність і режим округлення за замовчуванням.

Decimal екземпляри незмінні, як і звичайні цілі числа Python і числа FP; після того, як його було створено, ви не можете змінити значення, яке представляє екземпляр. Decimal екземпляри можна створити з цілих чисел або рядків:

>>> import decimal
>>> decimal.Decimal(1972)
Decimal("1972")
>>> decimal.Decimal("1.1")
Decimal("1.1")

Ви також можете надати кортежі, що містять знак, мантису, представлену як кортеж десяткових цифр, і експоненту:

>>> decimal.Decimal((1, (1, 4, 7, 5), -2))
Decimal("-14.75")

Застереження: знаковий біт є логічним значенням, тому 0 є позитивним, а 1 – негативним.

Перетворення чисел із плаваючою комою створює певну проблему: чи число FP, що представляє 1,1, має перетворитися на десяткове число для точного 1,1 чи для 1,1 плюс будь-які неточності, які вводяться? Рішення полягало в тому, щоб уникнути проблеми та залишити таке перетворення поза API. Натомість вам слід перетворити число з плаваючою комою на рядок із потрібною точністю та передати рядок у конструктор Decimal:

>>> f = 1.1
>>> decimal.Decimal(str(f))
Decimal("1.1")
>>> decimal.Decimal('%.12f' % f)
Decimal("1.100000000000")

Коли у вас є екземпляри Decimal, ви можете виконувати над ними звичайні математичні операції. Одне обмеження: для піднесення до степеня потрібен цілий показник:

>>> a = decimal.Decimal('35.72')
>>> b = decimal.Decimal('1.73')
>>> a+b
Decimal("37.45")
>>> a-b
Decimal("33.99")
>>> a*b
Decimal("61.7956")
>>> a/b
Decimal("20.64739884393063583815028902")
>>> a ** 2
Decimal("1275.9184")
>>> a**b
Traceback (most recent call last):
  ...
decimal.InvalidOperation: x ** (non-integer)

Ви можете комбінувати екземпляри Decimal з цілими числами, але не з числами з плаваючою комою:

>>> a + 4
Decimal("39.72")
>>> a + 4.5
Traceback (most recent call last):
  ...
TypeError: You can interact Decimal only with int, long or Decimal data types.
>>>

Decimal числа можна використовувати з модулями math і cmath, але зауважте, що вони будуть негайно перетворені на числа з плаваючою комою перед виконанням операції, що призведе до можлива втрата точності та акуратності. Ви також отримаєте звичайне число з плаваючою комою, а не Decimal.

>>> import math, cmath
>>> d = decimal.Decimal('123456789012.345')
>>> math.sqrt(d)
351364.18288201344
>>> cmath.sqrt(-d)
351364.18288201344j

Екземпляри Decimal мають метод sqrt(), який повертає Decimal, але якщо вам потрібні інші речі, такі як тригонометричні функції, вам доведеться їх реалізувати.

>>> d.sqrt()
Decimal("351364.1828820134592177245001")

Тип Context

Екземпляри класу Context інкапсулюють кілька параметрів для десяткових операцій:

  • prec — це точність, кількість знаків після коми.

  • rounding вказує режим округлення. Модуль decimal має константи для різних можливостей: ROUND_DOWN, ROUND_CEILING, ROUND_HALF_EVEN та інші.

  • traps — це словник, який визначає, що відбувається, коли трапляються певні умови помилки: або виникає виняткова ситуація, або повертається значення. Деякі приклади помилок: ділення на нуль, втрата точності та переповнення.

Існує локальний контекст потоку за замовчуванням, доступний за допомогою виклику getcontext(); ви можете змінити властивості цього контексту, щоб змінити точність за замовчуванням, округлення або обробку перехоплень. У наступному прикладі показано вплив зміни точності контексту за замовчуванням:

>>> decimal.getcontext().prec
28
>>> decimal.Decimal(1) / decimal.Decimal(7)
Decimal("0.1428571428571428571428571429")
>>> decimal.getcontext().prec = 9
>>> decimal.Decimal(1) / decimal.Decimal(7)
Decimal("0.142857143")

Дію за умовчанням для умов помилки можна вибрати; модуль може або повертати спеціальне значення, наприклад нескінченність або не-число, або можуть бути викликані винятки:

>>> decimal.Decimal(1) / decimal.Decimal(0)
Traceback (most recent call last):
  ...
decimal.DivisionByZero: x / 0
>>> decimal.getcontext().traps[decimal.DivisionByZero] = False
>>> decimal.Decimal(1) / decimal.Decimal(0)
Decimal("Infinity")
>>>

Екземпляр Context також має різні методи форматування чисел, наприклад to_eng_string() і to_sci_string().

Для отримання додаткової інформації перегляньте документацію до модуля decimal, яка містить короткий посібник і довідку.

Дивись також

PEP 327 - десятковий тип даних

Написаний Факундо Батістою та реалізований Факундо Батістою, Еріком Прайсом, Реймондом Геттінгером, Аазом і Тімом Пітерсом.

http://www.lahey.com/float.htm

У статті використовується код Fortran, щоб проілюструвати багато проблем, до яких може призвести неточність числа з плаваючою комою.

https://speleotrove.com/decimal/

Опис десяткового представлення. Це представлення пропонується як стандарт і лежить в основі нового десяткового типу Python. Значну частину цього матеріалу написав Майк Коулішоу, розробник мови Rexx.

PEP 328: Багаторядковий імпорт

Одна зміна мови — це невелике синтаксичне налаштування, спрямоване на полегшення імпорту багатьох імен із модуля. У операторі from module import names names — це послідовність імен, розділених комами. Якщо послідовність дуже довга, ви можете або написати кілька імпортів з одного модуля, або ви можете використовувати зворотні похилі риски, щоб уникнути закінчення рядків, як це:

from SimpleXMLRPCServer import SimpleXMLRPCServer,\
            SimpleXMLRPCRequestHandler,\
            CGIXMLRPCRequestHandler,\
            resolve_dotted_attribute

Синтаксичні зміни в Python 2.4 просто дозволяють поміщати імена в дужки. Python ігнорує нові рядки у виразі в дужках, тому зворотна похила риска більше не потрібна:

from SimpleXMLRPCServer import (SimpleXMLRPCServer,
                                SimpleXMLRPCRequestHandler,
                                CGIXMLRPCRequestHandler,
                                resolve_dotted_attribute)

PEP також пропонує, щоб усі оператори import були абсолютними імпортами, із символом . на початку, який вказує на відносний імпорт. Ця частина PEP не була реалізована для Python 2.4, але була завершена для Python 2.5.

Дивись також

PEP 328 - Імпорт: багаторядковий і абсолютний/відносний

Написав Ааз. Багаторядковий імпорт реалізував Діма Дорфман.

PEP 331: Незалежне від мови перетворення Float/String

Модулі locale дозволяють програмному забезпеченню Python вибирати різні перетворення та відображати конвенції, які локалізовані для певної країни чи мови. Однак модуль був обережним, щоб не змінити числову локаль, оскільки різні функції в реалізації Python вимагали, щоб числова локаль залишалася встановленою на 'C'' локалі. Часто це було тому, що код використовував функцію atof() бібліотеки C.

Однак відсутність числової локалі спричиняла проблеми для розширень, які використовували сторонні бібліотеки C, оскільки вони не мали правильного налаштування локалі. Мотивуючим прикладом був GTK+, віджети інтерфейсу користувача якого не відображали числа в поточній локалі.

Рішення, описане в PEP, полягає в додаванні трьох нових функцій до API Python, які виконують перетворення лише ASCII, ігноруючи налаштування мови:

  • PyOS_ascii_strtod(str, ptr) and PyOS_ascii_atof(str, ptr) both convert a string to a C double.

  • PyOS_ascii_formatd(buffer, buf_len, format, d) converts a double to an ASCII string.

The code for these functions came from the GLib library (https://developer-old.gnome.org/glib/2.26/), whose developers kindly relicensed the relevant functions and donated them to the Python Software Foundation. The locale module can now change the numeric locale, letting extensions such as GTK+ produce the correct results.

Дивись також

PEP 331 - Незалежне від мови перетворення Float/String

Написаний Крістіаном Р. Рейсом, реалізований Густаво Карнейро.

Інші зміни мови

Ось усі зміни, які Python 2.4 вносить у основну мову Python.

  • Додано декоратори для функцій і методів (PEP 318).

  • Додано вбудовані типи set() і frozenset() (PEP 218). Інші нові вбудовані функції включають функцію reversed(seq) (PEP 322).

  • Додано генератор виразів (PEP 289).

  • Деякі числові вирази більше не повертають значення, обмежені 32 або 64 бітами (PEP 237).

  • Тепер ви можете взяти дужки навколо списку імен у операторі from module import names (PEP 328).

  • Метод dict.update() тепер приймає ті самі форми аргументів, що й конструктор dict. Це включає будь-яке відображення, будь-яке повторення пар ключ/значення та аргументи ключового слова. (Надав Реймонд Геттінгер.)

  • Рядкові методи ljust(), rjust() і center() тепер приймають необов’язковий аргумент для визначення символу заповнення, відмінного від пробілу. (Надав Реймонд Геттінгер.)

  • Рядки також отримали метод rsplit(), який працює як метод split(), але розділяється з кінця рядка. (Надав Шон Райфшнайдер.)

    >>> 'www.python.org'.split('.', 1)
    ['www', 'python.org']
    'www.python.org'.rsplit('.', 1)
    ['www.python', 'org']
    
  • Три параметри ключових слів, cmp, key і reverse, було додано до методу sort() списків. Ці параметри спрощують деякі типові використання sort(). Усі ці параметри є необов’язковими.

    Для параметра cmp значенням має бути функція порівняння, яка приймає два параметри та повертає -1, 0 або +1 залежно від того, як параметри порівнюються. Потім ця функція буде використана для сортування списку. Раніше це був єдиний параметр, який можна було надати для sort().

    key має бути функцією з одним параметром, яка приймає елемент списку та повертає ключ порівняння для елемента. Потім список сортується за допомогою ключів порівняння. Наступний приклад сортує список без урахування регістру:

    >>> L = ['A', 'b', 'c', 'D']
    >>> L.sort()                 # Case-sensitive sort
    >>> L
    ['A', 'D', 'b', 'c']
    >>> # Using 'key' parameter to sort list
    >>> L.sort(key=lambda x: x.lower())
    >>> L
    ['A', 'b', 'c', 'D']
    >>> # Old-fashioned way
    >>> L.sort(cmp=lambda x,y: cmp(x.lower(), y.lower()))
    >>> L
    ['A', 'b', 'c', 'D']
    

    Останній приклад, у якому використовується параметр cmp, є старим способом виконання сортування без урахування регістру. Це працює, але повільніше, ніж використання параметра key. Використання key викликає метод lower() один раз для кожного елемента в списку, тоді як використання cmp викликає його двічі для кожного порівняння, тому використання key економить на викликах методу lower().

    Для простих ключових функцій і функцій порівняння часто можна уникнути виразу lambda, використовуючи натомість незв’язаний метод. Наприклад, наведене вище сортування без урахування регістру найкраще записати як:

    >>> L.sort(key=str.lower)
    >>> L
    ['A', 'b', 'c', 'D']
    

    Нарешті, параметр reverse приймає логічне значення. Якщо значення має значення true, список буде відсортовано у зворотному порядку. Замість L.sort(); L.reverse(), тепер ви можете написати L.sort(reverse=True).

    Результати сортування тепер гарантовано стабільні. Це означає, що два записи з однаковими ключами буде повернено в тому ж порядку, у якому вони були введені. Наприклад, ви можете відсортувати список людей за іменами, а потім відсортувати список за віком, у результаті чого вийде список, відсортований за віком, де люди одного віку розташовані в порядку за іменами.

    (Усі зміни до sort() внесено Раймондом Геттінгером.)

  • Існує нова вбудована функція sorted(iterable), яка працює як метод in-place list.sort(), але її можна використовувати у виразах. Відмінності:

  • вхід може бути будь-яким ітерованим;

  • новосформовану копію сортують, залишаючи оригінал недоторканим; і

  • вираз повертає нову відсортовану копію

    >>> L = [9,7,8,3,2,4,1,6,5]
    >>> [10+i for i in sorted(L)]       # usable in a list comprehension
    [11, 12, 13, 14, 15, 16, 17, 18, 19]
    >>> L                               # original is left unchanged
    [9,7,8,3,2,4,1,6,5]
    >>> sorted('Monty Python')          # any iterable may be an input
    [' ', 'M', 'P', 'h', 'n', 'n', 'o', 'o', 't', 't', 'y', 'y']
    
    >>> # List the contents of a dict sorted by key values
    >>> colormap = dict(red=1, blue=2, green=3, black=4, yellow=5)
    >>> for k, v in sorted(colormap.iteritems()):
    ...     print k, v
    ...
    black 4
    blue 2
    green 3
    red 1
    yellow 5
    

    (Надав Реймонд Геттінгер.)

  • Цілочисельні операції більше не викликатимуть OverflowWarning. Попередження OverflowWarning зникне в Python 2.5.

  • Інтерпретатор отримав новий перемикач, -m, який приймає назву, шукає відповідний модуль у sys.path і запускає модуль як сценарій. Наприклад, тепер ви можете запустити профайлер Python за допомогою python -m profile. (Надав Нік Коглан.)

  • Функції eval(expr, globals, locals) і execfile(filename, globals, locals) і оператор exec тепер приймають будь-який тип зіставлення для параметра locals. Раніше це мав бути звичайний словник Python. (Надав Реймонд Геттінгер.)

  • Вбудована функція zip() і itertools.izip() тепер повертають порожній список, якщо викликаються без аргументів. Раніше вони викликали виняток TypeError. Це робить їх більш придатними для використання зі списками аргументів змінної довжини:

    >>> def transpose(array):
    ...    return zip(*array)
    ...
    >>> transpose([(1,2,3), (4,5,6)])
    [(1, 4), (2, 5), (3, 6)]
    >>> transpose([])
    []
    

    (Надав Реймонд Геттінгер.)

  • Encountering a failure while importing a module no longer leaves a partially initialized module object in sys.modules. The incomplete module object left behind would fool further imports of the same module into succeeding, leading to confusing errors. (Fixed by Tim Peters.)

  • None тепер константа; код, який прив’язує нове значення до імені None, тепер є синтаксичною помилкою. (Надав Реймонд Геттінгер.)

Оптимізації

  • Внутрішні цикли для нарізки списків і кортежів оптимізовано і тепер працюють приблизно на третину швидше. Внутрішні цикли для словників також були оптимізовані, що призвело до підвищення продуктивності для keys(), values(), items(), iterkeys(), itervalues() та iteritems(). (Надав Реймонд Геттінгер.)

  • Обладнання для збільшення та скорочення списків було оптимізовано з точки зору швидкості та економії місця. Додавання та видалення зі списків тепер виконується швидше завдяки більш ефективним шляхам коду та менш частому використанню основної системи realloc(). Розуміння списків також корисне. list.extend() також оптимізовано і більше не перетворює свій аргумент у тимчасовий список перед розширенням базового списку. (Надав Реймонд Геттінгер.)

  • list(), tuple(), map(), filter() і zip() тепер працюють у кілька разів швидше з непослідовними аргументами, які надають __len__() метод. (Надав Реймонд Геттінгер.)

  • Методи list.__getitem__(), dict.__getitem__() і dict.__contains__() тепер реалізовано як об’єкти method_descriptor, а не як об’єкти wrapper_descriptor. Ця форма доступу подвоює їх продуктивність і робить їх більш придатними для використання як аргументів функціоналу: map(mydict.__getitem__, keylist). (Надав Реймонд Геттінгер.)

  • Додано новий код операції, LIST_APPEND, який спрощує згенерований байт-код для розуміння списків і прискорює їх приблизно на третину. (Надав Реймонд Геттінгер.)

  • Оптимізатор байт-коду peephole було вдосконалено для створення коротшого та швидшого байт-коду; примітно, що отриманий байт-код більш читабельний. (Покращено Раймондом Геттінгером.)

  • Конкатенації рядків у операторах у формі s = s + "abc" та s += "abc" тепер виконуються більш ефективно за певних обставин. Ця оптимізація не буде присутня в інших реалізаціях Python, таких як Jython, тому вам не слід покладатися на неї; використання методу рядків join() все ще рекомендується, якщо ви хочете ефективно склеїти велику кількість рядків. (Надав Армін Ріго.)

Кінцевим результатом оптимізації 2.4 є те, що Python 2.4 виконує тест pystone приблизно на 5% швидше, ніж Python 2.3, і на 35% швидше, ніж Python 2.2. (pystone не є особливо хорошим тестом, але це найбільш часто використовуваний метод вимірювання продуктивності Python. Ваші власні програми можуть продемонструвати більшу чи меншу користь від Python 2.4.)

Нові, покращені та застарілі модулі

Як завжди, стандартна бібліотека Python отримала низку вдосконалень і виправлень помилок. Ось неповний список найбільш помітних змін, відсортованих за алфавітом назв модулів. Зверніться до файлу Misc/NEWS у дереві вихідних кодів, щоб отримати більш повний список змін, або перегляньте журнали CVS, щоб отримати всі деталі.

  • The asyncore module’s loop() function now has a count parameter that lets you perform a limited number of passes through the polling loop. The default is still to loop forever.

  • Модуль base64 тепер має більш повну підтримку RFC 3548 кодування та декодування Base64, Base32 і Base16, включаючи необов’язкове згортання регістру та альтернативні алфавіти. (Надав Баррі Варшау.)

  • Модуль bisect тепер має базову реалізацію C для покращення продуктивності. (Надав Дмитро Васильєв.)

  • Колекції кодеків Східної Азії CJKCodecs, які підтримує Hye-Shik Chang, були інтегровані у 2.4. Нові кодування:

  • Китайська (КНР): gb2312, gbk, gb18030, big5hkscs, hz

  • Китайська (ROC): big5, cp950

  • Японська: cp932, euc-jis-2004, euc-jp, euc-jisx0213, iso-2022-jp,

    iso-2022-jp-1, iso-2022-jp-2, iso-2022-jp-3, iso-2022-jp-ext, iso-2022-jp-2004, shift-jis, shift-jisx0213, shift- jis-2004

  • Корейська: cp949, euc-kr, johab, iso-2022-kr

  • Додано деякі інші нові кодування: HP Roman8, ISO_8859-11, ISO_8859-16, PCTP-154 і TIS-620.

  • Кодеки UTF-8 і UTF-16 тепер краще справляються з отриманням часткового введення. Раніше клас StreamReader намагався прочитати більше даних, унеможливлюючи відновлення декодування з потоку. Метод read() тепер повертатиме стільки даних, скільки зможе, а майбутні виклики відновлюватимуть декодування там, де зупинилися попередні. (Реалізовано Вальтером Дьорвальдом.)

  • Існує новий модуль collections для різних спеціалізованих типів даних колекції. Наразі він містить лише один тип, deque, двосторонню чергу, яка підтримує ефективне додавання та видалення елементів з будь-якого кінця:

    >>> from collections import deque
    >>> d = deque('ghi')        # make a new deque with three items
    >>> d.append('j')           # add a new entry to the right side
    >>> d.appendleft('f')       # add a new entry to the left side
    >>> d                       # show the representation of the deque
    deque(['f', 'g', 'h', 'i', 'j'])
    >>> d.pop()                 # return and remove the rightmost item
    'j'
    >>> d.popleft()             # return and remove the leftmost item
    'f'
    >>> list(d)                 # list the contents of the deque
    ['g', 'h', 'i']
    >>> 'h' in d                # search the deque
    True
    

    Кілька модулів, наприклад модулі Queue і threading, тепер використовують переваги collections.deque для покращення продуктивності. (Надав Реймонд Геттінгер.)

  • The ConfigParser classes have been enhanced slightly. The read() method now returns a list of the files that were successfully parsed, and the set() method raises TypeError if passed a value argument that isn’t a string. (Contributed by John Belmonte and David Goodger.)

  • Модуль curses тепер підтримує розширення ncurses use_default_colors(). На платформах, де термінал підтримує прозорість, це дає змогу використовувати прозорий фон. (Надав Йорг Леманн.)

  • Модуль difflib тепер містить клас HtmlDiff, який створює HTML-таблицю, що показує пліч-о-пліч порівняння двох версій тексту. (Надав Ден Гасс.)

  • Пакет email було оновлено до версії 3.0, у якій усунено різні застарілі API та припинено підтримку версій Python, раніших за 2.3. Версія пакета 3.0 використовує новий інкрементальний аналізатор для повідомлень MIME, доступний у модулі email.FeedParser. Новий синтаксичний аналізатор не вимагає читання всього повідомлення в пам’ять і не викликає винятків, якщо повідомлення неправильно сформоване; замість цього він записує всі проблеми в атрибуті defect повідомлення. (Розроблено Ентоні Бакстером, Баррі Варсоу, Томасом Воутерсом та іншими.)

  • Модуль heapq було перетворено на C. Десятикратне підвищення швидкості робить модуль придатним для роботи з великими обсягами даних. Крім того, модуль має дві нові функції nlargest() і nsmallest(), які використовують купи для пошуку N найбільших або найменших значень у наборі даних без витрат на повне сортування. (Надав Реймонд Геттінгер.)

  • The httplib module now contains constants for HTTP status codes defined in various HTTP-related RFC documents. Constants have names such as OK, CREATED, CONTINUE, and MOVED_PERMANENTLY; use pydoc to get a full list. (Contributed by Andrew Eland.)

  • Модуль imaplib тепер підтримує команду THREAD IMAP (надано Yves Dionne) і нові методи deleteacl() і myrights() (надано Arnaud Mazin).

  • Модуль itertools отримав функцію groupby(iterable[, *func*]). iterable — це те, що можна повторити, щоб повернути потік елементів, а необов’язковий параметр func — це функція, яка приймає елемент і повертає значення ключа; якщо опущено, ключ - це просто сам елемент. Потім groupby() групує елементи в підпослідовності, які мають відповідні значення ключа, і повертає серію 2-кортежів, що містять значення ключа та ітератор над підпослідовністю.

    Ось приклад, щоб це було зрозуміліше. Функція key просто повертає, чи є число парним чи непарним, тому результатом groupby() є повернення послідовних циклів парних чи непарних чисел.

    >>> import itertools
    >>> L = [2, 4, 6, 7, 8, 9, 11, 12, 14]
    >>> for key_val, it in itertools.groupby(L, lambda x: x % 2):
    ...    print key_val, list(it)
    ...
    0 [2, 4, 6]
    1 [7]
    0 [8]
    1 [9, 11]
    0 [12, 14]
    >>>
    

    groupby() зазвичай використовується з відсортованим введенням. Логіка для groupby() подібна до фільтра Unix uniq, що робить його зручним для видалення, підрахунку або ідентифікації повторюваних елементів:

    >>> word = 'abracadabra'
    >>> letters = sorted(word)   # Turn string into a sorted list of letters
    >>> letters
    ['a', 'a', 'a', 'a', 'a', 'b', 'b', 'c', 'd', 'r', 'r']
    >>> for k, g in itertools.groupby(letters):
    ...    print k, list(g)
    ...
    a ['a', 'a', 'a', 'a', 'a']
    b ['b', 'b']
    c ['c']
    d ['d']
    r ['r', 'r']
    >>> # List unique letters
    >>> [k for k, g in groupby(letters)]
    ['a', 'b', 'c', 'd', 'r']
    >>> # Count letter occurrences
    >>> [(k, len(list(g))) for k, g in groupby(letters)]
    [('a', 5), ('b', 2), ('c', 1), ('d', 1), ('r', 2)]
    

    (Надано Hye-Shik Chang.)

  • itertools також отримав функцію під назвою tee(iterator, N), яка повертає N незалежних ітераторів, які копіюють iterator. Якщо N опущено, за замовчуванням буде 2.

    >>> L = [1,2,3]
    >>> i1, i2 = itertools.tee(L)
    >>> i1,i2
    (<itertools.tee object at 0x402c2080>, <itertools.tee object at 0x402c2090>)
    >>> list(i1)               # Run the first iterator to exhaustion
    [1, 2, 3]
    >>> list(i2)               # Run the second iterator to exhaustion
    [1, 2, 3]
    

    Зауважте, що tee() має зберігати копії значень, які повертає ітератор; у гіршому випадку, можливо, доведеться зберегти їх усі. Тому це слід використовувати обережно, якщо провідний ітератор може працювати набагато попереду кінцевого ітератора в довгому потоці вхідних даних. Якщо розділення велике, ви також можете використати замість нього list(). Коли ітератори тісно відстежують один одного, tee() є ідеальним. Можливі програми включають закладки, вікна або ітератори з попереднім переглядом. (Надав Реймонд Геттінгер.)

  • A number of functions were added to the locale module, such as bind_textdomain_codeset() to specify a particular encoding and a family of l*gettext() functions that return messages in the chosen encoding. (Contributed by Gustavo Niemeyer.)

  • До функції basicConfig() пакета logging було додано деякі аргументи ключових слів, щоб спростити налаштування журналу. Поведінка за замовчуванням — реєстрація повідомлень до стандартної помилки, але можна вказати різні ключові аргументи для реєстрації в певному файлі, зміни формату журналювання або встановлення рівня журналювання. Наприклад:

    import logging
    logging.basicConfig(filename='/var/log/application.log',
        level=0,  # Log all messages
        format='%(levelname):%(process):%(thread):%(message)')
    

    Інші доповнення до пакета logging включають зручний метод log(level, msg), а також клас TimedRotatingFileHandler, який обертає свої файли журналу з певним інтервалом. Модуль уже мав RotatingFileHandler, який обертав журнали, коли файл перевищував певний розмір. Обидва класи походять від нового класу BaseRotatingHandler, який можна використовувати для реалізації інших обертових обробників.

    (Зміни внесено Вінаєм Саджипом.)

  • Модуль marshal тепер ділиться вбудованими рядками під час розпакування структури даних. Це може зменшити розмір певних рядків pickle, але основний ефект полягає в тому, щоб зробити файли .pyc значно меншими. (Надав Мартін фон Льовіс.)

  • Клас NNTP модуля nntplib отримав методи description() і descriptions() для отримання описів груп новин для однієї групи або для діапазону груп. (Надав Юрген А. Ерхард.)

  • До модуля operator додано дві нові функції, attrgetter(attr) та itemgetter(index). Обидві функції повертають виклики, які приймають один аргумент і повертають відповідний атрибут або елемент; ці виклики створюють чудові екстрактори даних при використанні з map() або sorted(). Наприклад:

    >>> L = [('c', 2), ('d', 1), ('a', 4), ('b', 3)]
    >>> map(operator.itemgetter(0), L)
    ['c', 'd', 'a', 'b']
    >>> map(operator.itemgetter(1), L)
    [2, 1, 4, 3]
    >>> sorted(L, key=operator.itemgetter(1)) # Sort list by second tuple item
    [('d', 1), ('c', 2), ('b', 3), ('a', 4)]
    

    (Надав Реймонд Геттінгер.)

  • Модуль optparse було оновлено різними способами. Тепер модуль передає свої повідомлення через gettext.gettext(), що робить можливим інтернаціоналізацію довідки та повідомлень про помилки Optik. Повідомлення довідки для параметрів тепер можуть містити рядок '%default, який буде замінено значенням параметра за замовчуванням. (Надав Грег Ворд.)

  • The long-term plan is to deprecate the rfc822 module in some future Python release in favor of the email package. To this end, the email.Utils.formatdate function has been changed to make it usable as a replacement for rfc822.formatdate(). You may want to write new e-mail processing code with this in mind. (Change implemented by Anthony Baxter.)

  • До модуля os було додано нову функцію urandom(n), яка повертає рядок, що містить n байтів випадкових даних. Ця функція надає доступ до специфічних для платформи джерел випадковості, таких як /dev/urandom у Linux або Windows CryptoAPI. (Надано Тревором Перріном.)

  • Ще одна нова функція: os.path.lexists(path) повертає true, якщо файл, визначений path, існує, незалежно від того, чи є це символічним посиланням. Це відрізняється від існуючої функції os.path.exists(path), яка повертає false, якщо path є символічним посиланням, яке вказує на пункт призначення, якого не існує. (Надав Бені Чернявський.)

  • Нову функцію getsid() було додано до модуля posix, який лежить в основі модуля os. (Надав Дж. Рейнор.)

  • Модуль poplib тепер підтримує POP через SSL. (Надав Гектор Уртубія.)

  • Модуль profile тепер може профілювати функції розширення C. (Надав Нік Бастін.)

  • Модуль random має новий метод під назвою getrandbits(N), який повертає довге ціле число N біт. Існуючий метод randrange() тепер використовує getrandbits(), де це доречно, що робить генерацію довільно великих випадкових чисел більш ефективною. (Надав Реймонд Геттінгер.)

  • Мова регулярних виразів, прийнята модулем re, була розширена простими умовними виразами, написаними як (?(group)A|B). group — це числовий ідентифікатор групи або назва групи, визначена за допомогою (?P <group> ...) раніше у виразі. Якщо вказана група збігається, шаблон регулярного виразу A буде перевірено на відповідність рядку; якщо група не збігається, замість неї буде використано шаблон B. (Надав Густаво Німейєр.)

  • Модуль re також більше не є рекурсивним, завдяки величезній кількості роботи Густаво Німейєра. У механізмі рекурсивних регулярних виразів певні шаблони призводять до використання великої кількості стеку C, і стек може бути переповнений. Наприклад, якщо ви зіставили 30000-байтовий рядок символів a із виразом (a|b)+, один кадр стека споживався на символ. Python 2.3 намагався перевірити переповнення стеку та викликати виняток RuntimeError, але певні шаблони могли обійти перевірку, і якщо вам не пощастило, Python міг стати segfault. Механізм регулярних виразів Python 2.4 може без проблем відповідати цьому шаблону.

  • Модуль signal тепер виконує ретельнішу перевірку параметрів функції signal.signal() на помилки. Наприклад, ви не можете встановити обробник для сигналу SIGKILL; попередні версії Python спокійно прийняли це, але 2.4 викличе виняток RuntimeError.

  • До модуля socket додано дві нові функції. socketpair() повертає пару підключених сокетів, а getservbyport(port) шукає назву служби для даного номера порту. (Надано Дейвом Коулом і Баррі Варшау.)

  • Функція sys.exitfunc() застаріла. У коді має використовуватися існуючий модуль atexit, який правильно обробляє виклик кількох функцій виходу. Згодом sys.exitfunc() стане суто внутрішнім інтерфейсом, доступ до якого буде мати лише atexit.

  • Модуль tarfile тепер за замовчуванням створює файли tar у форматі GNU. (Надав Ларс Густебель.)

  • Модуль threading тепер має елегантно простий спосіб підтримки локальних даних потоку. Модуль містить клас local, значення атрибутів якого є локальними для різних потоків.

    import threading
    
    data = threading.local()
    data.number = 42
    data.url = ('www.python.org', 80)
    

    Інші потоки можуть призначати та отримувати власні значення для атрибутів number і url. Ви можете створити підклас local, щоб ініціалізувати атрибути або додати методи. (Надав Джим Фултон.)

  • Модуль timeit тепер автоматично вимикає періодичне збирання сміття під час циклу синхронізації. Ця зміна робить послідовні таймінги більш порівнянними. (Надав Реймонд Геттінгер.)

  • Модуль weakref тепер підтримує більшу різноманітність об’єктів, включаючи функції Python, екземпляри класів, набори, заморожені набори, дві версії, масиви, файли, сокети та шаблони регулярних виразів. (Надав Реймонд Геттінгер.)

  • The xmlrpclib module now supports a multi-call extension for transmitting multiple XML-RPC calls in a single HTTP operation. (Contributed by Brian Quinlan.)

  • Модулі mpz, rotor і xreadlines видалено.

cookielib

The cookielib library supports client-side handling for HTTP cookies, mirroring the Cookie module’s server-side cookie support. Cookies are stored in cookie jars; the library transparently stores cookies offered by the web server in the cookie jar, and fetches the cookie from the jar when connecting to the server. As in web browsers, policy objects control whether cookies are accepted or not.

Щоб зберігати файли cookie протягом сеансів, передбачено дві реалізації файлів cookie: один, який зберігає файли cookie у форматі Netscape, щоб програми могли використовувати файли cookie Mozilla або Lynx, і інший, який зберігає файли cookie у тому самому форматі, що й бібліотека Perl libwww.

urllib2 has been changed to interact with cookielib: HTTPCookieProcessor manages a cookie jar that is used when accessing URLs.

Цей модуль створено Джоном Дж. Лі.

doctest

Модуль doctest зазнав значного рефакторингу завдяки Едварду Лоперу та Тіму Пітерсу. Тестування може бути таким же простим, як запуск doctest.testmod(), але рефакторинг дозволяє налаштувати роботу модуля різними способами

Новий клас DocTestFinder витягує тести з рядків документації даного об’єкта:

def f (x, y):
    """>>> f(2,2)
4
>>> f(3,2)
6
    """
    return x*y

finder = doctest.DocTestFinder()

# Get list of DocTest instances
tests = finder.find(f)

Потім новий клас DocTestRunner запускає окремі тести та може створювати зведення результатів:

runner = doctest.DocTestRunner()
for t in tests:
    tried, failed = runner.run(t)

runner.summarize(verbose=1)

Наведений вище приклад дає такий вихід:

1 items passed all tests:
   2 tests in f
2 tests in 1 items.
2 passed and 0 failed.
Test passed.

DocTestRunner використовує екземпляр класу OutputChecker для порівняння очікуваного результату з фактичним результатом. Цей клас приймає кілька різних прапорів, які налаштовують його поведінку; амбітні користувачі також можуть написати абсолютно новий підклас OutputChecker.

Засіб перевірки виводу за замовчуванням надає ряд зручних функцій. Наприклад, з прапорцем опції doctest.ELLIPSIS три крапки (...) в очікуваному виведенні відповідають будь-якому підрядку, що полегшує розміщення виходів, які незначно відрізняються:

def o (n):
    """>>> o(1)
<__main__.C instance at 0x...>
>>>
"""

Інший спеціальний рядок, <BLANKLINE>, відповідає порожньому рядку:

def p (n):
    """>>> p(1)
<BLANKLINE>
>>>
"""

Іншою новою можливістю є створення відображення вихідних даних у стилі відмінностей, вказуючи doctest.REPORT_UDIFF (уніфіковані відмінності), doctest.REPORT_CDIFF (контекстні відмінності) або doctest.REPORT_NDIFF (дельта-стиль) позначки параметрів. Наприклад:

def g (n):
    """>>> g(4)
here
is
a
lengthy
>>>"""
    L = 'here is a rather lengthy list of words'.split()
    for word in L[:n]:
        print word

Запустивши тести наведеної вище функції з указаним doctest.REPORT_UDIFF, ви отримаєте такий результат:

**********************************************************************
File "t.py", line 15, in g
Failed example:
    g(4)
Differences (unified diff with -expected +actual):
    @@ -2,3 +2,3 @@
     is
     a
    -lengthy
    +rather
**********************************************************************

Зміни збірки та C API

Деякі зміни в процесі збирання Python і в API C:

  • Додано три нові зручні макроси для типових значень, що повертаються функціями розширення: Py_RETURN_NONE, Py_RETURN_TRUE і Py_RETURN_FALSE. (Надав Бретт Кеннон.)

  • Another new macro, Py_CLEAR, decreases the reference count of obj and sets obj to the null pointer. (Contributed by Jim Fulton.)

  • Нова функція, PyTuple_Pack(N, obj1, obj2, ..., objN), створює кортежі зі списку аргументів змінної довжини об’єктів Python. (Надав Реймонд Геттінгер.)

  • Нова функція, PyDict_Contains(d, k), реалізує швидкий пошук у словнику без маскування винятків, які виникають під час процесу пошуку. (Надав Реймонд Геттінгер.)

  • The Py_IS_NAN(X) macro returns 1 if its float or double argument X is a NaN. (Contributed by Tim Peters.)

  • C code can avoid unnecessary locking by using the new PyEval_ThreadsInitialized() function to tell if any thread operations have been performed. If this function returns false, no lock operations are needed. (Contributed by Nick Coghlan.)

  • Нова функція, PyArg_VaParseTupleAndKeywords(), така сама, як PyArg_ParseTupleAndKeywords(), але приймає va_list замість кількох аргументів. (Надав Грег Чепмен.)

  • A new method flag, METH_COEXIST, allows a function defined in slots to co-exist with a PyCFunction having the same name. This can halve the access time for a method such as set.__contains__(). (Contributed by Raymond Hettinger.)

  • Тепер Python можна створювати з додатковим профілюванням для самого інтерпретатора, призначеного як допомога людям, які розробляють ядро Python. Надання --enable-profiling сценарію configure дозволить вам профілювати інтерпретатор за допомогою gprof і надання перемикача --with-tsc дозволяє профілювання за допомогою реєстру Time-Stamp-Counter Pentium. Зауважте, що перемикач --with-tsc трохи неправильно названо, тому що функція профілювання також працює на платформі PowerPC, хоча ця архітектура процесора не називає цей регістр «реєстром TSC». (Надав Джеремі Гілтон.)

  • The tracebackobject type has been renamed to PyTracebackObject.

Зміни, що стосуються порту

  • Порт Windows тепер створено під MSVC++ 7.1, а також версію 6. (Надано Мартіном фон Льовісом.)

Перенесення на Python 2.4

У цьому розділі перераховано описані раніше зміни, які можуть потребувати змін у вашому коді:

  • Зрушення вліво та шістнадцяткові/вісімкові константи, які є занадто великими, більше не викликають FutureWarning і повертають значення, обмежене 32 або 64 бітами; замість цього вони повертають довге ціле число.

  • Цілочисельні операції більше не викликатимуть OverflowWarning. Попередження OverflowWarning зникне в Python 2.5.

  • Вбудована функція zip() і itertools.izip() тепер повертають порожній список замість того, щоб викликати виняток TypeError, якщо викликати її без аргументів.

  • Ви більше не можете порівнювати екземпляри date і datetime, надані модулем datetime. Два екземпляри різних класів тепер завжди будуть нерівними, а відносні порівняння (<, >) викличуть TypeError.

  • dircache.listdir() now passes exceptions to the caller instead of returning empty lists.

  • LexicalHandler.startDTD() використовувався для отримання публічних і системних ідентифікаторів у неправильному порядку. Це було виправлено; потрібно виправити програми, які використовують неправильний порядок.

  • fcntl.ioctl() тепер попереджає, якщо аргумент mutate пропущений і доречний.

  • Модуль tarfile тепер за замовчуванням створює файли tar у форматі GNU.

  • Encountering a failure while importing a module no longer leaves a partially initialized module object in sys.modules.

  • None тепер константа; код, який прив’язує нове значення до імені None, тепер є синтаксичною помилкою.

  • Функція signals.signal() тепер викликає виключення RuntimeError для певних недозволених значень; раніше ці помилки проходили мовчки. Наприклад, ви більше не можете встановити обробник для сигналу SIGKILL.

Подяки

Автор хотів би подякувати наступним особам за пропозиції, виправлення та допомогу з різними чернетками цієї статті: Корай Кан, Хе-Шік Чанг, Майкл Дайк, Реймонд Геттінгер, Браян Херт, Хеміш Лоусон, Фредрік Лунд, Шон Рейфшнайдер, Садруддін Реджеб.