7. Вхід і вихід¶
Є кілька способів представити вихідні дані програми; дані можна роздрукувати у формі, зрозумілій людині, або записати у файл для подальшого використання. У цьому розділі будуть розглянуті деякі з можливостей.
7.1. Вишуканіше форматування виводу¶
So far we’ve encountered two ways of writing values: expression statements and
the print()
function. (A third way is using the write()
method
of file objects; the standard output file can be referenced as sys.stdout
.
See the Library Reference for more information on this.)
Часто вам знадобиться більше контролювати форматування вихідних даних, ніж просто друкувати значення, розділені пробілами. Існує кілька способів форматування виводу.
Щоб використовувати відформатовані рядкові літерали, починайте рядок з
f
абоF
перед лапками, що відкривають або потрійними лапками. Усередині цього рядка можна написати вираз Python між символами{
і}
, які можуть посилатися на змінні або літеральні значення.>>> year = 2016 >>> event = 'Referendum' >>> f'Results of the {year} {event}' 'Results of the 2016 Referendum'
The
str.format()
method of strings requires more manual effort. You’ll still use{
and}
to mark where a variable will be substituted and can provide detailed formatting directives, but you’ll also need to provide the information to be formatted. In the following code block there are two examples of how to format variables:>>> yes_votes = 42_572_654 >>> total_votes = 85_705_149 >>> percentage = yes_votes / total_votes >>> '{:-9} YES votes {:2.2%}'.format(yes_votes, percentage) ' 42572654 YES votes 49.67%'
Notice how the
yes_votes
are padded with spaces and a negative sign only for negative numbers. The example also printspercentage
multiplied by 100, with 2 decimal places and followed by a percent sign (see Міні-мова специфікації формату for details).Нарешті, ви можете виконувати всю обробку рядків самостійно, використовуючи операції зрізання рядків і конкатенації для створення будь-якого макета, який тільки можете собі уявити. Рядковий тип має деякі методи, які виконують корисні операції для доповнення рядків до заданої ширини стовпця.
Якщо вам не потрібен вигадливий вихід, а просто потрібно швидко відобразити деякі змінні для цілей налагодження, ви можете перетворити будь-яке значення на рядок за допомогою функцій repr()
або str()
.
Функція str()
призначена для повернення представлень значень, які досить зрозумілі людині, тоді як repr()
призначена для створення представлень, які може читати інтерпретатор (або примусово SyntaxError
, якщо немає еквівалентного синтаксису). Для об’єктів, які не мають спеціального представлення для споживання людиною, str()
поверне те саме значення, що й repr()
. Багато значень, наприклад чисел або структур, таких як списки та словники, мають однакове представлення за допомогою будь-якої функції. Рядки, зокрема, мають два різних представлення.
Деякі приклади:
>>> s = 'Hello, world.'
>>> str(s)
'Hello, world.'
>>> repr(s)
"'Hello, world.'"
>>> str(1/7)
'0.14285714285714285'
>>> x = 10 * 3.25
>>> y = 200 * 200
>>> s = 'The value of x is ' + repr(x) + ', and y is ' + repr(y) + '...'
>>> print(s)
The value of x is 32.5, and y is 40000...
>>> # The repr() of a string adds string quotes and backslashes:
>>> hello = 'hello, world\n'
>>> hellos = repr(hello)
>>> print(hellos)
'hello, world\n'
>>> # The argument to repr() may be any Python object:
>>> repr((x, y, ('spam', 'eggs')))
"(32.5, 40000, ('spam', 'eggs'))"
Модуль string
містить клас Template
, який пропонує ще один спосіб заміни значень у рядки, використовуючи заповнювачі, такі як $x
, і замінюючи їх значеннями зі словника, але пропонує набагато менше контролю над форматуванням.
7.1.1. Відформатовані рядкові літерали¶
Форматовані рядкові літерали (які також скорочено називаються f-рядками) дозволяють включити значення виразів Python у рядок, додавши до рядка префікс f
або F
і записавши вирази як` {expression}`.
За виразом може слідувати необов’язковий специфікатор формату. Це дозволяє краще контролювати форматування значення. У наступному прикладі число pi округлюється до трьох знаків після коми:
>>> import math
>>> print(f'The value of pi is approximately {math.pi:.3f}.')
The value of pi is approximately 3.142.
Передача цілого числа після ':''
призведе до того, що це поле матиме мінімальну кількість символів. Це корисно для того, щоб вирівняти колони.
>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678}
>>> for name, phone in table.items():
... print(f'{name:10} ==> {phone:10d}')
...
Sjoerd ==> 4127
Jack ==> 4098
Dcab ==> 7678
Для перетворення значення перед його форматуванням можна використовувати інші модифікатори. '!a''
застосовується ascii()
, '!s''
застосовується str()
, а '!r''
застосовується repr()
:
>>> animals = 'eels'
>>> print(f'My hovercraft is full of {animals}.')
My hovercraft is full of eels.
>>> print(f'My hovercraft is full of {animals!r}.')
My hovercraft is full of 'eels'.
The =
specifier can be used to expand an expression to the text of the
expression, an equal sign, then the representation of the evaluated expression:
>>> bugs = 'roaches'
>>> count = 13
>>> area = 'living room'
>>> print(f'Debugging {bugs=} {count=} {area=}')
Debugging bugs='roaches' count=13 area='living room'
See self-documenting expressions for more information
on the =
specifier. For a reference on these format specifications, see
the reference guide for the Міні-мова специфікації формату.
7.1.2. Метод String format().¶
Основне використання методу str.format()
виглядає так:
>>> print('We are the {} who say "{}!"'.format('knights', 'Ni'))
We are the knights who say "Ni!"
Дужки та символи в них (так звані поля форматування) замінюються об’єктами, переданими в метод str.format()
. Число в дужках можна використовувати для позначення позиції об’єкта, переданого в метод str.format()
.
>>> print('{0} and {1}'.format('spam', 'eggs'))
spam and eggs
>>> print('{1} and {0}'.format('spam', 'eggs'))
eggs and spam
Якщо ключові аргументи використовуються в методі str.format()
, їх значення посилаються за допомогою назви аргументу.
>>> print('This {food} is {adjective}.'.format(
... food='spam', adjective='absolutely horrible'))
This spam is absolutely horrible.
Позиційні та ключові аргументи можна довільно комбінувати:
>>> print('The story of {0}, {1}, and {other}.'.format('Bill', 'Manfred',
... other='Georg'))
The story of Bill, Manfred, and Georg.
Якщо у вас є дуже довгий рядок формату, який ви не хочете розділяти, було б непогано, якби ви могли посилатися на змінні, які потрібно відформатувати за назвою, а не за позицією. Це можна зробити, просто передавши dict і використовуючи квадратні дужки ''[]'
для доступу до ключів.
>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
>>> print('Jack: {0[Jack]:d}; Sjoerd: {0[Sjoerd]:d}; '
... 'Dcab: {0[Dcab]:d}'.format(table))
Jack: 4098; Sjoerd: 4127; Dcab: 8637678
This could also be done by passing the table
dictionary as keyword arguments with the **
notation.
>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
>>> print('Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**table))
Jack: 4098; Sjoerd: 4127; Dcab: 8637678
This is particularly useful in combination with the built-in function
vars()
, which returns a dictionary containing all local variables:
>>> table = {k: str(v) for k, v in vars().items()}
>>> message = " ".join([f'{k}: ' + '{' + k +'};' for k in table.keys()])
>>> print(message.format(**table))
__name__: __main__; __doc__: None; __package__: None; __loader__: ...
As an example, the following lines produce a tidily aligned set of columns giving integers and their squares and cubes:
>>> for x in range(1, 11):
... print('{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x))
...
1 1 1
2 4 8
3 9 27
4 16 64
5 25 125
6 36 216
7 49 343
8 64 512
9 81 729
10 100 1000
Щоб отримати повний огляд форматування рядка за допомогою str.format()
, перегляньте Синтаксис рядка формату.
7.1.3. Ручне форматування рядка¶
Ось та сама таблиця квадратів і кубів, відформатована вручну:
>>> for x in range(1, 11):
... print(repr(x).rjust(2), repr(x*x).rjust(3), end=' ')
... # Note use of 'end' on previous line
... print(repr(x*x*x).rjust(4))
...
1 1 1
2 4 8
3 9 27
4 16 64
5 25 125
6 36 216
7 49 343
8 64 512
9 81 729
10 100 1000
(Зверніть увагу, що один пробіл між кожним стовпцем було додано так, як працює print()
: він завжди додає пробіли між своїми аргументами.)
Метод str.rjust()
рядкових об’єктів вирівнює рядок по правому краю в полі заданої ширини, доповнюючи його пробілами зліва. Існують схожі методи str.ljust()
і str.center()
. Ці методи нічого не записують, вони просто повертають новий рядок. Якщо вхідний рядок надто довгий, вони не скорочують його, а повертають без змін; це зіпсує ваш макет стовпців, але це зазвичай краще, ніж альтернатива, яка б брехала про значення. (Якщо вам дійсно потрібно скорочення, ви завжди можете додати операцію зрізу, як у x.ljust(n)[:n]
.)
Є інший метод, str.zfill()
, який доповнює числовий рядок зліва нулями. Він розуміє знаки плюс і мінус:
>>> '12'.zfill(5)
'00012'
>>> '-3.14'.zfill(7)
'-003.14'
>>> '3.14159265359'.zfill(5)
'3.14159265359'
7.1.4. Старе форматування рядка¶
The % operator (modulo) can also be used for string formatting.
Given format % values
(where format is a string),
%
conversion specifications in format are replaced with
zero or more elements of values.
This operation is commonly known as string
interpolation. For example:
>>> import math
>>> print('The value of pi is approximately %5.3f.' % math.pi)
The value of pi is approximately 3.142.
Більше інформації можна знайти в розділі Форматування рядків у стилі printf.
7.2. Читання та запис файлів¶
open()
повертає об’єкт file object і найчастіше використовується з двома позиційними аргументами та одним ключовим аргументом: open(filename, mode, encoding=None)
>>> f = open('workfile', 'w', encoding="utf-8")
Перший аргумент - це рядок, що містить назву файлу. Другий аргумент — це інший рядок, що містить декілька символів, що описують спосіб використання файлу. режим може бути 'r'
, коли файл буде лише читатися, 'w''
лише для запису (існуючий файл із такою ж назвою буде стерто) і 'a'
відкриває файл для додавання; будь-які дані, записані у файл, автоматично додаються в кінець. 'r+'
відкриває файл як для читання, так і для запису. Аргумент mode необов’язковий; 'r'
передбачається, якщо його опустити.
Зазвичай файли відкриваються в text mode, це означає, що ви читаєте та записуєте рядки з і до файлу, які закодовані в певному кодуванні. Якщо кодування не вказано, типове значення залежить від платформи (див. open()
). Оскільки UTF-8 є сучасним стандартом де-факто, рекомендується encoding="utf-8"
, якщо ви не знаєте, що вам потрібно використовувати інше кодування. Додавання 'b'
до режиму відкриває файл у binary mode. Дані у двійковому режимі читаються та записуються як об’єкти bytes
. Ви не можете вказати кодування під час відкриття файлу в двійковому режимі.
У текстовому режимі під час читання за замовчуванням закінчення рядків для певної платформи (\n
в Unix, \r\n
у Windows) перетворюються лише на \n
. Під час написання в текстовому режимі за замовчуванням символи \n
перетворюються на закінчення рядків, що залежать від платформи. Ця закулісна модифікація даних файлу підходить для текстових файлів, але пошкодить двійкові дані, як у файлах JPEG
або EXE
. Будьте дуже обережні, використовуйте двійковий режим під час читання та запису таких файлів.
Під час роботи з файловими об’єктами корисно використовувати ключове слово with
. Перевагою є те, що файл закривається належним чином після завершення його набору, навіть якщо в якийсь момент виникає виняток. Використання with
також набагато коротше, ніж написання еквівалента try
-finally
блоків:
>>> with open('workfile', encoding="utf-8") as f:
... read_data = f.read()
>>> # We can check that the file has been automatically closed.
>>> f.closed
True
Якщо ви не використовуєте ключове слово with
, вам слід викликати f.close()
, щоб закрити файл і негайно звільнити всі системні ресурси, які він використовує.
Попередження
Виклик f.write()
без використання ключового слова with
або виклик f.close()
може привести до аргументів f.write()
не повністю записується на диск, навіть якщо програма успішно завершує роботу.
Після того, як файловий об’єкт закрито за допомогою оператора with
або виклику f.close()
, спроби використати файловий об’єкт автоматично зазнають невдачі.
>>> f.close()
>>> f.read()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: I/O operation on closed file.
7.2.1. Методи файлових об’єктів¶
У решті прикладів у цьому розділі буде припущено, що файловий об’єкт під назвою f
уже створено.
Щоб прочитати вміст файлу, викличте f.read(size)
, який зчитує певну кількість даних і повертає їх як рядок (у текстовому режимі) або об’єкт байтів (у двійковому режимі). розмір є необов’язковим числовим аргументом. Якщо size пропущений або негативний, весь вміст файлу буде прочитано та повернено; це ваша проблема, якщо розмір файлу вдвічі перевищує пам’ять вашої машини. В іншому випадку зчитуються та повертаються щонайбільше size символів (у текстовому режимі) або size байтів (у двійковому режимі). Якщо досягнуто кінця файлу, f.read() поверне порожній рядок (''
).
>>> f.read()
'This is the entire file.\n'
>>> f.read()
''
f.readline()
читає один рядок із файлу; символ нового рядка (\n
) залишається в кінці рядка та пропускається лише в останньому рядку файлу, якщо файл не закінчується символом нового рядка. Це робить значення, що повертається, однозначним; якщо f.readline()
повертає порожній рядок, це означає, що кінець файлу досягнуто, тоді як порожній рядок представлений '\n'
, рядок, що містить лише один новий рядок.
>>> f.readline()
'This is the first line of the file.\n'
>>> f.readline()
'Second line of the file\n'
>>> f.readline()
''
Щоб прочитати рядки з файлу, ви можете виконати цикл по об’єкту файлу. Це ефективне використання пам’яті, швидке та веде до простого коду:
>>> for line in f:
... print(line, end='')
...
This is the first line of the file.
Second line of the file
Якщо ви хочете прочитати всі рядки файлу у списку, ви також можете скористатися list(f)
або f.readlines()
.
f.write(string)
записує вміст string у файл, повертаючи кількість записаних символів.
>>> f.write('This is a test\n')
15
Інші типи об’єктів потрібно перетворити — або на рядок (у текстовому режимі), або на об’єкт bytes (у двійковому режимі) — перед їх записом:
>>> value = ('the answer', 42)
>>> s = str(value) # convert the tuple to string
>>> f.write(s)
18
f.tell()
повертає ціле число, що вказує поточну позицію файлового об’єкта у файлі, представлену як кількість байтів від початку файлу в двійковому режимі та непрозоре число в текстовому режимі.
Щоб змінити позицію об’єкта файлу, використовуйте f.seek(offset, wherece)
. Положення обчислюється шляхом додавання зміщення до опорної точки; опорна точка вибирається аргументом whence. Значення whence 0 вимірюється від початку файлу, 1 використовує поточну позицію файлу, а 2 використовує кінець файлу як контрольну точку. whence можна опустити і за умовчанням дорівнює 0, використовуючи початок файлу як контрольну точку.
>>> f = open('workfile', 'rb+')
>>> f.write(b'0123456789abcdef')
16
>>> f.seek(5) # Go to the 6th byte in the file
5
>>> f.read(1)
b'5'
>>> f.seek(-3, 2) # Go to the 3rd byte before the end
13
>>> f.read(1)
b'd'
У текстових файлах (відкритих без b
у рядку режиму) дозволений лише пошук відносно початку файлу (виняток полягає в пошуку до самого кінця файлу за допомогою seek(0, 2)
), і єдиними дійсними значеннями offset є ті, які повертає f.tell()
або нуль. Будь-яке інше значення offset призводить до невизначеної поведінки.
File objects have some additional methods, such as isatty()
and
truncate()
which are less frequently used; consult the Library
Reference for a complete guide to file objects.
7.2.2. Збереження структурованих даних за допомогою json
¶
Strings can easily be written to and read from a file. Numbers take a bit more
effort, since the read()
method only returns strings, which will have to
be passed to a function like int()
, which takes a string like '123'
and returns its numeric value 123. When you want to save more complex data
types like nested lists and dictionaries, parsing and serializing by hand
becomes complicated.
Rather than having users constantly writing and debugging code to save
complicated data types to files, Python allows you to use the popular data
interchange format called JSON (JavaScript Object Notation). The standard module called json
can take Python
data hierarchies, and convert them to string representations; this process is
called serializing. Reconstructing the data from the string representation
is called deserializing. Between serializing and deserializing, the
string representing the object may have been stored in a file or data, or
sent over a network connection to some distant machine.
Примітка
Формат JSON зазвичай використовується сучасними програмами для обміну даними. Багато програмістів уже знайомі з ним, що робить його хорошим вибором для сумісності.
Якщо у вас є об’єкт x
, ви можете переглянути його представлення рядка JSON за допомогою простого рядка коду:
>>> import json
>>> x = [1, 'simple', 'list']
>>> json.dumps(x)
'[1, "simple", "list"]'
Інший варіант функції dumps()
, який називається dump()
, просто серіалізує об’єкт у text file. Отже, якщо f
є об’єктом text file, відкритим для запису, ми можемо зробити це:
json.dump(x, f)
Щоб знову декодувати об’єкт, якщо f
є об’єктом binary file або text file, який було відкрито для читання:
x = json.load(f)
Примітка
Файли JSON мають бути закодовані в UTF-8. Використовуйте encoding="utf-8"
, коли відкриваєте файл JSON як text file як для читання, так і для запису.
Ця проста техніка серіалізації може працювати зі списками та словниками, але серіалізація довільних екземплярів класу в JSON потребує додаткових зусиль. Посилання на модуль json
містить пояснення цього.
Дивись також
pickle
- модуль pickle
На відміну від JSON, pickle — це протокол, який дозволяє серіалізувати довільно складні об’єкти Python. Як такий, він специфічний для Python і не може використовуватися для зв’язку з програмами, написаними іншими мовами. Це також небезпечно за замовчуванням: десеріалізація даних pickle, що надходять із ненадійного джерела, може виконувати довільний код, якщо дані були створені кваліфікованим зловмисником.