7. 入力と出力
*************

プログラムから出力を行う方法がいくつかあります。データは人間が読める形
で出力することも、将来使うためにファイルに書くこともできます。この章で
は、こうした幾つかの出力の方法について話します。


7.1. ファンシーな出力の書式化
=============================

これまでのところ、値を出力する二つの方法: *式文 (expression
statement)* と "print" 文が出てきました。 (第三はファイルオブジェクト
の "write()" メソッドを使う方法です。標準出力を表すファイルは
"sys.stdout" で参照できます。詳細はライブラリリファレンスを参照してく
ださい。)

出力を書式化する際に、単に値をスペースで区切って出力するよりももっとき
め細かな制御をしたいと思うことがあるでしょう。出力を書式化するには二つ
の方法があります。第一の方法は、全ての文字列を自分で処理するというもの
です。文字列のスライスや結合といった操作を使えば、思い通りのレイアウト
を作成することができます。文字列オブジェクトは、文字列を指定されたカラ
ム幅に揃えるための幾つかの便利なメソッドを提供しています。これらのメソ
ッドについてはすぐ後で簡単に説明します。もうひとつの方法は
"str.format()" メソッドを利用することです。

"string" モジュールの "Template" クラスは文字列中の値を置換する別の方
法を提供しています。

もちろん、一つ問題があります。値をどうやって文字列に変換したらいいので
しょうか？幸運なことに、Python には値を文字列に変換する方法があります
。値を "repr()" か "str()" 関数に渡してください。

"str()" 関数は値の人間に読める表現を返すためのもので、 "repr()" 関数は
インタープリタに読める (あるいは同値となる構文がない場合は必ず
"SyntaxError" になるような) 表現を返すためのものです。人間が読むのに適
した特定の表現を持たないオブジェクトにおいては、 "str()" は "repr()"
と同じ値を返します。数値や、リストや辞書を始めとするデータ構造など、多
くの値がどちらの関数に対しても同じ表現を返します。一方、文字列と浮動小
数点数は、2つの異なる表現を持っています。

幾つかの例です:

   >>> s = 'Hello, world.'
   >>> str(s)
   'Hello, world.'
   >>> repr(s)
   "'Hello, world.'"
   >>> str(1.0/7.0)
   '0.142857142857'
   >>> repr(1.0/7.0)
   '0.14285714285714285'
   >>> x = 10 * 3.25
   >>> y = 200 * 200
   >>> s = 'The value of x is ' + repr(x) + ', and y is ' + repr(y) + '...'
   >>> print s
   The value of x is 32.5, and y is 40000...
   >>> # The repr() of a string adds string quotes and backslashes:
   ... hello = 'hello, world\n'
   >>> hellos = repr(hello)
   >>> print hellos
   'hello, world\n'
   >>> # The argument to repr() may be any Python object:
   ... repr((x, y, ('spam', 'eggs')))
   "(32.5, 40000, ('spam', 'eggs'))"

以下に 2 乗と 3 乗の値からなる表を書く二つの方法を示します:

   >>> for x in range(1, 11):
   ...     print repr(x).rjust(2), repr(x*x).rjust(3),
   ...     # Note trailing comma on previous line
   ...     print repr(x*x*x).rjust(4)
   ...
    1   1    1
    2   4    8
    3   9   27
    4  16   64
    5  25  125
    6  36  216
    7  49  343
    8  64  512
    9  81  729
   10 100 1000

   >>> for x in range(1,11):
   ...     print '{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x)
   ...
    1   1    1
    2   4    8
    3   9   27
    4  16   64
    5  25  125
    6  36  216
    7  49  343
    8  64  512
    9  81  729
   10 100 1000

(最初の例で、 "print" の動作により各カラムの間にスペースが一個ずつ追加
されていることに注意してください。 "print" はデフォルトでは引数間に空
白を追加します。)

この例では、文字列の "str.rjust()" メソッドの使い方を示しています。
"str.rjust()" は文字列を指定された幅のフィールド内に右詰めで入るように
、左に空白を追加します。同様のメソッドとして、 "str.ljust()" と
"str.center()" があります。これらのメソッドは何か出力を行うわけではな
く、ただ新しい文字列を返します。入力文字列が長すぎる場合、文字列を切り
詰めることはせず、ただ値をそのまま返します。この仕様のためにカラムのレ
イアウトが滅茶苦茶になるかもしれませんが、嘘の値が代わりに書き出される
よりはましです。(本当に切り詰めを行いたいのなら、全てのカラムに
"x.ljust(n)[:n]" のようにスライス表記を加えることもできます。)

もう一つのメソッド、 "str.zfill()" は、数値文字列の左側をゼロ詰めしま
す。このメソッドは正と負の符号を正しく扱います:

   >>> '12'.zfill(5)
   '00012'
   >>> '-3.14'.zfill(7)
   '-003.14'
   >>> '3.14159265359'.zfill(5)
   '3.14159265359'

"str.format()" メソッドの基本的な使い方は次のようなものです:

   >>> print 'We are the {} who say "{}!"'.format('knights', 'Ni')
   We are the knights who say "Ni!"

括弧とその中の文字(これをフォーマットフィールドと呼びます)は、
"str.format()" メソッドに渡されたオブジェクトに置換されます。括弧の中
の数字は "str.format()" メソッドに渡されたオブジェクトの位置を表します
。

   >>> print '{0} and {1}'.format('spam', 'eggs')
   spam and eggs
   >>> print '{1} and {0}'.format('spam', 'eggs')
   eggs and spam

"str.format()" メソッドにキーワード引数が渡された場合、その値はキーワ
ード引数の名前によって参照されます。

   >>> print 'This {food} is {adjective}.'.format(
   ...       food='spam', adjective='absolutely horrible')
   This spam is absolutely horrible.

順序引数とキーワード引数を組み合わせて使うこともできます:

   >>> print 'The story of {0}, {1}, and {other}.'.format('Bill', 'Manfred',
   ...                                                    other='Georg')
   The story of Bill, Manfred, and Georg.

"str()" を適応する "'!s'" や "repr()" を適応する "'!r'" を使って、値を
フォーマットする前に変換することができます。

   >>> import math
   >>> print 'The value of PI is approximately {}.'.format(math.pi)
   The value of PI is approximately 3.14159265359.
   >>> print 'The value of PI is approximately {!r}.'.format(math.pi)
   The value of PI is approximately 3.141592653589793.

オプションの "':'" とフォーマット指定子を、フィールド名の後ろに付ける
ことができます。フォーマット指定子によって値がどうフォーマットされるか
を制御することができます。次の例では、円周率πを、小数点以下3桁でまるめ
てフォーマットしています。

>>> import math
>>> print 'The value of PI is approximately {0:.3f}.'.format(math.pi)
The value of PI is approximately 3.142.

"':'" の後ろに整数をつけると、そのフィールドの最低の文字幅を指定できま
す。この機能は綺麗なテーブルを作るのに便利です。

   >>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678}
   >>> for name, phone in table.items():
   ...     print '{0:10} ==> {1:10d}'.format(name, phone)
   ...
   Jack       ==>       4098
   Dcab       ==>       7678
   Sjoerd     ==>       4127

もしも長い書式化文字列があり、それを分割したくない場合には、変数を引数
の位置ではなく変数の名前で参照できるとよいでしょう。これは、辞書を引数
に渡して、角括弧 "'[]'" を使って辞書のキーを参照することで可能です

   >>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
   >>> print ('Jack: {0[Jack]:d}; Sjoerd: {0[Sjoerd]:d}; '
   ...        'Dcab: {0[Dcab]:d}'.format(table))
   Jack: 4098; Sjoerd: 4127; Dcab: 8637678

table を '**' 記法を使ってキーワード引数として渡す方法もあります。

   >>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
   >>> print 'Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**table)
   Jack: 4098; Sjoerd: 4127; Dcab: 8637678

全てのローカルな変数が入った辞書を返す組み込み関数 "vars()" と組み合わ
せると特に便利です。

"str.format()" による文字列フォーマットの完全な解説は、 書式指定文字列
の文法 を参照してください。


7.1.1. 古い文字列フォーマット方法
---------------------------------

"%" 演算しを使って文字列フォーマットをする方法もあります。これは、演算
子の左側の "sprintf()" スタイルのフォーマット文字列に、演算子の右側の
値を適用し、その結果の文字列を返します。例えば:

   >>> import math
   >>> print 'The value of PI is approximately %5.3f.' % math.pi
   The value of PI is approximately 3.142.

より詳しい情報は 文字列フォーマット操作 にあります。


7.2. ファイルを読み書きする
===========================

"open()" は *file object* を返します。大抵、 "open(filename, mode)" の
ように二つの引数を伴って呼び出されます。

   >>> f = open('workfile', 'w')
   >>> print f
   <open file 'workfile', mode 'w' at 80a0960>

最初の引数はファイル名の入った文字列です。二つめの引数も文字列で、ファ
イルをどのように使うかを示す数個の文字が入っています。 *mode* は、ファ
イルが読み出し専用なら "'r'" 、書き込み専用 (同名の既存のファイルがあ
れば消去されます) なら "'w'" とします。 "'a'" はファイルを追記用に開き
ます。ファイルに書き込まれた内容は自動的にファイルの終端に追加されます
。 "'r+'" はファイルを読み書き両用に開きます。 *mode* 引数は省略可能で
、省略された場合には "'r'" であると仮定します。

Windows では、 *mode* に "'b'" を追加するとファイルをバイナリモードで
開きます。したがって、 "'rb'",  "'wb'", "'r+b'" といったモードがありま
す。 Windows 上で動くPython はテキストファイルとバイナリファイルを区別
しています。テキストファイルでは、読み書きの際に行末文字が自動的に少し
変更されます。この舞台裏でのファイルデータ変更は、ASCII でできたテキス
トファイルでは差し支えないものですが、 "JPEG" や "EXE" ファイルのよう
なバイナリデータは破損してしまうことになるでしょう。こうしたファイルを
読み書きする際にはバイナリモードを使うよう十分注意してください。 Unix
では、 "'b'" を追加しても何も影響がないので、バイナリフォーマットを扱
うためのプラットフォーム非依存な方法として利用できます。


7.2.1. ファイルオブジェクトのメソッド
-------------------------------------

この節の以降の例は、 "f" というファイルオブジェクトが既に生成されてい
るものと仮定します。

ファイルの内容を読み出すには、 "f.read(size)" を呼び出します。このメソ
ッドはある量のデータを読み出して、文字列として返します。 *size* は省略
可能な数値引数です。 *size* が省略されたり負の数であった場合、ファイル
の内容全てを読み出して返します。ただし、ファイルがマシンのメモリの二倍
の大きさもある場合にはどうなるかわかりません。 *size* が負でない数なら
ば、最大で *size* バイトを読み出して返します。ファイルの終端にすでに達
していた場合、 "f.read()" は空の文字列 ("""") を返します。

   >>> f.read()
   'This is the entire file.\n'
   >>> f.read()
   ''

"f.readline()" はファイルから 1 行だけを読み取ります。改行文字 ("\n")
は読み出された文字列の終端に残ります。改行が省略されるのは、ファイルが
改行で終わっていない場合の最終行のみです。これは、戻り値があいまいでな
いようにするためです; "f.readline()" が空の文字列を返したら、ファイル
の終端に達したことが分かります。一方、空行は "'\n'" 、すなわち改行 1
文字だけからなる文字列で表現されます。

   >>> f.readline()
   'This is the first line of the file.\n'
   >>> f.readline()
   'Second line of the file\n'
   >>> f.readline()
   ''

ファイルから複数行を読み取るには、ファイルオブジェクトに対してループを
書く方法があります。この方法はメモリを効率的に使え、高速で、簡潔なコー
ドになります:

   >>> for line in f:
           print line,

   This is the first line of the file.
   Second line of the file

ファイルのすべての行をリスト形式で読み取りたいなら、"list(f)" や
"f.readlines()" を使うこともできます。

"f.write(string)" は、 *string* の内容をファイルに書き込み、 "None" を
返します。

   >>> f.write('This is a test\n')

文字列以外のものを出力したい場合、まず文字列に変換してやる必要がありま
す:

   >>> value = ('the answer', 42)
   >>> s = str(value)
   >>> f.write(s)

"f.tell()" は、ファイルオブジェクトが指しているあるファイル中の位置を
示す整数を、ファイルの先頭からのバイト数で図った値で返します。ファイル
オブジェクトの位置を変更するには、 "f.seek(offset,  from_what)" を使い
ます。ファイル位置は基準点 (reference point) にオフセット値 *offset*
を足して計算されます。参照点は *from_what* 引数で選びます。
*from_what* の値が 0 ならばファイルの先頭から測り、 1 ならば現在のファ
イル位置を使い、2 ならばファイルの終端を参照点として使います。
*from_what* は省略することができ、デフォルトの値は 0 、すなわち参照点
としてファイルの先頭を使います:

   >>> f = open('workfile', 'r+')
   >>> f.write('0123456789abcdef')
   >>> f.seek(5)      # Go to the 6th byte in the file
   >>> f.read(1)
   '5'
   >>> f.seek(-3, 2)  # Go to the 3rd byte before the end
   >>> f.read(1)
   'd'

ファイルが用済みになったら、 "f.close()" を呼び出してファイルを閉じ、
ファイルを開くために取られていたシステム資源を解放します。 "f.close()"
を呼び出した後、そのファイルオブジェクトを使おうとすると自動的に失敗し
ます:

   >>> f.close()
   >>> f.read()
   Traceback (most recent call last):
     File "<stdin>", line 1, in <module>
   ValueError: I/O operation on closed file

ファイルオブジェクトを扱うときに "with" キーワードを使うのは良い習慣で
す。 "with" を使うと、処理中に例外が発生しても必ず最後にファイルを閉じ
ることができます。同じことを "try"-"finally" を使って書くよりずっと簡
潔に書けます:

   >>> with open('workfile', 'r') as f:
   ...     read_data = f.read()
   >>> f.closed
   True

ファイルオブジェクトには、他にも "isatty()" や "truncate()" といった、
あまり使われないメソッドがあります。ファイルオブジェクトについての完全
なガイドは、ライブラリリファレンスを参照してください。


7.2.2. "json" による構造化されたデータの保存
--------------------------------------------

文字列は簡単にファイルに書き込んだり、ファイルから読み込んだりすること
ができます。数値の場合には少し努力が必要です。というのも、"read()" メ
ソッドは文字列しか返さないため、"int()" のような関数にその文字列を渡し
て、たとえば文字列 "'123'" のような文字列を、数値 123 に変換しなくては
ならないからです。もっと複雑なデータ型、例えば入れ子になったリストや辞
書の場合、手作業でのパースやシリアライズは困難になります。

ユーザが毎回コードを書いたりデバッグしたりして複雑なデータ型をファイル
に保存するかわりに、Python では一般的なデータ交換形式である JSON
(JavaScript Object Notation) を使うことができます。この標準モジュール
"json" は、Python のデータ 階層を取り、文字列表現に変換します。この処
理は *シリアライズ (serializing)* と呼ばれます。文字列表現からデータを
再構築することは、*デシリアライズ (deserializing)* と呼ばれます。シリ
アライズされてからデシリアライズされるまでの間に、オブジェクトの文字列
表現はファイルやデータの形で保存したり、ネットワークを通じて離れたマシ
ンに送ったりすることができます。

注釈: JSON 形式は現代的なアプリケーションでデータをやりとりする際に
  よく使 われます。多くのプログラマーが既に JSON になじんでいるため、
  JSON は データの相互交換をする場合の良い選択肢です。

オブジェクト "x" があり、その JSON 形式の文字列表現を見るには、単純な1
行のコードを書くだけです:

   >>> import json
   >>> json.dumps([1, 'simple', 'list'])
   '[1, "simple", "list"]'

"dumps()" に似た関数に、"dump()" があり、こちらは単純にオブジェクトを
ファイルにシリアライズします。"f" が書き込み用に開かれた *file object*
だとすると、次のように書くことができます。

   json.dump(x, f)

逆にデシリアライズするには、"f" が読み込み用に開かれた *file object*
だとすると、次のようになります。

   x = json.load(f)

このような単純なシリアライズをする手法は、リストや辞書を扱うことはでき
ますが、任意のクラス・インスタンスを JSON にシリアライズするにはもう少
し努力しなくてはなりません。"json" モジュールのリファレンスにこれにつ
いての解説があります。

参考: "pickle" - pickle モジュール

  JSON とは対照的に、 *pickle* は任意の複雑な Python オブジェクトをシ
  リアライズ可能なプロトコルです。しかし、Python に特有のプロトコルで
  、他の言語で記述されたアプリケーションと通信するのには使えません。さ
  らに、デフォルトでは安全でなく、信頼できない送信元から送られてきた、
  スキルのある攻撃者によって生成された pickle データをデシリアライズす
  ると、攻撃者により任意のコードが実行されてしまいます。
