filecmp
--- File and Directory Comparisons¶
ソースコード: Lib/filecmp.py
filecmp
モジュールでは、ファイルおよびディレクトリを比較するため、様々な時間/正確性のトレードオフに関するオプションを備えた関数を定義しています。ファイルの比較については、 difflib
モジュールも参照してください。
filecmp
モジュールでは以下の関数を定義しています:
- filecmp.cmp(f1, f2, shallow=True)¶
名前が f1 および f2 のファイルを比較し、二つのファイルが同じらしければ
True
を返し、そうでなければFalse
を返します。If shallow is true and the
os.stat()
signatures (file type, size, and modification time) of both files are identical, the files are taken to be equal.Otherwise, the files are treated as different if their sizes or contents differ.
可搬性と効率のために、この関数は外部プログラムを一切呼び出さないので注意してください。
この関数は過去の比較と結果のキャッシュを使用します。ファイルの
os.stat()
情報が変更された場合、キャッシュの項目は無効化されます。clear_cache()
を使用して全キャッシュを削除することが出来ます。
- filecmp.cmpfiles(dir1, dir2, common, shallow=True)¶
dir1 と dir2 ディレクトリの中の、common で指定されたファイルを比較します。
ファイル名からなる3つのリスト: match, mismatch, errors を返します。match には双方のディレクトリで一致したファイルのリストが含まれ、mismatch にはそうでないファイル名のリストが入ります。そして errors は比較されなかったファイルが列挙されます。errors になるのは、片方あるいは両方のディレクトリに存在しなかった、ユーザーにそのファイルを読む権限がなかった、その他何らかの理由で比較を完了することができなかった場合です。
引数 shallow はその意味も標準の設定も
filecmp.cmp()
と同じです。例えば、
cmpfiles('a', 'b', ['c', 'd/e'])
はa/c
をb/c
と、a/d/e
をb/d/e
と、それぞれ比較します。'c'
と'd/e'
はそれぞれ、返される3つのリストのいずれかに登録されます。
- filecmp.clear_cache()¶
filecmp のキャッシュをクリアします。背後のファイルシステムの mtime 分解能未満でのファイル変更後にすぐに比較するような場合に有用です。
バージョン 3.4 で追加.
dircmp
クラス¶
- class filecmp.dircmp(a, b, ignore=None, hide=None)¶
Construct a new directory comparison object, to compare the directories a and b. ignore is a list of names to ignore, and defaults to
filecmp.DEFAULT_IGNORES
. hide is a list of names to hide, and defaults to[os.curdir, os.pardir]
.The
dircmp
class compares files by doing shallow comparisons as described forfilecmp.cmp()
.dircmp
クラスは以下のメソッドを提供しています:- report()¶
a と b の比較を (
sys.stdout
に) 表示します。
- report_partial_closure()¶
a および b およびそれらの直下にある共通のサブディレクトリ間での比較結果を出力します。
- report_full_closure()¶
a および b およびそれらの共通のサブディレクトリ間での比較結果を (再帰的に比較して) 出力します。
dircmp
クラスは、比較されているディレクトリ階層に関する様々な情報のビットを得るために使用することのできる、興味深い属性を数多く提供しています。Note that via
__getattr__()
hooks, all attributes are computed lazily, so there is no speed penalty if only those attributes which are lightweight to compute are used.- left¶
ディレクトリ a です。
- right¶
ディレクトリ b です。
- left_list¶
a にあるファイルおよびサブディレクトリです。hide および ignore でフィルタされています。
- right_list¶
b にあるファイルおよびサブディレクトリです。hide および ignore でフィルタされています。
- common¶
a および b の両方にあるファイルおよびサブディレクトリです。
- left_only¶
a だけにあるファイルおよびサブディレクトリです。
- right_only¶
b だけにあるファイルおよびサブディレクトリです。
- common_dirs¶
a および b の両方にあるサブディレクトリです。
- common_files¶
a および b の両方にあるファイルです。
- same_files¶
クラスのファイル比較オペレータを用いて a と b の両方において同一のファイルです。
- diff_files¶
a と b の両方に存在し、クラスのファイル比較オペレータに基づいて内容が異なるファイルです。
- funny_files¶
a および b 両方にあるが、比較されなかったファイルです。
- subdirs¶
A dictionary mapping names in
common_dirs
todircmp
instances (or MyDirCmp instances if this instance is of type MyDirCmp, a subclass ofdircmp
).
これは subdirs
属性を使用して 2 つのディレクトリを再帰的に探索して、共通の異なるファイルを示すための単純化された例です:
>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
... for name in dcmp.diff_files:
... print("diff_file %s found in %s and %s" % (name, dcmp.left,
... dcmp.right))
... for sub_dcmp in dcmp.subdirs.values():
... print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2')
>>> print_diff_files(dcmp)