6. 模組
*******

如果從 Python 直譯器離開後又再次進入，之前（幫函式或變數）做的定義都會
消失。因此，想要寫一些比較長的程式時，你最好使用編輯器來準備要輸入給直
譯器的內容，並且用該檔案來運行它。這就是一個*腳本（script）*。隨著你的
程式越變越長，你可能會想要把它分開成幾個檔案，讓它比較好維護。你可能也
會想用一個你之前已經在其他程式寫好的函式，但不想要複製該函式的原始定義
到所有使用它的程式裡。

为实现这些需求，Python 把各种定义存入一个文件，在脚本或解释器的交互式
实例中使用。这个文件就是 *模块* ；模块中的定义可以 *导入* 到其他模块或
*主* 模块（在顶层和计算器模式下，执行脚本中可访问的变量集）。

模块是包含 Python 定义和语句的文件。其文件名是模块名加后缀名 ".py" 。
在模块内部，通过全局变量 "__name__" 可以获取模块名（即字符串）。例如，
用文本编辑器在当前目录下创建 "fibo.py" 文件，输入以下内容：

   # Fibonacci numbers module

   def fib(n):    # write Fibonacci series up to n
       a, b = 0, 1
       while a < n:
           print(a, end=' ')
           a, b = b, a+b
       print()

   def fib2(n):   # return Fibonacci series up to n
       result = []
       a, b = 0, 1
       while a < n:
           result.append(a)
           a, b = b, a+b
       return result

现在，进入 Python 解释器，用以下命令导入该模块：

   >>> import fibo

这项操作不直接把 "fibo" 函数定义的名称导入到当前符号表，只导入模块名
"fibo" 。要使用模块名访问函数：

   >>> fibo.fib(1000)
   0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987
   >>> fibo.fib2(100)
   [0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]
   >>> fibo.__name__
   'fibo'

如果经常使用某个函数，可以把它赋值给局部变量：

   >>> fib = fibo.fib
   >>> fib(500)
   0 1 1 2 3 5 8 13 21 34 55 89 144 233 377


6.1. 模块详解
=============

模块包含可执行语句及函数定义。这些语句用于初始化模块，且仅在 import 语
句 *第一次* 遇到模块名时执行。[1] (文件作为脚本运行时，也会执行这些语
句。)

模块有自己的私有符号表，用作模块中所有函数的全局符号表。因此，在模块内
使用全局变量时，不用担心与用户定义的全局变量发生冲突。另一方面，可以用
与访问模块函数一样的标记法，访问模块的全局变量，"modname.itemname"。

可以把其他模块导入模块。 按惯例，所有 "import" 语句都放在模块（或脚本
）开头，但这不是必须的。 被导入的模块名存在导入方模块的全局符号表里。

"import" 语句有一个变体，可以直接把模块里的名称导入到另一个模块的符号
表。例如：

   >>> from fibo import fib, fib2
   >>> fib(500)
   0 1 1 2 3 5 8 13 21 34 55 89 144 233 377

这段代码不会把模块名导入到局部符号表里（因此，本例没有定义 "fibo"）。

还有一种变体可以导入模块内定义的所有名称：

   >>> from fibo import *
   >>> fib(500)
   0 1 1 2 3 5 8 13 21 34 55 89 144 233 377

这种方式会导入所有不以下划线（"_"）开头的名称。大多数情况下，不要用这
个功能，这种方式向解释器导入了一批未知的名称，可能会覆盖已经定义的名称
。

注意，一般情况下，不建议从模块或包内导入 "*"，因为，这项操作经常让代码
变得难以理解。不过，为了在交互式编译器中少打几个字，这么用也没问题。

模块名后使用 "as" 时，直接把 "as" 后的名称与导入模块绑定。

   >>> import fibo as fib
   >>> fib.fib(500)
   0 1 1 2 3 5 8 13 21 34 55 89 144 233 377

与 "import fibo" 一样，这种方式也可以有效地导入模块，唯一的区别是，导
入的名称是 "fib"。

"from" 中也可以使用这种方式，效果类似：

   >>> from fibo import fib as fibonacci
   >>> fibonacci(500)
   0 1 1 2 3 5 8 13 21 34 55 89 144 233 377

備註:

  为了保证运行效率，每次解释器会话只导入一次模块。如果更改了模块内容，
  必须重启解释器；仅交互测试一个模块时，也可以使用
  "importlib.reload()"，例如 "import importlib;
  importlib.reload(modulename)"。


6.1.1. 以脚本方式执行模块
-------------------------

可以用以下方式运行 Python 模块：

   python fibo.py <arguments>

这项操作将执行模块里的代码，和导入模块一样，但会把 "__name__" 赋值为
""__main__""。 也就是把下列代码添加到模块末尾：

   if __name__ == "__main__":
       import sys
       fib(int(sys.argv[1]))

这个文件既能被用作脚本，又能被用作一个可供导入的模块，因为解析命令行参
数的那两行代码只有在模块作为“main”文件执行时才会运行：

   $ python fibo.py 50
   0 1 1 2 3 5 8 13 21 34

当这个模块被导入到其它模块时，那两行代码不运行：

   >>> import fibo
   >>>

这常用于为模块提供一个便捷的用户接口，或用于测试（把模块作为执行测试套
件的脚本运行）。


6.1.2. 模块搜索路径
-------------------

当一个名为 "spam" 的模块被导入的时候，解释器首先寻找具有该名称的内置模
块。如果没有找到，然后解释器从 "sys.path" 变量给出的目录列表里寻找名为
"spam.py" 的文件。"sys.path" 初始有这些目录地址:

* 被命令行直接运行的脚本所在的目录（或未指定文件时的当前目录）。

* "PYTHONPATH" （目录列表，与 shell 变量 "PATH" 的语法一样）。

* 取决于安装的默认设置

備註:

  在支持符号链接的文件系统中，“被命令行直接运行的脚本所在的目录”是符号
  链接最终指向的目录。换句话说，符号链接所在的目录并 **没有** 被添加至
  模块搜索路径。

初始化后，Python 程序可以更改 "sys.path"。脚本所在的目录先于标准库所在
的路径被搜索。这意味着，脚本所在的目录如果有和标准库同名的文件，那么加
载的是该目录里的，而不是标准库的。这一般是一个错误，除非这样的替换是你
有意为之。详见 标准模块。


6.1.3. “已编译的” Python 文件
-----------------------------

为了快速加载模块，Python 把模块的编译版本缓存在 "__pycache__" 目录中，
文件名为 "module.*version*.pyc"，version 对编译文件格式进行编码，一般
是 Python 的版本号。例如，CPython 的 3.3 发行版中，spam.py 的编译版本
缓存为 "__pycache__/spam.cpython-33.pyc"。这种命名惯例让不同 Python 版
本编译的模块可以共存。

Python 对比编译版与源码的修改日期，查看编译版是否已过期，是否要重新编
译。此进程完全是自动的。此外，编译模块与平台无关，因此，可在不同架构的
系统之间共享相同的库。

Python 在两种情况下不检查缓存。一，从命令行直接载入的模块，每次都会重
新编译，且不储存编译结果；二，没有源模块，就不会检查缓存。为了让一个库
能以隐藏源代码的形式分发（通过将所有源代码变为编译后的版本），编译后的
模块必须放在源目录而非缓存目录中，并且源目录绝不能包含同名的未编译的源
模块。

给专业人士的一些小建议：

* 在 Python 命令中使用 "-O" 或 "-OO" 开关，可以减小编译模块的大小。
  "-O" 去除断言语句，"-OO" 去除断言语句和 __doc__ 字符串。有些程序可能
  依赖于这些内容，因此，没有十足的把握，不要使用这两个选项。“优化过的”
  模块带有 "opt-" 标签，并且文件通常会一小些。将来的发行版或许会改进优
  化的效果。

* 从 ".pyc" 文件读取的程序不比从 ".py" 读取的执行速度快，".pyc" 文件只
  是加载速度更快。

* "compileall" 模块可以为一个目录下的所有模块创建 .pyc 文件。

* 本过程的细节及决策流程图，详见 **PEP 3147**。


6.2. 标准模块
=============

Python 自带一个标准模块的库，它在 Python 库参考（此处以下称为"库参考"
）里另外描述。  一些模块是内嵌到编译器里面的， 它们给一些虽并非语言核
心但却内嵌的操作提供接口，要么是为了效率，要么是给操作系统基础操作例如
系统调入提供接口。 这些模块集是一个配置选项， 并且还依赖于底层的操作系
统。 例如，"winreg" 模块只在 Windows 系统上提供。一个特别值得注意的模
块 "sys"，它被内嵌到每一个 Python 编译器中。"sys.ps1" 和 "sys.ps2" 变
量定义了一些字符，它们可以用作主提示符和辅助提示符:

   >>> import sys
   >>> sys.ps1
   '>>> '
   >>> sys.ps2
   '... '
   >>> sys.ps1 = 'C> '
   C> print('Yuck!')
   Yuck!
   C>

只有解释器用于交互模式时，才定义这两个变量。

变量 "sys.path" 是字符串列表，用于确定解释器的模块搜索路径。该变量以环
境变量 "PYTHONPATH" 提取的默认路径进行初始化，如未设置 "PYTHONPATH"，
则使用内置的默认路径。可以用标准列表操作修改该变量：

   >>> import sys
   >>> sys.path.append('/ufs/guido/lib/python')


6.3. "dir()" 函数
=================

内置函数 "dir()" 用于查找模块定义的名称。返回结果是经过排序的字符串列
表：

   >>> import fibo, sys
   >>> dir(fibo)
   ['__name__', 'fib', 'fib2']
   >>> dir(sys)  
   ['__displayhook__', '__doc__', '__excepthook__', '__loader__', '__name__',
    '__package__', '__stderr__', '__stdin__', '__stdout__',
    '_clear_type_cache', '_current_frames', '_debugmallocstats', '_getframe',
    '_home', '_mercurial', '_xoptions', 'abiflags', 'api_version', 'argv',
    'base_exec_prefix', 'base_prefix', 'builtin_module_names', 'byteorder',
    'call_tracing', 'callstats', 'copyright', 'displayhook',
    'dont_write_bytecode', 'exc_info', 'excepthook', 'exec_prefix',
    'executable', 'exit', 'flags', 'float_info', 'float_repr_style',
    'getcheckinterval', 'getdefaultencoding', 'getdlopenflags',
    'getfilesystemencoding', 'getobjects', 'getprofile', 'getrecursionlimit',
    'getrefcount', 'getsizeof', 'getswitchinterval', 'gettotalrefcount',
    'gettrace', 'hash_info', 'hexversion', 'implementation', 'int_info',
    'intern', 'maxsize', 'maxunicode', 'meta_path', 'modules', 'path',
    'path_hooks', 'path_importer_cache', 'platform', 'prefix', 'ps1',
    'setcheckinterval', 'setdlopenflags', 'setprofile', 'setrecursionlimit',
    'setswitchinterval', 'settrace', 'stderr', 'stdin', 'stdout',
    'thread_info', 'version', 'version_info', 'warnoptions']

没有参数时，"dir()" 列出当前已定义的名称：

   >>> a = [1, 2, 3, 4, 5]
   >>> import fibo
   >>> fib = fibo.fib
   >>> dir()
   ['__builtins__', '__name__', 'a', 'fib', 'fibo', 'sys']

注意它列出所有类型的名称：变量，模块，函数，……。

"dir()" 不会列出内置函数和变量的名称。这些内容的定义在标准模块
"builtins" 中：

   >>> import builtins
   >>> dir(builtins)  
   ['ArithmeticError', 'AssertionError', 'AttributeError', 'BaseException',
    'BlockingIOError', 'BrokenPipeError', 'BufferError', 'BytesWarning',
    'ChildProcessError', 'ConnectionAbortedError', 'ConnectionError',
    'ConnectionRefusedError', 'ConnectionResetError', 'DeprecationWarning',
    'EOFError', 'Ellipsis', 'EnvironmentError', 'Exception', 'False',
    'FileExistsError', 'FileNotFoundError', 'FloatingPointError',
    'FutureWarning', 'GeneratorExit', 'IOError', 'ImportError',
    'ImportWarning', 'IndentationError', 'IndexError', 'InterruptedError',
    'IsADirectoryError', 'KeyError', 'KeyboardInterrupt', 'LookupError',
    'MemoryError', 'NameError', 'None', 'NotADirectoryError', 'NotImplemented',
    'NotImplementedError', 'OSError', 'OverflowError',
    'PendingDeprecationWarning', 'PermissionError', 'ProcessLookupError',
    'ReferenceError', 'ResourceWarning', 'RuntimeError', 'RuntimeWarning',
    'StopIteration', 'SyntaxError', 'SyntaxWarning', 'SystemError',
    'SystemExit', 'TabError', 'TimeoutError', 'True', 'TypeError',
    'UnboundLocalError', 'UnicodeDecodeError', 'UnicodeEncodeError',
    'UnicodeError', 'UnicodeTranslateError', 'UnicodeWarning', 'UserWarning',
    'ValueError', 'Warning', 'ZeroDivisionError', '_', '__build_class__',
    '__debug__', '__doc__', '__import__', '__name__', '__package__', 'abs',
    'all', 'any', 'ascii', 'bin', 'bool', 'bytearray', 'bytes', 'callable',
    'chr', 'classmethod', 'compile', 'complex', 'copyright', 'credits',
    'delattr', 'dict', 'dir', 'divmod', 'enumerate', 'eval', 'exec', 'exit',
    'filter', 'float', 'format', 'frozenset', 'getattr', 'globals', 'hasattr',
    'hash', 'help', 'hex', 'id', 'input', 'int', 'isinstance', 'issubclass',
    'iter', 'len', 'license', 'list', 'locals', 'map', 'max', 'memoryview',
    'min', 'next', 'object', 'oct', 'open', 'ord', 'pow', 'print', 'property',
    'quit', 'range', 'repr', 'reversed', 'round', 'set', 'setattr', 'slice',
    'sorted', 'staticmethod', 'str', 'sum', 'super', 'tuple', 'type', 'vars',
    'zip']


6.4. 包
=======

包是一种用“点式模块名”构造 Python 模块命名空间的方法。例如，模块名
"A.B" 表示包 "A" 中名为 "B" 的子模块。正如模块可以区分不同模块之间的全
局变量名称一样，点式模块名可以区分 NumPy 或 Pillow 等不同多模块包之间
的模块名称。

假设要为统一处理声音文件与声音数据设计一个模块集（“包”）。声音文件的格
式很多（通常以扩展名来识别，例如：".wav"，".aiff"，".au"），因此，为了
不同文件格式之间的转换，需要创建和维护一个不断增长的模块集合。为了实现
对声音数据的不同处理（例如，混声、添加回声、均衡器功能、创造人工立体声
效果），还要编写无穷无尽的模块流。下面这个分级文件树展示了这个包的架构
：

   sound/                          Top-level package
         __init__.py               Initialize the sound package
         formats/                  Subpackage for file format conversions
                 __init__.py
                 wavread.py
                 wavwrite.py
                 aiffread.py
                 aiffwrite.py
                 auread.py
                 auwrite.py
                 ...
         effects/                  Subpackage for sound effects
                 __init__.py
                 echo.py
                 surround.py
                 reverse.py
                 ...
         filters/                  Subpackage for filters
                 __init__.py
                 equalizer.py
                 vocoder.py
                 karaoke.py
                 ...

导入包时，Python 搜索 "sys.path" 里的目录，查找包的子目录。

Python 只把含 "__init__.py" 文件的目录当成包。这样可以防止以 "string"
等通用名称命名的目录，无意中屏蔽出现在后方模块搜索路径中的有效模块。
最简情况下，"__init__.py" 只是一个空文件，但该文件也可以执行包的初始化
代码，或设置 "__all__" 变量，详见下文。

还可以从包中导入单个模块，例如：

   import sound.effects.echo

这段代码加载子模块 "sound.effects.echo" ，但引用时必须使用子模块的全名
：

   sound.effects.echo.echofilter(input, output, delay=0.7, atten=4)

另一种导入子模块的方法是 ：

   from sound.effects import echo

这段代码还可以加载子模块 "echo" ，不加包前缀也可以使用。因此，可以按如
下方式使用：

   echo.echofilter(input, output, delay=0.7, atten=4)

Import 语句的另一种变体是直接导入所需的函数或变量：

   from sound.effects.echo import echofilter

同样，这样也会加载子模块 "echo"，但可以直接使用函数 "echofilter()"：

   echofilter(input, output, delay=0.7, atten=4)

注意，使用 "from package import item" 时，item 可以是包的子模块（或子
包），也可以是包中定义的函数、类或变量等其他名称。"import" 语句首先测
试包中是否定义了 item；如果未在包中定义，则假定 item 是模块，并尝试加
载。如果找不到 item，则触发 "ImportError" 异常。

相反，使用 "import item.subitem.subsubitem" 句法时，除最后一项外，每个
item 都必须是包；最后一项可以是模块或包，但不能是上一项中定义的类、函
数或变量。


6.4.1. 从包中导入 *
-------------------

使用 "from sound.effects import *" 时会发生什么？你可能希望它会查找并
导入包的所有子模块，但事实并非如此。因为这将花费很长的时间，并且可能会
产生你不想要的副作用，如果这种副作用被你设计为只有在导入某个特定的子模
块时才应该发生。

唯一的解决办法是提供包的显式索引。"import" 语句使用如下惯例：如果包的
"__init__.py" 代码定义了列表 "__all__"，运行 "from package import *"
时，它就是被导入的模块名列表。发布包的新版本时，包的作者应更新此列表。
如果包的作者认为没有必要在包中执行导入 * 操作，也可以不提供此列表。例
如，"sound/effects/__init__.py" 文件可以包含以下代码：

   __all__ = ["echo", "surround", "reverse"]

这意味着 "from sound.effects import *" 将导入 "sound" 包的三个命名子模
块。

如果没有定义 "__all__"，"from sound.effects import *" 语句 *不会* 把包
"sound.effects" 中所有子模块都导入到当前命名空间；该语句只确保导入包
"sound.effects" （可能还会运行 "__init__.py" 中的初始化代码），然后，
再导入包中定义的名称。这些名称包括 "__init__.py" 中定义的任何名称（以
及显式加载的子模块），还包括之前 "import" 语句显式加载的包里的子模块。
请看以下代码：

   import sound.effects.echo
   import sound.effects.surround
   from sound.effects import *

本例中，执行 "from...import" 语句时，将把 "echo" 和 "surround" 模块导
入至当前命名空间，因为，它们是在 "sound.effects" 包里定义的。（该导入
操作在定义了 "__all__" 时也有效。）

虽然，可以把模块设计为用 "import *" 时只导出遵循指定模式的名称，但仍不
提倡在生产代码中使用这种做法。

记住，使用 "from package import specific_submodule" 没有任何问题！ 实
际上，除了导入模块使用不同包的同名子模块之外，这种方式是推荐用法。


6.4.2. 相对导入
---------------

包中内有多个子包时（与示例中的 "sound" 包一样），可以使用绝对导入来引
用兄弟包中的子模块。例如，要在模块 "sound.filters.vocoder" 中使用
"sound.effects" 包的 "echo" 模块时，可以用 "from sound.effects import
echo" 导入。

还可以用 import 语句的 "from module import name" 形式执行相对导入。下
面的导入语句使用前导句点表示相对导入中的当前包和父包。例如，相对于
"surround" 模块，可以使用：

   from . import echo
   from .. import formats
   from ..filters import equalizer

注意，相对导入基于当前模块名。因为主模块名永远是 ""__main__"" ，所以如
果计划将一个模块用作 Python 应用程序的主模块，那么该模块内的导入语句必
须始终使用绝对导入。


6.4.3. 多目录中的包
-------------------

包还支持一个特殊属性 "__path__" 。在包的 "__init__.py" 中的代码被执行
前，该属性被初始化为一个只含一项的列表，该项是一个字符串，是
__init__.py 所在目录的名称。可以修改此变量；这样做会改变在此包中搜索模
块和子包的方式。

这个功能虽然不常用，但可用于扩展包中的模块集。

-[ 註解 ]-

[1] 实际上，函数定义也是“可执行”的“语句”；执行模块级函数定义时，函数名
    将被导入到模块的全局符号表。
