5. 임포트 시스템¶
한 모듈 에 있는 파이썬 코드는 임포팅 이라는 프로세스를 통해 다른 모듈에 있는 코드들에 대한 접근권을 얻는다. import
문은 임포트 절차를 일으키는 가장 흔한 방법이지만, 유일한 방법은 아니다. importlib.import_module()
같은 함수나 내장 __import__()
도 임포트 절차를 일으키는데 사용될 수 있다.
import
문은 두 가지 연산을 합친 것이다; 먼저 이름이 가리키는 모듈을 찾은 후에, 그 검색의 결과를 지역 스코프의 이름에 연결한다. import
문의 검색 연산은 적절한 인자들로 __import__()
함수를 호출하는 것으로 정의된다. __import__()
의 반환 값은 import
문의 이름 연결 연산을 수행하는 데 사용된다. 이 이름 연결 연산의 정확한 세부사항에 대해서는 import
문을 보면 된다.
__import__()
의 직접 호출은 모듈을 찾고, 발견된다면, 모듈을 만드는 연산만을 수행한다. 부모 패키지를 임포트하거나 여러 캐시(sys.modules
를 포함한다)를 갱신하는 것과 같은 부수적인 효과들이 일어날 수 있기는 하지만, 오직 import
문만이 이름 연결 연산을 수행한다.
import 문의 일부로 __import__()
를 호출할 때, 표준 내장 __import__()
가 호출된다. 임포트 시스템을 호출하는 다른 메커니즘 (importlib.import_module()
같은)은 __import__()
를 사용하지 않고 임포트 개념을 구현하기 위한 자신의 방법을 사용할 수 있다.
When a module is first imported, Python searches for the module and if found,
it creates a module object [1], initializing it. If the named module
cannot be found, an ImportError
is raised. Python implements various
strategies to search for the named module when the import machinery is
invoked. These strategies can be modified and extended by using various hooks
described in the sections below.
버전 3.3으로 변경: 임포트 시스템은 PEP 302 의 두 번째 단계를 완전히 구현하도록 개정되었다. 이제 묵시적인 임포트 절차는 없다 - 전체 임포트 시스템이 sys.meta_path
을 통해 노출된다. 여기에 더해, 네이티브(native) 이름 공간 패키지의 지원이 구현되었다 (PEP 420 을 보라).
5.1. importlib
¶
importlib
모듈은 임포트 시스템과 상호 작용하기 위한 풍부한 API를 제공한다. 예를 들어, importlib.import_module()
는 임포트 절차를 구동하는 데 있어 내장 __import__()
에 비해 권장되고, 더 간단한 API를 제공한다. 더 상세한 내용은 importlib
라이브러리 도큐멘테이션을 참고하면 된다.
5.2. 패키지(package)¶
파이썬은 한 가지 종류의 모듈 객체만 갖고 있고, 모든 모듈은 모듈이 파이썬이나 C나 그 밖의 다른 어떤 방법으로 구현되었는지와 상관없이 이 형이다. 모듈을 조직화하고 이름 계층구조를 제공하기 위해, 파이썬은 패키지 라는 개념을 갖고 있다.
패키지를 파일 시스템에 있는 디렉터리라고 생각할 수 있지만, 패키지와 모듈이 파일시스템으로부터 올 필요는 없으므로 이 비유를 너무 문자 그대로 해석하지 말아야 한다. 이 문서의 목적상, 디렉터리와 파일이라는 비유를 사용할 것이다. 파일 시스템 디렉터리처럼, 패키지는 계층적으로 조직화하고, 패키지는 보통 모듈뿐만 아니라 서브 패키지도 포함할 수 있다.
모든 패키지가 모듈이라는 것을 기억하는 것이 중요하다. 하지만 모든 모듈이 패키지인 것은 아니다. 다른 식으로 표현하면, 패키지는 특별한 종류의 모듈이다. 구체적으로, __path__
어트리뷰트를 포함하는 모든 모듈은 패키지로 취급된다.
모든 모듈은 이름이 있다. 서브 패키지 이름은 파이썬의 표준 어트리뷰트 액세스 문법을 따라, 부모 패키지 이름과 점(dot)으로 구분된다. 그래서 sys
라고 불리는 모듈과 email
이라고 불리는 패키지가 있을 수 있다. email 은 다시 서브 패키지 email.mime
을 갖고, 이 서브 패키지 내에 모듈 email.mime.text
가 있을 수 있다.
5.2.1. 정규 패키지¶
파이썬은 두 가지 종류의 패키지를 정의한다, 정규 패키지 와 이름 공간 패키지. 정규 패키지는 파이썬 3.2와 그 이전에 존재하던 전통적인 패키지다. 정규 패키지는 보통 __init__.py
파일을 가진 디렉터리로 구현된다. 정규 패키지가 임포트될 때, 이 __init__.py
파일이 묵시적으로 실행되고, 그것이 정의하는 객체들이 패키지의 이름 공간의 이름들도 연결된다. __init__.py
파일은 다른 모듈들이 가질 수 있는 것과 같은 파이썬 코드를 포함할 수 있고, 파이썬은 임포트될 때 모듈에 몇 가지 어트리뷰트를 추가한다.
예를 들어, 다음과 같은 파일시스템 배치는 최상위 parent
패키지와 세 개의 서브 패키지를 정의한다:
parent/
__init__.py
one/
__init__.py
two/
__init__.py
three/
__init__.py
parent.one
을 임포트하면 parent/__init__.py
과 parent/one/__init__.py
을 묵시적으로 실행한다. 뒤이은 parent.two
와 parent.three
의 임포트는 각각 parent/two/__init__.py
와 parent/three/__init__.py
를 실행한다.
5.2.2. 이름 공간 패키지¶
이름 공간 패키지는 여러 가지 포션 들의 복합체인데, 각 포션들은 부모 패키지의 서브 패키지로 이바지한다. 포션들은 파일시스템의 다른 위치에 놓일 수 있다. 포션들은 zip 파일이나 네트워크나 파이썬이 임포트할 때 검색하는 어떤 다른 장소에서 발견될 수 있다. 이름 공간 패키지는 파일시스템의 객체와 직접적인 상관관계가 있을 수도 있고 그렇지 않을 수도 있다; 구체적인 형태가 없는 가상 모듈일 수도 있다.
이름 공간 패키지는 __path__
어트리뷰트로 일반적인 리스트를 사용하지 않는다. 대신에 특별한 이터러블 형을 사용하는데, 그 패키지 내의 다음 임포트 시도에서 그것의 부모 패키지(또는 최상위 패키지의 경우 sys.path
) 의 경로가 변했으면 패키지 포션에 대한 새 검색을 자동으로 수행하게 된다.
이름 공간 패키지의 경우, parent/__init__.py
파일이 없다. 사실, 임포트 검색 동안 여러 개의 parent` 디렉터리가 발견될 수 있고, 각각의 것은 다른 포션들에 의해 제공된다. 그래서 ``parent/one
은 물리적으로 parent/two
옆에 위치하지 않을 수 있다. 이 경우, 파이썬은 자신 또는 서브 패키지 중 어느 하나가 임포트 될 때마다 최상위 parent
패키지를 위한 이름 공간 패키지를 만든다.
이름 공간 패키지의 규격은 PEP 420 을 참고하라.
5.3. 검색¶
검색을 시작하기 위해, 파이썬은 임포트될 모듈(또는 패키지, 하지만 이 논의에서 차이점은 중요하지 않다)의 완전히 정규화된 이름 을 필요로 한다. 이 이름은 import
문으로 제공된 여러 인자나, importlib.import_module()
나 __import__()
함수로 전달된 파라미터들로부터 온다.
This name will be used in various phases of the import search, and it may be
the dotted path to a submodule, e.g. foo.bar.baz
. In this case, Python
first tries to import foo
, then foo.bar
, and finally foo.bar.baz
.
If any of the intermediate imports fail, an ImportError
is raised.
5.3.1. 모듈 캐시¶
임포트 검색 도중 처음으로 검사되는 장소는 sys.modules
다. 이 매핑은 중간 경로들을 포함해서 전에 임포트된 모든 모듈의 캐시로 기능한다. 그래서 만약 foo.bar.baz
가 앞서 임포트 되었다면, sys.modules
는 foo
, foo.bar
, foo.bar.baz
항목들을 포함한다. 각 키에 대응하는 값들은 모듈 객체다.
During import, the module name is looked up in sys.modules
and if
present, the associated value is the module satisfying the import, and the
process completes. However, if the value is None
, then an
ImportError
is raised. If the module name is missing, Python will
continue searching for the module.
sys.modules
is writable. Deleting a key may not destroy the
associated module (as other modules may hold references to it),
but it will invalidate the cache entry for the named module, causing
Python to search anew for the named module upon its next
import. The key can also be assigned to None
, forcing the next import
of the module to result in an ImportError
.
모듈 객체에 대한 참조를 유지한다면, sys.modules
의 캐시 항목을 무효로 한 후 다시 임포트하면 두 모듈 객체는 같은 것이 아니게 됨에 주의해야 한다. 반면에 importlib.reload()
는 같은 모듈 객체를 재사용하고, 간단하게 모듈의 코드를 다시 실행해서 모듈의 내용을 다시 초기화한다.
5.3.2. 파인더(finder)와 로더(loader)¶
모듈이 sys.modules
에서 발견되지 않으면, 모듈을 찾아서 로드하기 위해 파이썬의 임포트 프로토콜이 구동된다. 이 프로토콜은 두 개의 개념적 객체들로 구성되어 있다, 파인더 와 로더. 파인더의 일은 자신이 알고 있는 전략을 사용해, 주어진 이름의 모듈을 찾을 수 있는지 결정하는 것이다. 두 인터페이스 모두를 구현한 객체들을 임포터 라고 부른다 - 요청한 모듈을 로딩할 수 있다고 판단할 때 자신을 돌려준다.
파이썬은 여러 가지 기본 파인더들과 임포터들을 포함하고 있다. 첫 번째 것은 내장 모듈들의 위치를 찾을 수 있고, 두 번째 것은 프로즌 모듈(frozen module)의 위치를 찾을 수 있고, 세 번째 것은 모듈을 임포트 경로 에서 검색한다. 임포트 경로 는 파일 시스템의 경로나 zip 파일을 가리키는 위치들의 목록이다. 그것은 URL로 식별될 수 있는 것들처럼, 위치가 지정될 수 있는 자원들을 검색하도록 확장될 수 있다.
임포트 절차는 확장 가능해서, 모듈 검색의 범위를 확대하기 위해 새 파인더를 추가할 수 있다.
파인더는 실제로 모듈을 로드하지는 않는다. 주어진 이름의 모듈을 찾으면 임포트와 관련된 정보들을 요약한 모듈 스펙 (module spec) 을 돌려주는데, 임포트 절차는 모듈을 로딩할 때 이것을 사용하게 된다.
다음 섹션은 파인더와 로더의 프로토콜에 대해 좀 더 자세히 설명하는데, 임포트 절차를 확장하기 위해 어떻게 새로운 것들을 만들고 등록하는지를 포함한다.
버전 3.4으로 변경: 이전 버전의 파이썬에서, 파인더가 로더 를 직접 돌려주었지만, 이제는 로더를 포함하고 있는 모듈 스펙을 돌려준다. 임포트 도중 로더가 아직 사용되기는 하지만 그 역할은 축소되었다.
5.3.3. 임포트 훅(import hooks)¶
임포트 절차는 확장할 수 있도록 설계되었다; 일차적인 메커니즘은 임포트 훅(import hook) 이다. 두 가지 종류의 임포트 훅이 있다: 메타 훅(meta hook) 과 임포트 경로 훅(import path hook).
메타 훅은 임포트 처리의 처음에, sys.modules
캐시 조회를 제외한 다른 임포트 처리들이 시작되기 전에 호출된다. 이것은 메타 훅이 sys.path
처리, 프로즌 모듈, 내장 모듈들을 재정의할 수 있게 한다. 다음에 설명하듯이, 메타 훅은 sys.meta_path
에 새 파인더 객체를 추가하는 방법으로 등록할 수 있다.
임포트 경로 훅은 sys.path
(혹은 package.__path__
) 처리 일부로, 관련된 경로 항목을 만나는 시점에 호출된다. 다음에 설명하듯이, 임포트 경로 훅은 sys.path_hooks
에 새 콜러블을 추가하는 방법으로 등록할 수 있다.
5.3.4. 메타 경로(meta path)¶
주어진 이름의 모듈을 sys.modules
에서 찾을 수 없을 때, 파이썬은 sys.meta_path
를 검색하는데, 메타 경로 파인더 객체들의 목록을 포함하고 있다. 이 파인더들이 주어진 이름의 모듈을 처리하는 방법을 알고 있는지 확인하도록 요청한다. 메타 경로 파인더들은 find_spec()
라는 이름의 메서드를 구현해야만 하는데, 세 개의 인자를 받아들인다: 이름, 임포트 경로, (생략 가능한) 타깃(target) 모듈. 메타 경로 파인더는 주어진 이름의 모듈을 처리할 수 있는지를 결정하기 위해 어떤 전략이건 사용할 수 있다.
If the meta path finder knows how to handle the named module, it returns a
spec object. If it cannot handle the named module, it returns None
. If
sys.meta_path
processing reaches the end of its list without returning
a spec, then an ImportError
is raised. Any other exceptions raised
are simply propagated up, aborting the import process.
The find_spec()
method of meta path
finders is called with two or three arguments. The first is the fully
qualified name of the module being imported, for example foo.bar.baz
.
The second argument is the path entries to use for the module search. For
top-level modules, the second argument is None
, but for submodules or
subpackages, the second argument is the value of the parent package’s
__path__
attribute. If the appropriate __path__
attribute cannot
be accessed, an ImportError
is raised. The third argument is an
existing module object that will be the target of loading later. The
import system passes in a target module only during reload.
메타 경로는 한 번의 임포트 요청에 대해 여러 번 탐색 될 수 있다. 예를 들어, 대상 모듈들이 아무것도 캐싱 되지 않았다고 할 때, foo.bar.baz
를 임포트 하려면, 먼저 각 메타 경로 파인더 (mpf
)들에 대해 mpf.find_spec("foo", None, None)
를 호출해서 최상위 임포트를 수행한다. foo
가 임포트 된 후에, 메타 경로를 두 번째 탐색해서 foo.bar
를 임포트 하는데, mpf.find_spec("foo.bar", foo.__path__, None)
를 호출한다. 일단 foo.bar
가 임포트 되면, 마지막 탐색은 mpf.find_spec("foo.bar.baz", foo.bar.__path__, None)
를 호출한다.
어떤 메타 경로 파인더들은 오직 최상위 임포트만 지원한다. 이런 임포터들은 두 번째 인자로 None
이 아닌 것이 오면 항상 None
을 돌려준다.
파이썬의 기본 sys.meta_path
는 세 개의 메타 경로 파인더를 갖고 있다. 하나는 내장 모듈을 임포트하는 법을 알고, 하나는 프로즌 모듈을 임포트하는 법을 알고, 하나는 임포트 경로 에서 모듈을 임포트하는 법을 안다(즉 경로 기반 파인더).
버전 3.4으로 변경: 메타 경로 파인더의 find_spec()
메서드가 이제 디프리케이트된(deprecated) find_module()
을 대체한다. 변경 없이도 동작하기는 하지만, 임포트 절차는 파인더가 find_spec()
을 구현하지 않았을 때만 find_module()
을 사용한다.
5.4. 로딩(loading)¶
모듈 스펙이 발견되면, 임포트 절차는 모듈을 로딩할 때 그것(그것이 가진 로더도)을 사용한다. 여기에 임포트의 로딩 과정 동안 일어나는 일에 대한 대략적인 그림이 있다:
module = None
if spec.loader is not None and hasattr(spec.loader, 'create_module'):
# It is assumed 'exec_module' will also be defined on the loader.
module = spec.loader.create_module(spec)
if module is None:
module = ModuleType(spec.name)
# The import-related module attributes get set here:
_init_module_attrs(spec, module)
if spec.loader is None:
if spec.submodule_search_locations is not None:
# namespace package
sys.modules[spec.name] = module
else:
# unsupported
raise ImportError
elif not hasattr(spec.loader, 'exec_module'):
module = spec.loader.load_module(spec.name)
# Set __loader__ and __package__ if missing.
else:
sys.modules[spec.name] = module
try:
spec.loader.exec_module(module)
except BaseException:
try:
del sys.modules[spec.name]
except KeyError:
pass
raise
return sys.modules[spec.name]
다음과 같은 세부 사항에 주의해야 한다:
- 만약 주어진 이름의 모듈이
sys.modules
에 있다면, 임포트는 이미 그걸 돌려줬다.- 로더가 모듈을 실행하기 전에 모듈은
sys.modules
에 자리를 잡는다. 이것은 필수적인데 모듈이 (직접적 혹은 간접적으로) 자신을 임포트할 수 있기 때문이다; 먼저sys.modules
에 추가함으로써 최악의 상황에 제한 없는 재귀(recursion)를 방지하고, 최선의 상황에 여러 번 로딩되는 것을 막는다.- 로딩이 실패하면, 실패한 모듈(오직 실패한 모듈만)은
sys.modules
에서 삭제된다.sys.modules
캐시에 이미 있는 모듈과 부수적 효과로 성공적으로 로딩된 모듈들은 캐시에 남아있어야만 한다. 이는 실패한 모듈조차sys.modules
에 남아있게 되는 리로딩과 대비된다.- 모듈이 만들어졌지만, 아직 실행되기 전에, 뒤의 섹션 에서 요약되듯이, 임포트 절차는 임포트 관련 모듈 어트리뷰트들을 설정한다(위의 의사 코드 예에서 “_init_module_attrs”).
- 모듈 실행은 로딩에서 모듈의 이름 공간이 채워지는 결정적 순간이다. 실행은 전적으로 로더에 위임되는데, 로더가 어떤 것이 어떻게 채워져야 하는지 결정한다.
- 로딩 동안 만들어지고 exec_module() 로 전달되는 모듈은 임포트의 끝에 반환되는 것이 아닐 수 있다 [2].
버전 3.4으로 변경: 임포트 시스템이 기초 공사에 대한 로더의 책임을 들고 갔다. 이것들은 전에는 importlib.abc.Loader.load_module()
메서드에서 수행되었다.
5.4.1. 로더¶
모듈 로더는 로딩의 결정적인 기능을 제공한다: 모듈 실행. 임포트 절차는 하나의 인자로 importlib.abc.Loader.exec_module()
메서드를 호출하는데, 실행할 모듈 객체가 전달된다. exec_module()
이 돌려주는 값은 무시된다.
로더는 다음과 같은 요구 조건들을 만족해야 한다:
- 만약 모듈이 파이썬 모듈(내장 모듈이나 동적으로 로딩되는 확장이 아니라)이면, 로더는 모듈의 코드를 모듈의 전역 이름 공간(
module.__dict__
)에서 실행해야 한다.- 만약 로더가 모듈을 실행하지 못하면,
ImportError
를 일으켜야 한다. 하지만exec_module()
동안 발생하는 다른 예외도 전파된다.
많은 경우에, 파인더와 로더는 같은 객체다; 그런 경우 find_spec()
메서드는 로더가 self
로 설정된 스펙을 돌려준다.
모듈 로더는 create_module()
메서드를 구현함으로써 로딩하는 동안 모듈 객체를 만드는 일에 개입할 수 있다. 하나의 인자, 모듈 스펙, 을 받아들이고 로딩 중 사용할 모듈 객체를 돌려준다. create_module()
은 모듈 객체의 어트리뷰트를 설정할 필요는 없다. 만약 메서드가 None
을 돌려주면, 임포트 절차는 새 모듈을 스스로 만든다.
버전 3.4에 추가: 로더의 create_module()
메서드.
버전 3.4으로 변경: load_module()
메서드는 exec_module()
로 대체되었고, 임포트 절차가 로딩의 공통 코드(boilerplate)에 대한 책임을 진다.
이미 존재하는 로더들과의 호환을 위해, 임포트 절차는 load_module()
메서드가 존재하고, exec_module()
을 구현하지 않았으면 load_module()
을 사용한다. 하지만 load_module()
은 디프리케이트되었다. 로더는 대신 exec_module()
를 구현해야 한다.
load_module()
메서드는 모듈을 실행하는 것 외에 위에서 언급한 모든 공통(boilerplate) 로딩 기능을 구현해야만 한다. 같은 제약들이 모두 적용되는데, 추가적인 설명을 붙여보면:
- 만약
sys.modules
에 주어진 이름의 모듈 객체가 이미 존재하면, 로더는 반드시 그 객체를 사용해야 한다. (그렇지 않으면,importlib.reload()
이 올바로 동작하지 않게 된다.) 만약sys.modules
에 주어진 이름의 모듈이 없으면, 로더는 새 모듈객체를 만들고sys.modules
에 추가해야 한다.- 제한 없는 재귀와 여러 번 로딩되는 것을 방지하기 위해, 로더가 모듈 코드를 실행하기 전에 모듈이
sys.modules
에 존재해야 한다.- 만약 로딩이 실패하면, 로더는
sys.modules
에 삽입한 모듈들을 제거해야 하는데, 실패한 모듈만을 제거해야 하고, 로더가 그 모듈을 직접 명시적으로 로드한 경우에만 그래야 한다.
버전 3.5으로 변경: A DeprecationWarning
is raised when exec_module()
is defined but
create_module()
is not. Starting in Python 3.6 it will be an error to not
define create_module()
on a loader attached to a ModuleSpec.
5.4.2. 서브 모듈¶
어떤 메커니즘으로든 (예를 들어, importlib
API들, import
나 import-from
문, 내장 __import__()
) 서브 모듈이 로드될 때, 서브 모듈 객체로의 연결은 부모 모듈의 이름 공간에 이루어진다. 예를 들어, 패키지 spam
이 서브 모듈 foo
를 가지면, spam.foo
를 임포트한 후에는 spam
이 서브 모듈에 연결된 어트리뷰트 foo
를 갖게 된다. 다음과 같은 디렉터리 구조로 되어 있다고 하자:
spam/
__init__.py
foo.py
bar.py
그리고 spam/__init__.py
가 다음과 같은 줄들을 포함한다고 하자:
from .foo import Foo
from .bar import Bar
그러면 다음과 같이 실행하면 spam
모듈에 foo
와 bar
에 대한 이름 연결이 일어난다.
>>> import spam
>>> spam.foo
<module 'spam.foo' from '/tmp/imports/spam/foo.py'>
>>> spam.bar
<module 'spam.bar' from '/tmp/imports/spam/bar.py'>
파이썬의 익숙한 이름 연결 규칙에서 볼 때 의외의 결과로 보일 수 있다. 하지만 실제로는 임포트 시스템의 근본적인 기능이다. 불변의 규칙은 이렇다: 만약 sys.modules['spam']
과 sys.modules['spam.foo']
가 있다면 (위의 임포트 이후의 상태가 그러하다), 뒤에 있는 것은 반드시 앞에 있는 것의 foo
어트리뷰트가 되어야 한다.
5.4.3. 모듈 스펙¶
임포트 절차는 임포트 동안 각 모듈에 대한 다양한 정보들을 사용한다, 특히 로딩 전에. 대부분 정보는 모든 모듈의 공통이다. 모듈 스펙의 목적은 이 임포트 관련 정보를 모듈별로 요약하는 것이다.
임포트 동안 스펙을 사용하면 상태가 임포트 시스템의 구성 요소들로 전달될 수 있다, 예를 들어 모듈 스펙을 만드는 파인더와 그것을 실행하는 로더 간에. 가장 중요한 것은, 임포트 절차가 로딩의 공통 연산(boilerplate operation)을 수행할 수 있도록 하는 것이다. 모듈 스펙이 없다면 로더가 모든 책임을 지게 된다.
See ModuleSpec
for more specifics on what
information a module’s spec may hold.
버전 3.4에 추가.
5.4.5. module.__path__¶
By definition, if a module has an __path__
attribute, it is a package,
regardless of its value.
패키지의 __path__
어트리뷰트는 서브 패키지를 로딩할 때 사용한다. 임포트 절차 내에서, 임포트하는 동안 모듈을 검색할 위치들의 목록을 제공한다는 점에서 sys.path
와 같은 기능을 갖는다. 하지만 __path__
는 보통 sys.path
보다 제약 조건이 많다.
__path__
는 문자열의 이터러블이지만, 비어있을 수 있다. sys.path
과 같은 규칙이 패키지의 __path__
에도 적용되고, 패키지의 __path__
를 탐색하는 동안 sys.path_hooks
(아래에서 설명한다)에게 의견을 묻는다.
패키지의 __init__.py
파일은 패키지의 __path__
어트리뷰트를 설정하거나 변경할 수 있고, 이것이 PEP 420 이전에 이름 공간 패키지를 구현하는 방법으로 사용됐다. PEP 420 의 도입으로 인해, 이름 공간 패키지가 __path__
조작 코드만을 포함하는 __init__.py
파일을 제공할 필요가 없어졌다; 임포트 절차가 자동으로 이름 공간 패키지를 위한 __path__
를 설정한다.
5.4.6. 모듈 repr¶
기본적으로, 모든 모듈은 사용할만한 repr 을 갖고 있다. 하지만 위의 어트리뷰트들과 모듈 스펙에 있는 것들에 따라, 모듈 객체의 repr 을 좀 더 명시적으로 제어할 수 있다.
모듈이 스펙(__spec__
)을 가지면, 임포트 절차는 그것으로부터 repr 을 만들려고 시도한다. 그것이 실패하거나 스펙이 없으면, 임포트 시스템은 모듈에서 제공되는 것들로 기본 repr 을 구성한다. module.__name__
, module.__file__
, module.__loader__
을 repr 의 입력으로 사용하려고 시도하는데, 빠진 정보는 기본값으로 채운다.
사용되고 있는 정확한 규칙은 이렇다:
- 모듈이
__spec__
어트리뷰트를 가지면, 스펙에 있는 정보로 repr 을 생성한다. “name”, “loader”, “origin”, “has_location” 어트리뷰트들이 사용된다.- 모듈이
__file__
어트리뷰트를 가지면, 모듈의 repr 의 일부로 사용된다.- 모듈이
__file__
어트리뷰트를 갖지 않지만None
이 아닌__loader__
를 가지면, 로더의 repr 이 모듈의 repr 의 일부로 사용된다.- 그렇지 않으면, repr 에 모듈의
__name__
을 사용한다.
버전 3.4으로 변경: loader.module_repr()
의 사용이 디프리케이트 되었고 이제 모듈 repr 를 만드는데 임포트 절차에 의해 모듈 스펙이 사용된다.
파이썬 3.3과의 과거 호환성을 위해, 위에서 설명한 방법들을 시도하기 전에, 만약 정의되어 있으면, 로더의 module_repr()
메서드를 호출해서 모듈 repr 을 만든다. 하지만, 그 메서드는 디프리케이트 되었다.
5.5. 경로 기반 파인더¶
앞에서 언급했듯이, 파이썬은 여러 기본 메타 경로 파인더들을 갖고 있다. 이 중 하나는, 경로 기반 파인더 (PathFinder
) 라고 불리는데, 경로 엔트리 들의 목록을 담고 있는 임포트 경로 를 검색한다. 각 경로 엔트리는 모듈을 찾을 곳을 가리킨다.
경로 기반 파인더 자신은 뭔가를 임포트하는 법에 대해서는 아는 것이 없다. 대신에, 각 경로 엔트리를 탐색하면서, 각각을 구체적인 경로 엔트리를 다루는 법을 아는 경로 엔트리 파인더와 관련시킨다.
경로 엔트리 파인더의 기본 집합은 파일 시스템에서 모듈을 찾는데 필요한 모든 개념을 구현하는데, 파이썬 소스 코드(.py
파일들), 파이썬 바이트 코드(.pyc
파일들), 공유 라이브러리(예를 들어 .so
파일들)와 같은 특수 파일형들을 처리한다. 표준라이브러리의 zipimport
모듈의 지원을 받으면, 기본 경로 엔트리 파인더는 이 모든 파일들(공유 라이브러리를 제외한 것들)을 zip 파일들로부터 로딩한다.
경로 엔트리가 파일 시스템의 위치로 제한될 필요는 없다. URL이나 데이터베이스 조회나 문자열로 지정될 수 있는 어떤 위치도 가능하다.
경로 기반 파인더는 검색 가능한 경로 엔트리의 유형을 확장하고 커스터마이즈할 수 있도록 하는 추가의 훅과 프로토콜을 제공한다. 예를 들어, 네트워크 URL을 경로 엔트리로 지원하고 싶다면, 웹에서 모듈을 찾는 HTTP 개념을 구현하는 훅을 작성할 수 있다. 이 훅 (콜러블)은 아래에서 설명하는 프로토콜을 지원하는 경로 엔트리 파인더 를 돌려주는데, 웹에 있는 모듈을 위한 로더를 얻는 데 사용된다.
경고의 글: 이 섹션과 앞에 나온 것들은 모두 파인더라는 용어를 사용하는데, 메타 경로 파인더 와 경로 엔트리 파인더 라는 용어를 사용해서 구분한다. 이 두 종류의 파인더는 매우 유사해서 비슷한 프로토콜을 지원하고 임포트 절차에서 비슷한 방식으로 기능한다. 하지만 이것들이 미묘하게 다르다는 것을 기억하는 것이 중요하다. 특히, 메타 경로 파인더는 임포트 절차의 처음에 개입하는데, sys.meta_path
탐색을 통해 들어온다.
반면에, 경로 엔트리 파인더는 경로 기반 파인더의 구현 상세인데, 사실 경로 기반 파인더가 sys.meta_path
로 부터 제거되면, 경로 엔트리 파인더의 개념은 일절 호출되지 않는다.
5.5.1. 경로 엔트리 파인더¶
경로 기반 파인더 는 위치가 문자열 경로 엔트리 로 지정된 파이썬 모듈과 패키지를 찾고 로드하는 책임을 진다. 대부분의 경로 엔트리는 파일 시스템의 위치를 가리키지만, 이것으로 한정될 필요는 없다.
메타 경로 파인더로서, 경로 기반 파인더 는 앞에서 설명한 find_spec()
프로토콜을 구현한다. 하지만 모듈이 임포트 경로 에서 어떻게 발견되고 로드되는지는 커스터마이즈하는데 사용될 수 있는 추가의 훅을 제공한다.
경로 기반 파인더 는 세 개의 변수를 사용한다, sys.path
, sys.path_hooks
, sys.path_importer_cache
. 패키지 객체의 __path__
어트리뷰트 또한 사용된다. 이것들은 임포트 절차를 커스터마이즈할 수 있는 추가의 방법을 제공한다.
sys.path
는 모듈과 패키지의 검색 위치를 제공하는 문자열의 목록을 포함한다. PYTHONPATH
환경 변수와 여러 가지 설치와 구현 특정 기본값들로부터 초기화된다. sys.path
에 있는 엔트리들은 파일 시스템의 디렉터리와 zip 파일을 가리키고, 그밖에 잠재적으로 모듈 검색에 사용될 수 있는 《장소들》(site
모듈을 보라)을 가리킬 수 있는데, URL이나 데이터베이스 조회 같은 것들이다. sys.path
에는 문자열과 바이트열만 있어야 한다; 다른 모든 형은 무시된다. 바이트열의 인코딩은 개별 경로 엔트리 파인더 들에 의해 결정된다.
경로 기반 파인더 는 메타 경로 파인더 이기 때문에, 앞에서 설명했듯이 임포트 절차는 경로 기반 파인더의 find_spec()
메서드를 호출하는 것으로 임포트 경로 검색을 시작한다. find_spec()
에 제공되는 path
인자는 탐색할 문자열 경로들의 리스트다 - 보통 패키지 내에서 임포트할 경우 패키지의 __path__
어트리뷰트. path
인자가 None
이면, 최상위 임포트를 뜻하고 sys.path
가 사용된다.
경로 기반 파인더는 검색 경로의 모든 엔트리를 탐색하고, 개별 엔트리마다 적절한 경로 엔트리 파인더 (PathEntryFinder
)를 찾는다. 이것은 비용이 많이 드는 연산일 수 있기 때문에(예를 들어, 이 검색을 위해 stat() 호출로 인한 부하가 있을 수 있다), 경로 기반 파인더는 경로 엔트리를 경로 엔트리 파인더로 매핑하는 캐시를 관리한다. 이 캐시는 sys.path_importer_cache
에 유지된다 (이름에도 불구하고, 이 캐시는 임포터 객체로 제한되지 않고 실제로는 파인더 객체를 저장한다). 이런 방법으로, 특정 경로 엔트리 위치의 경로 엔트리 파인더 의 비싼 검색은 오직 한 번만 수행된다. 사용자 코드가 sys.path_importer_cache
의 캐시 엔트리를 삭제해서 경로 기반 파인더가 그 경로 엔트리를 다시 검색하도록 하는 것이 허락된다 [3].
경로 엔트리가 캐시에 없으면, 경로 기반 파인더는 sys.path_hooks
에 있는 모든 콜러블들을 탐색한다. 이 목록의 각 경로 엔트리 훅 은 검색할 경로 엔트리 인자 한 개를 사용해서 호출된다. 이 콜러블은 경로 엔트리를 다룰 수 있는 경로 엔트리 파인더 를 돌려주거나, ImportError
를 발생시킬 수 있다. ImportError
는 경로 기반 파인더가 어떤 훅이 주어진 경로 엔트리 를 위한 경로 엔트리 파인더 를 발견할 수 없음을 알리는 데 사용한다. 이 예외는 무시되고 임포트 경로 탐색은 계속된다. 훅은 문자열이나 바이트열을 기대해야 한다; 바이트열의 인코딩은 훅이 결정하고(예를 들어, 파일 시스템 인코딩이나 UTF-8 이나 그 밖의 다른 것일 수 있다), 만약 훅이 인자를 디코딩할 수 없으면 ImportError
를 일으켜야 한다.
만약 sys.path_hooks
탐색이 아무런 경로 엔트리 파인더 를 돌려주지 못하면, 경로 기반 파인더의 find_spec()
메서드는 sys.path_importer_cache
에 None
을 저장하고(이 경로 엔트리를 위한 파인더가 없음을 가리키기 위해), None
을 돌려줘서 이 메타 경로 파인더 가 모듈을 찾을 수 없음을 알린다.
만약 sys.path_hooks
에 있는 어느 하나의 경로 엔트리 훅 콜러블이 경로 엔트리 파인더 를 돌려주면, 파인더에 모듈 스펙을 요청하기 위해 다음에 나오는 프로토콜이 사용된다. 모듈 스펙은 모듈을 로딩할 때 사용된다.
현재 작업 디렉터리(current working directory) – 빈 문자열로 표현된다 – 는 sys.path
에 있는 다른 엔트리들과 약간 다르게 취급된다. 첫째로, 현재 작업 디렉터리가 존재하지 않음이 발견되면 sys.path_importer_cache
에는 아무런 값도 저장되지 않는다. 둘째로, 현재 작업 디렉터리는 각 모듈 조회 때마다 다시 확인된다. 셋째로, sys.path_importer_cache
에 사용되는 경로와 importlib.machinery.PathFinder.find_spec()
가 돌려주는 경로는 빈 문자열이 아니라 실제 현재 작업 디렉터리가 된다.
5.5.2. 경로 엔트리 파인더 프로토콜¶
모듈과 초기화된 패키지의 임포트를 지원하고 이름 공간 패키지에 포션으로 이바지하기 위해, 경로 엔트리 파인더는 find_spec()
메서드를 구현해야 한다.
find_spec()
은 두 개의 인자를 받아들인다, 임포트할 모듈의 완전히 정규화된 이름과 (생략 가능한) 타깃 모듈. find_spec()
은 값이 완전히 채워진 모듈의 스펙을 돌려준다. 이 스펙은 항상 《loader》 가 설정된다(한가지 예외가 있다).
스펙이 이름 공간의 포션 을 표현한다는 것을 임포트 절차에 알리기 위해, 경로 엔트리 파인더는 스펙의 《loader》 를 None
으로 설정하고 《submodule_search_locations》 를 포션을 포함하는 목록으로 설정한다.
버전 3.4으로 변경: find_spec()
이 find_loader()
와 find_module()
를 대체하는데, 둘 다 이제 디프리케이트되었다, find_spec()
이 정의되지 않으면 이것들을 사용한다.
예전의 경로 엔트리 파인더는 find_spec()
대신에 이 두 개의 디프리케이트된 메서드들을 구현할 수 있다. 이 메서드들은 과거 호환성 때문에 아직도 사용된다. 하지만, find_spec()
이 경로 엔트리 파인더에 구현되면, 예전 메서드들은 무시된다.
find_loader()
는 하나의 인자를 받아들인다, 임포트되는 모듈의 완전히 정규화된 이름. find_loader()
는 2-튜플을 돌려주는데, 첫 번째 항목은 로더이고 두 번째 항목은 이름 공간 포션 이다. 첫 번째 항목(즉 로더)이 None
이면, 경로 엔트리 파인더가 주어진 이름의 모듈에 대한 로더를 제공하지는 못하지만, 경로 엔트리가 주어진 이름의 모듈에 대한 이름 공간 포션에 이바지함을 안다는 뜻이다. 이것은 거의 항상, 파이썬이 파일 시스템에 물리적으로 존재하지 않는 이름 공간 패키지를 임포트하도록 요구되는 경우다. 경로 엔트리 파인더가 로더로 None
을 돌려줄 때, 2-튜플의 두 번째 항목은 시퀀스여야 하는데 비어있을 수도 있다.
find_loader()
가 None
이 아닌 로더 값을 돌려주면, 그 포션은 무시되고 경로 기반 파인더가 로더를 돌려주며 경로 엔트리 검색을 종료한다.
임포트 프로토콜의 다른 구현들과의 과거 호환성을 위해, 많은 경로 엔트리 파인더들은 메타 경로 파인더가 지원하는 것과 같고 전통적인 find_module()
메서드 또한 지원한다. 하지만 경로 엔트리 파인더 find_module()
메서드는 결코 path
인자로 호출되지 않는다 (그것들은 경로 훅의 최초 호출 때 적절한 경로 정보를 기록해둘 것으로 기대된다).
경로 엔트리 파인더의 find_module()
메서드는 경로 엔트리 파인더가 이름 공간 패키지에 포션으로 이바지하는 것을 허락하지 않기 때문에 디프리케이트 되었다. 만약 경로 엔트리 파인더에 find_loader()
와 find_module()
이 모두 존재하면, 임포트 시스템은 항상 find_module()
대신 find_loader()
를 호출한다.
5.6. 표준 임포트 시스템 교체하기¶
임포트 시스템 전체를 교체하기 위한 가장 신뢰성 있는 메커니즘은 sys.meta_path
의 기본값들을 모두 삭제하고, 새로 만든 메타 경로 훅들로 채우는 것이다.
만약 임포트 시스템을 액세스하는 다른 API들에 영향을 주지 않고, 단지 임포트 문의 동작만을 변경해도 좋다면, 내장 __import__()
함수를 교체하는 것으로 충분할 수도 있다. 이 기법은 특정 모듈 내에서의 임포트 문의 동작만을 변경하도록 모듈 수준에서 적용될 수도 있다.
To selectively prevent import of some modules from a hook early on the
meta path (rather than disabling the standard import system entirely),
it is sufficient to raise ImportError
directly from
find_spec()
instead of returning
None
. The latter indicates that the meta path search should continue,
while raising an exception terminates it immediately.
5.7. __main__ 에 대한 특별한 고려¶
__main__
모듈은 파이썬의 임포트 시스템에서 특별한 경우다. 다른 곳에서 언급했듯이, __main__
모듈은 sys
와 builtins
처럼 인터프리터 시작 때 직접 초기화된다. 하지만, 이 두 개와는 다르게, 이것은 엄밀하게 내장 모듈로 취급되지 않는다. 이것은 __main__
이 초기화되는 방식이 인터프리터를 실행할 때 주는 플래그와 다른 옵션들에 영향을 받기 때문이다.
5.7.1. __main__.__spec__¶
__main__
이 어떻게 초기화되는지에 따라, __main__.__spec__
은 적절히 설정되기도 하고 None
으로 설정되기도 한다.
파이썬이 -m
옵션으로 시작하면, __spec__
은 해당하는 모듈이나 패키지의 모듈 스팩으로 설정된다. 또한 __spec__
은 __main__
모듈이 디렉터리나 zip 파일이나 다른 sys.path
엔트리를 실행하는 일부로 로드될 때 그 내용이 채워진다.
나머지 경우 에는 __main__.__spec__
은 None
으로 설정되는데, __main__
을 채우는데 사용된 코드가 임포트 가능한 모듈에 직접 대응하지 않기 때문이다:
- 대화형 프롬프트
- -c 스위치
- 표준 입력으로 실행
- 소스 파일이나 바이트 코드 파일로부터 직접 실행
마지막 경우에 __main__.__spec__
이 항상 None
임에 주의해야 한다. 설사 그 파일이 기술적으로 모듈로 임포트 될 수 있어도 그렇다. __main__
에 올바른 모듈 메타데이터가 필요하다면 -m
스위치를 사용해야 한다.
또한 __main__
이 임포트 가능한 모듈에 대응되고, __main__.__spec__
이 적절히 설정되었다 하더라도, 이 둘은 여전히 다른 모듈로 취급됨에 주의해야 한다. 이것은 if __name__ == "__main__":
검사로 둘러싸인 블록이 모듈이 __main__
이름 공간을 채울 때만 실행되고, 일반적인 임포트 때는 실행되지 않는다는 사실 때문이다.
5.8. 열린 이슈들¶
XXX 도표가 있으면 정말 좋겠다.
XXX * (import_machinery.rst) 모듈과 패키지의 어트리뷰트들에만 할당된 섹션은 어떨까? 아마도 데이터 모델 레퍼런스 페이지에 있는 관련 항목들을 확장하거나 대체해야 할 것이다.
XXX 라이브러리 설명서의 runpy, pkgutil 등등은 새 임포트 시스템 섹션으로 가는 《See Also》 링크를 처음에 붙여야만 한다.
XXX __main__
이 초기화되는 다른 방법들에 대한 설명을 더 붙여야 하나?
XXX __main__
의 까다로움/어려움에 대한 정보를 추가하자 (즉 PEP 395 의 사본)
5.9. 참고문헌¶
The import machinery has evolved considerably since Python’s early days. The original specification for packages is still available to read, although some details have changed since the writing of that document.
sys.meta_path
의 최초 규격은 PEP 302 이고, 뒤이은 확장은 PEP 420 이다.
PEP 420 은 파이썬 3.3 에 이름 공간 패키지 를 도입했다. PEP 420은 find_module()
의 대안으로 find_loader()
프로토콜 역시 도입했다.
PEP 366 은 메인 모듈에서의 명시적인 상태 임포트를 위한 __package__
어트리뷰트의 추가에 관해 설명하고 있다.
PEP 328 은 절대와 명시적인 상대 임포트들 도입하고 PEP 366 이 결국 __package__
를 지정하게 되는 개념을 초기에 __name__
으로 제안했다.
PEP 338 은 모듈을 스크립트로 실행하는 것을 정의한다.
PEP 451 은 스팩 객체에 모듈별 임포트 상태를 요약하는 것을 추가한다. 로더들에 주어졌던 대부분의 공통 코드 책임들을 임포트 절차로 옮기기도 했다. 이 변경은 임포트 시스템의 여러 API 들을 디프리케이트하도록 만들었고, 파인더와 로더에 새 메서드들을 추가하기도 했다.
각주
[1] | types.ModuleType 을 보라. |
[2] | importlib 구현은 반환 값을 직접 사용하지 않는다. 대신에, sys.modules 에서 모듈 이름을 조회해서 모듈을 얻는다. 이것의 간접적인 효과는 임포트되는 모듈이 sys.modules 에 있는 자신을 바꿀 수 있다는 것이다. 이것은 구현 상세 동작이고 다른 파이썬 구현에서 동작한다고 보장되지 않는다. |
[3] | 예전 코드에서, sys.path_importer_cache 에서 imp.NullImporter 의 인스턴스를 찾는 것이 가능하다. 코드가 대신 None 을 사용하도록 변경할 것을 권고한다. 더 자세한 내용은 Porting Python code 를 참고하라. |