메모리 관리

개요

파이썬의 메모리 관리에는 모든 파이썬 객체와 데이터 구조를 포함하는 비공개 힙(private heap)을 수반합니다. 이 비공개 힙의 관리는 파이썬 메모리 관리자에 의해 내부적으로 이루어집니다. 파이썬 메모리 관리자는 공유, 세그먼트 화, 사전 할당 또는 캐싱과 같은 동적 스토리지 관리의 다양한 측면을 처리하는 서로 다른 구성 요소를 가지고 있습니다.

가장 낮은 수준에서, 원시 메모리 할당자는 운영 체제의 메모리 관리자와 상호 작용하여 비공개 힙에 모든 파이썬 관련 데이터를 저장하기에 충분한 공간이 있는지 확인합니다. 원시 메모리 할당자 위에, 여러 개의 객체별 할당자가 같은 힙에서 작동하며 각 객체 형의 특성에 맞는 고유한 메모리 관리 정책을 구현합니다. 예를 들어, 정수는 다른 스토리지 요구 사항과 속도/공간 절충을 의미하므로, 정수 객체는 힙 내에서 문자열, 튜플 또는 딕셔너리와는 다르게 관리됩니다. 따라서 파이썬 메모리 관리자는 일부 작업을 객체별 할당자에게 위임하지만, 후자가 비공개 힙의 경계 내에서 작동하도록 합니다.

파이썬 힙의 관리는 인터프리터 자체에 의해 수행되며, 사용자는 힙 내부의 메모리 블록에 대한 객체 포인터를 규칙적으로 조작하더라도, 사용자가 제어할 수 없다는 것을 이해하는 것이 중요합니다. 파이썬 객체와 기타 내부 버퍼를 위한 힙 공간 할당은 이 설명서에 나열된 파이썬/C API 함수를 통해 파이썬 메모리 관리자의 요청에 따라 수행됩니다.

메모리 손상을 피하고자, 확장 작성자는 C 라이브러리에서 내보낸 함수를 파이썬 객체에 대해 실행하지 않아야 합니다: malloc(), calloc(), realloc()free(). 그렇게 한다면, 서로 다른 알고리즘을 구현하고 다른 힘에 작동하기 때문에, C 할당자와 파이썬 메모리 관리자 간에 혼합 호출이 발생하여 치명적인 결과를 초래합니다. 그러나, 다음 예제와 같이 개별 목적으로 C 라이브러리 할당자를 사용하여 메모리 블록을 안전하게 할당하고 해제할 수 있습니다:

PyObject *res;
char *buf = (char *) malloc(BUFSIZ); /* for I/O */

if (buf == NULL)
    return PyErr_NoMemory();
...Do some I/O operation involving buf...
res = PyBytes_FromString(buf);
free(buf); /* malloc'ed */
return res;

이 예에서, I/O 버퍼에 대한 메모리 요청은 C 라이브러리 할당자에 의해 처리됩니다. 파이썬 메모리 관리자는 결과로 반환되는 바이트열 객체의 할당에만 관여합니다.

그러나 대부분의 경우, 파이썬 힙에서 메모리를 할당하는 것이 좋습니다. 파이썬 힙은 파이썬 메모리 관리자가 제어하기 때문입니다. 예를 들어, 인터프리터가 C로 작성된 새로운 객체 형으로 확장될 때 필요합니다. 파이썬 힙을 사용하는 또 다른 이유는 확장 모듈의 메모리 요구에 대해 파이썬 메모리 관리자에게 알리고자 하는 것입니다. 요청된 메모리가 내부적이고 매우 특정한 목적으로만 사용될 때도, 모든 메모리 요청을 파이썬 메모리 관리자에 위임하면 인터프리터가 전체 메모리 요구량에 대한 더 정확한 이미지를 갖게 됩니다. 결과적으로, 특정 상황에서, 파이썬 메모리 관리자는 가비지 수집, 메모리 압축 또는 기타 예방 절차와 같은 적절한 작업을 트리거 하거나 그러지 않을 수 있습니다. 앞의 예에서와같이 C 라이브러리 할당자를 사용하면, I/O 버퍼에 할당된 메모리가 파이썬 메모리 관리자를 완전히 우회하게 됨에 유의하십시오.

더 보기

PYTHONMALLOC 환경 변수를 사용하여 파이썬에서 사용하는 메모리 할당자를 구성할 수 있습니다.

PYTHONMALLOCSTATS 환경 변수는 새로운 pymalloc 객체 아레나(arena)가 만들어질 때마다 그리고 종료 시 pymalloc 메모리 할당자의 통계를 인쇄하는 데 사용될 수 있습니다.

원시 메모리 인터페이스

다음 함수 집합은 시스템 할당자에 대한 래퍼입니다. 이러한 함수는 스레드 안전해서, GIL을 유지할 필요는 없습니다.

기본 원시 메모리 할당자는 다음 함수를 사용합니다: malloc(), calloc(), realloc()free(); 0바이트를 요청할 때 malloc(1)(또는 calloc(1, 1))을 호출합니다.

버전 3.4에 추가.

void* PyMem_RawMalloc(size_t n)

n 바이트를 할당하고 할당된 메모리를 가리키는 void* 형의 포인터를 반환하거나, 요청이 실패하면 NULL을 반환합니다.

0바이트를 요청하면 가능하면 PyMem_RawMalloc(1)이 대신 호출된 것처럼 가능하면 고유한 NULL이 아닌 포인터를 반환합니다. 메모리는 어떤 식으로든 초기화되지 않습니다.

void* PyMem_RawCalloc(size_t nelem, size_t elsize)

크기가 각각 elsize 바이트인 nelem 개의 요소를 할당하고 할당된 메모리를 가리키는 void* 형의 포인터를 반환하거나, 요청이 실패하면 NULL을 반환합니다. 메모리는 0으로 초기화됩니다.

0개의 요소나 0바이트 크기의 요소를 요청하면 PyMem_RawCalloc(1, 1)이 대신 호출된 것처럼 가능하면 고유한 NULL이 아닌 포인터를 반환합니다.

버전 3.5에 추가.

void* PyMem_RawRealloc(void *p, size_t n)

p가 가리키는 메모리 블록의 크기를 n 바이트로 조정합니다. 내용은 이전과 새로운 크기의 최솟값 내에서는 변경되지 않습니다.

pNULL이면, 호출은 PyMem_RawMalloc(n)과 동등합니다; n이 0과 같으면, 메모리 블록의 크기는 조정되지만 해제되지는 않고, 반환된 포인터는 NULL이 아닙니다.

pNULL이 아닌 한, PyMem_RawMalloc(), PyMem_RawRealloc() 또는 PyMem_RawCalloc()에 대한 이전 호출에 의해 반환된 것이어야 합니다.

요청이 실패하면, PyMem_RawRealloc()NULL을 반환하고 p는 이전 메모리 영역에 대한 유효한 포인터로 유지됩니다.

void PyMem_RawFree(void *p)

p가 가리키는 메모리 블록을 해제합니다. pPyMem_RawMalloc(), PyMem_RawRealloc() 또는 PyMem_RawCalloc()에 대한 이전 호출로 반환된 것이어야 합니다. 그렇지 않거나 PyMem_RawFree(p)가 앞서 호출되었으면, 정의되지 않은 동작이 일어납니다.

pNULL이면, 아무 작업도 수행되지 않습니다.

메모리 인터페이스

ANSI C 표준에 따라 모델링 되었지만 0바이트를 요청할 때의 동작을 지정한 다음 함수 집합은 파이썬 힙에서 메모리를 할당하고 해제하는 데 사용할 수 있습니다.

기본 메모리 할당자pymalloc 메모리 할당자를 사용합니다.

경고

이 함수를 사용할 때는 GIL을 유지해야 합니다.

버전 3.6에서 변경: 기본 할당자는 이제 시스템 malloc() 대신 pymalloc 입니다.

void* PyMem_Malloc(size_t n)

n 바이트를 할당하고 할당된 메모리를 가리키는 void* 형의 포인터를 반환하거나, 요청이 실패하면 NULL을 반환합니다.

0바이트를 요청하면 PyMem_Malloc(1)이 대신 호출된 것처럼 가능하면 고유한 NULL이 아닌 포인터를 반환합니다. 메모리는 어떤 식으로든 초기화되지 않습니다.

void* PyMem_Calloc(size_t nelem, size_t elsize)

크기가 각각 elsize 바이트인 nelem 개의 요소를 할당하고 할당된 메모리를 가리키는 void* 형의 포인터를 반환하거나, 요청이 실패하면 NULL을 반환합니다. 메모리는 0으로 초기화됩니다.

0개의 요소나 0바이트 크기의 요소를 요청하면 PyMem_Calloc(1, 1)이 대신 호출된 것처럼 가능하면 고유한 NULL이 아닌 포인터를 반환합니다.

버전 3.5에 추가.

void* PyMem_Realloc(void *p, size_t n)

p가 가리키는 메모리 블록의 크기를 n 바이트로 조정합니다. 내용은 이전과 새로운 크기의 최솟값 내에서는 변경되지 않습니다.

pNULL이면, 호출은 PyMem_Malloc(n)과 동등합니다; 그렇지 않고 n이 0과 같으면, 메모리 블록의 크기는 조정되지만 해제되지는 않으며, 반환된 포인터는 NULL이 아닙니다.

pNULL이 아닌 한, PyMem_Malloc(), PyMem_Realloc() 또는 PyMem_Calloc()에 대한 이전 호출이 반환한 것이어야 합니다.

요청이 실패하면, PyMem_Realloc()NULL을 반환하고 p는 이전 메모리 영역에 대한 유효한 포인터로 유지됩니다.

void PyMem_Free(void *p)

p가 가리키는 메모리 블록을 해제합니다. pPyMem_Malloc(), PyMem_Realloc() 또는 PyMem_Calloc()에 대한 이전 호출이 반환한 것이어야 합니다. 그렇지 않거나 PyMem_Free(p)가 앞서 호출되었으면 정의되지 않은 동작이 일어납니다.

pNULL이면, 아무 작업도 수행되지 않습니다.

편의를 위해 다음과 같은 형 지향 매크로가 제공됩니다. TYPE이 모든 C형을 나타냄에 유의하십시오.

TYPE* PyMem_New(TYPE, size_t n)

PyMem_Malloc()과 같지만, (n * sizeof(TYPE)) 바이트의 메모리를 할당합니다. TYPE*로 캐스트 된 포인터를 반환합니다. 메모리는 어떤 식으로든 초기화되지 않습니다.

TYPE* PyMem_Resize(void *p, TYPE, size_t n)

PyMem_Realloc()과 같지만, 메모리 블록의 크기는 (n * sizeof(TYPE)) 바이트로 조정됩니다. TYPE*로 캐스트 된 포인터를 반환합니다. 반환한 후에, p는 새로운 메모리 영역에 대한 포인터이거나, 실패하면 NULL이 됩니다.

이것은 C 전처리기 매크로입니다; p는 항상 다시 대입됩니다. 에러를 처리할 때 메모리 손실을 피하려면 p의 원래 값을 보관하십시오.

void PyMem_Del(void *p)

PyMem_Free()와 같습니다.

또한, 위에 나열된 C API 함수를 사용하지 않고, 파이썬 메모리 할당자를 직접 호출하기 위해 다음 매크로 집합이 제공됩니다. 그러나, 이들을 사용하면 파이썬 버전을 가로지르는 바이너리 호환성이 유지되지 않아서 확장 모듈에서는 폐지되었습니다.

  • PyMem_MALLOC(size)

  • PyMem_NEW(type, size)

  • PyMem_REALLOC(ptr, size)

  • PyMem_RESIZE(ptr, type, size)

  • PyMem_FREE(ptr)

  • PyMem_DEL(ptr)

객체 할당자

ANSI C 표준에 따라 모델링 되었지만 0바이트를 요청할 때의 동작을 지정한 다음 함수 집합은 파이썬 힙에서 메모리를 할당하고 해제하는 데 사용할 수 있습니다.

기본 객체 할당자pymalloc 메모리 할당자를 사용합니다.

경고

이 함수를 사용할 때는 GIL을 유지해야 합니다.

void* PyObject_Malloc(size_t n)

n 바이트를 할당하고 할당된 메모리를 가리키는 void* 형의 포인터를 반환하거나, 요청이 실패하면 NULL을 반환합니다.

0바이트를 요청하면 PyObject_Malloc(1)이 대신 호출된 것처럼 가능하면 고유한 NULL이 아닌 포인터를 반환합니다. 메모리는 어떤 식으로든 초기화되지 않습니다.

void* PyObject_Calloc(size_t nelem, size_t elsize)

크기가 각각 elsize 바이트인 nelem 개의 요소를 할당하고 할당된 메모리를 가리키는 void* 형의 포인터를 반환하거나, 요청이 실패하면 NULL을 반환합니다. 메모리는 0으로 초기화됩니다.

0개의 요소나 0바이트 크기의 요소를 요청하면 PyObject_Calloc(1, 1)이 대신 호출된 것처럼 가능하면 고유한 NULL이 아닌 포인터를 반환합니다.

버전 3.5에 추가.

void* PyObject_Realloc(void *p, size_t n)

p가 가리키는 메모리 블록의 크기를 n 바이트로 조정합니다. 내용은 이전과 새로운 크기의 최솟값 내에서는 변경되지 않습니다.

pNULL이면, 호출은 PyObject_Malloc(n)과 동등합니다; 그렇지 않고 n이 0과 같으면, 메모리 블록의 크기는 조정되지만 해제되지 않고, 반환된 포인터는 NULL이 아닙니다.

pNULL이 아닌 한, PyObject_Malloc(), PyObject_Realloc() 또는 PyObject_Calloc()에 대한 이전 호출에 의해 반환된 것이어야 합니다.

요청이 실패하면, PyObject_Realloc()NULL을 반환하고 p는 이전 메모리 영역에 대한 유효한 포인터로 유지됩니다.

void PyObject_Free(void *p)

p가 가리키는 메모리 블록을 해제합니다. 이 블록은 PyObject_Malloc(), PyObject_Realloc() 또는 PyObject_Calloc()에 대한 이전 호출에 의해 반환된 것이어야 합니다. 그렇지 않거나 PyObject_Free(p)가 이전에 호출되었으면 정의되지 않은 동작이 일어납니다.

pNULL이면, 아무 작업도 수행되지 않습니다.

기본 메모리 할당자

기본 메모리 할당자:

구성

이름

PyMem_RawMalloc

PyMem_Malloc

PyObject_Malloc

릴리스 빌드

"pymalloc"

malloc

pymalloc

pymalloc

디버그 빌드

"pymalloc_debug"

malloc + 디버그

pymalloc + 디버그

pymalloc + 디버그

pymalloc 없는 배포 빌드

"malloc"

malloc

malloc

malloc

pymalloc 없는 디버그 빌드

"malloc_debug"

malloc + 디버그

malloc + 디버그

malloc + 디버그

범례:

메모리 할당자 사용자 정의

버전 3.4에 추가.

PyMemAllocatorEx

Structure used to describe a memory block allocator. The structure has the following fields:

필드

의미

void *ctx

첫 번째 인자로 전달된 사용자 컨텍스트

void* malloc(void *ctx, size_t size)

메모리 블록을 할당합니다

void* calloc(void *ctx, size_t nelem, size_t elsize)

0으로 초기화된 메모리 블록을 할당합니다

void* realloc(void *ctx, void *ptr, size_t new_size)

메모리 블록을 할당하거나 크기 조정합니다

void free(void *ctx, void *ptr)

메모리 블록을 해제합니다

버전 3.5에서 변경: PyMemAllocator 구조체의 이름이 PyMemAllocatorEx로 바뀌고 새로운 calloc 필드가 추가되었습니다.

PyMemAllocatorDomain

할당자 도메인을 식별하는 데 사용되는 열거형. 도메인:

PYMEM_DOMAIN_RAW

함수:

PYMEM_DOMAIN_MEM

함수:

PYMEM_DOMAIN_OBJ

함수:

void PyMem_GetAllocator(PyMemAllocatorDomain domain, PyMemAllocatorEx *allocator)

지정된 도메인의 메모리 블록 할당자를 가져옵니다.

void PyMem_SetAllocator(PyMemAllocatorDomain domain, PyMemAllocatorEx *allocator)

지정된 도메인의 메모리 블록 할당자를 설정합니다.

새 할당자는 0바이트를 요청할 때 고유한 NULL이 아닌 포인터를 반환해야 합니다.

PYMEM_DOMAIN_RAW 도메인의 경우, 할당자는 스레드 안전해야 합니다: 할당자가 호출될 때 GIL을 잡지 않습니다.

새 할당자가 훅이 아니면 (이전 할당자를 호출하지 않으면), PyMem_SetupDebugHooks() 함수를 호출하여 새 할당자 위에 디버그 훅을 다시 설치해야 합니다.

void PyMem_SetupDebugHooks(void)

파이썬 메모리 할당자 함수에 있는 버그를 감지하기 위한 훅을 설정합니다.

새로 할당된 메모리는 바이트 0xCD(CLEANBYTE)로 채워지고, 해제된 메모리는 바이트 0xDD(DEADBYTE)로 채워집니다. 메모리 블록은 “금지된 바이트”(FORBIDDENBYTE: 바이트 0xFD)로 둘러싸여 있습니다.

실행 시간 검사:

에러가 발생하면, 디버그 훅은 tracemalloc 모듈을 사용하여 메모리 블록이 할당된 곳의 트레이스백을 가져옵니다. tracemalloc이 파이썬 메모리 할당을 추적 중이고 메모리 블록이 추적될 때만 트레이스백이 표시됩니다.

파이썬이 디버그 모드에서 컴파일되면 이러한 훅은 기본적으로 설치됩니다. PYTHONMALLOC 환경 변수를 사용하여 릴리스 모드에서 컴파일된 파이썬에 디버그 훅을 설치할 수 있습니다.

버전 3.6에서 변경: 이 함수는 이제 릴리스 모드에서 컴파일된 파이썬에서도 작동합니다. 에러가 발생하면, 디버그 훅은 이제 tracemalloc을 사용하여 메모리 블록이 할당된 곳의 트레이스백을 가져옵니다. 또한 디버그 훅은 이제 PYMEM_DOMAIN_OBJPYMEM_DOMAIN_MEM 도메인의 함수가 호출될 때 GIL을 잡는지 확인합니다.

버전 3.8에서 변경: 바이트 패턴 0xCB(CLEANBYTE), 0xDB(DEADBYTE) 및 0xFB(FORBIDDENBYTE)는 윈도우 CRT 디버그 malloc()free()와 같은 값을 사용하도록 0xCD, 0xDD0xFD로 대체되었습니다.

pymalloc 할당자

파이썬에는 수명이 짧은 작은 (512바이트 이하) 객체에 최적화된 pymalloc 할당자가 있습니다. 256 KiB의 고정 크기를 갖는 “아레나(arena)”라는 메모리 매핑을 사용합니다. 512 바이트보다 큰 할당의 경우 PyMem_RawMalloc()PyMem_RawRealloc()으로 대체됩니다.

pymallocPYMEM_DOMAIN_MEM(예: PyMem_Malloc())과 PYMEM_DOMAIN_OBJ(예: PyObject_Malloc()) 도메인의 기본 할당자입니다.

아레나 할당자는 다음 함수를 사용합니다:

  • 윈도우에서 VirtualAlloc()VirtualFree(),

  • 사용할 수 있으면 mmap()munmap()

  • 그렇지 않으면 malloc()free()

pymalloc 아레나 할당자 사용자 정의

버전 3.4에 추가.

PyObjectArenaAllocator

아레나 할당자를 기술하는 데 사용되는 구조체. 이 구조체에는 세 개의 필드가 있습니다:

필드

의미

void *ctx

첫 번째 인자로 전달된 사용자 컨텍스트

void* alloc(void *ctx, size_t size)

size 바이트의 아레나를 할당합니다

void free(void *ctx, void *ptr, size_t size)

아레나를 해제합니다

void PyObject_GetArenaAllocator(PyObjectArenaAllocator *allocator)

아레나 할당자를 얻습니다.

void PyObject_SetArenaAllocator(PyObjectArenaAllocator *allocator)

아레나 할당자를 설정합니다.

tracemalloc C API

버전 3.7에 추가.

int PyTraceMalloc_Track(unsigned int domain, uintptr_t ptr, size_t size)

tracemalloc 모듈에서 할당된 메모리 블록을 추적합니다.

성공하면 0을 반환하고, 에러가 발생하면 (추적을 저장하기 위한 메모리를 할당하지 못했습니다) -1을 반환합니다. tracemalloc이 비활성화되었으면 -2를 반환합니다.

메모리 블록이 이미 추적되면, 기존 추적을 갱신합니다.

int PyTraceMalloc_Untrack(unsigned int domain, uintptr_t ptr)

tracemalloc 모듈에서 할당된 메모리 블록을 추적 해제합니다. 블록이 추적되지 않으면 아무것도 하지 않습니다.

tracemalloc이 비활성화되었으면 -2를 반환하고, 그렇지 않으면 0을 반환합니다.

다음은 개요 섹션에서 따온 예제입니다. I/O 버퍼가 첫 번째 함수 집합을 사용하여 파이썬 힙에서 할당되도록 다시 작성되었습니다:

PyObject *res;
char *buf = (char *) PyMem_Malloc(BUFSIZ); /* for I/O */

if (buf == NULL)
    return PyErr_NoMemory();
/* ...Do some I/O operation involving buf... */
res = PyBytes_FromString(buf);
PyMem_Free(buf); /* allocated with PyMem_Malloc */
return res;

형 지향 함수 집합을 사용하는 같은 코드입니다:

PyObject *res;
char *buf = PyMem_New(char, BUFSIZ); /* for I/O */

if (buf == NULL)
    return PyErr_NoMemory();
/* ...Do some I/O operation involving buf... */
res = PyBytes_FromString(buf);
PyMem_Del(buf); /* allocated with PyMem_New */
return res;

위의 두 가지 예에서, 버퍼는 항상 같은 집합에 속하는 함수를 통해 조작됨에 유의하십시오. 실제로, 서로 다른 할당자를 혼합할 위험이 최소로 줄어들도록, 주어진 메모리 블록에 대해 같은 메모리 API 패밀리를 사용하는 것은 필수입니다 . 다음 코드 시퀀스에는 두 개의 에러가 있으며, 그중 하나는 서로 다른 힙에서 작동하는 두 개의 다른 할당자를 혼합하기 때문에 치명적(fatal)인 것으로 표시됩니다.

char *buf1 = PyMem_New(char, BUFSIZ);
char *buf2 = (char *) malloc(BUFSIZ);
char *buf3 = (char *) PyMem_Malloc(BUFSIZ);
...
PyMem_Del(buf3);  /* Wrong -- should be PyMem_Free() */
free(buf2);       /* Right -- allocated via malloc() */
free(buf1);       /* Fatal -- should be PyMem_Del()  */

파이썬 힙에서 원시 메모리 블록을 처리하기 위한 함수 외에도, 파이썬의 객체는 PyObject_New(), PyObject_NewVar()PyObject_Del()로 할당되고 해제됩니다.

이것들은 C로 새로운 객체 형을 정의하고 구현하는 것에 대한 다음 장에서 설명될 것입니다.