Skip to content

内存分配

原文: http://docs.cython.org/en/latest/src/tutorial/memory_allocation.html

动态内存分配在 Python 中通常不是个问题。一切都是对象,引用计数系统和垃圾收集器在不再使用时自动将内存返回给系统。

当谈到更多低级数据缓冲区时,Cython 通过 NumPy,内存视图或 Python 的 stdlib 数组类型特别支持简单类型的(多维)数组。它们是功能丰富的、带垃圾收集、比 C 中的裸指针更容易使用,同时仍然保持速度和静态类型的好处。参见 使用 Python 数组带类型的内存视图

但是,在某些情况下,这些对象仍然会产生不可接受的开销,使得在 C 中进行手动内存管理变得很有必要。

简单的 C 值和结构(例如局部变量cdef double x)通常在堆栈上分配并通过值传递,但对于更大和更复杂的对象(例如动态大小的双精度列表),必须手动请求内存和释放。 C 为此提供函数malloc()realloc()free(),可以从clibc.stdlib导入到 cython 中。他们的函数签名是:

void* malloc(size_t size)
void* realloc(void* ptr, size_t size)
void free(void* ptr)

malloc 使用的一个非常简单的示例如下:

import random
from libc.stdlib cimport malloc, free

def random_noise(int number=1):
    cdef int i
    # allocate number * sizeof(double) bytes of memory
    cdef double *my_array = <double *> malloc(number * sizeof(double))
    if not my_array:
        raise MemoryError()

    try:
        ran = random.normalvariate
        for i in range(number):
            my_array[i] = ran(0, 1)

        # ... let's just assume we do some more heavy C calculations here to make up
        # for the work that it takes to pack the C double values into Python float
        # objects below, right after throwing away the existing objects above.

        return [x for x in my_array[:number]]
    finally:
        # return the previously allocated memory to the system
        free(my_array)

请注意,用于在 Python 堆上分配内存的 C-API 函数通常比上面的低级 C 函数更受欢迎,因为它们提供的内存实际上是在 Python 的内部内存管理系统中管理的。它们还对较小的内存块进行了特殊优化,通过避免代价高昂的操作系统调用来加速其分配。

可以在cpython.mem标准声明文件中找到 C-API 函数:

from cpython.mem cimport PyMem_Malloc, PyMem_Realloc, PyMem_Free

它们的接口和用法与相应的低级 C 函数相同。

需要记住的一件重要事情是,malloc()PyMem_Malloc() _ 获得的内存块必须手动释放 ,并相应调用free()PyMem_Free() 当它们不再使用时( 必须 _ 总是使用匹配类型的自由函数)。否则,在 python 进程退出之前,它们不会被回收。这称为内存泄漏。

如果一块内存需要比try..finally块可以管理的更长的生命周期,另一个有用的习惯是将其生命周期与 Python 对象联系起来以利用 Python 运行时的内存管理,例如:

from cpython.mem cimport PyMem_Malloc, PyMem_Realloc, PyMem_Free

cdef class SomeMemory:

    cdef double* data

    def __cinit__(self, size_t number):
        # allocate some memory (uninitialised, may contain arbitrary data)
        self.data = <double*> PyMem_Malloc(number * sizeof(double))
        if not self.data:
            raise MemoryError()

    def resize(self, size_t new_number):
        # Allocates new_number * sizeof(double) bytes,
        # preserving the current content and making a best-effort to
        # re-use the original data location.
        mem = <double*> PyMem_Realloc(self.data, new_number * sizeof(double))
        if not mem:
            raise MemoryError()
        # Only overwrite the pointer if the memory was really reallocated.
        # On error (mem is NULL), the originally memory has not been freed.
        self.data = mem

    def __dealloc__(self):
        PyMem_Free(self.data)  # no-op if self.data is NULL



回到顶部