使用 Python 数组
原文: http://docs.cython.org/en/latest/src/tutorial/array.html
Python 有一个内置数组模块,支持原始类型的动态一维数组。可以从 Cython 中访问 Python 数组的底层 C 数组。同时它们是普通的 Python 对象,当使用 multiprocessing
时,它们可以存储在列表中并在进程之间进行序列化。
与使用malloc()
和free()
的手动方法相比,这提供了 Python 的安全和自动内存管理,并且与 Numpy 数组相比,不需要安装依赖项,因为 array
模块内置于 Python 和 Cython 中。
内存视图的安全使用
from cpython cimport array
import array
cdef array.array a = array.array('i', [1, 2, 3])
cdef int[:] ca = a
print(ca[0])
注意:导入会将常规 Python 数组对象带入命名空间,而 cimport 会添加可从 Cython 访问的函数。
Python 数组使用类型签名和初始值序列构造。有关可能的类型签名,请参阅数组模块的 Python 文档。
请注意,当将 Python 数组分配给类型为内存视图的变量时,构造内存视图会有轻微的开销。但是,从此刻起,变量只要被限定了类型,就可以无需开销的传递给其他函数:
from cpython cimport array
import array
cdef array.array a = array.array('i', [1, 2, 3])
cdef int[:] ca = a
cdef int overhead(object a):
cdef int[:] ca = a
return ca[0]
cdef int no_overhead(int[:] ca):
return ca[0]
print(overhead(a)) # new memory view will be constructed, overhead
print(no_overhead(ca)) # ca is already a memory view, so no overhead
零开销,不安全访问原始 C 指针
为了避免任何开销并且能够将 C 指针传递给其他函数,可以将底层连续数组作为指针进行访问。没有类型或边界检查,因此请小心使用正确的类型和符号。
from cpython cimport array
import array
cdef array.array a = array.array('i', [1, 2, 3])
# access underlying pointer:
print(a.data.as_ints[0])
from libc.string cimport memset
memset(a.data.as_voidptr, 0, len(a) * sizeof(int))
请注意,对数组对象的任何长度更改操作都可能使指针无效。
克隆,扩展数组
为了避免必须使用 Python 模块中的数组构造函数,可以创建一个与模板具有相同类型的新数组,并预分配给定数量的元素。请求时,数组初始化为零。
from cpython cimport array
import array
cdef array.array int_array_template = array.array('i', [])
cdef array.array newarray
# create an array with 3 elements with same type as template
newarray = array.clone(int_array_template, 3, zero=False)
数组也可以扩展和调整大小;这避免了如果元素将被逐个追加(append)或删除(remove)时反复进行的内存重新分配。
from cpython cimport array
import array
cdef array.array a = array.array('i', [1, 2, 3])
cdef array.array b = array.array('i', [4, 5, 6])
# extend a with b, resize as needed
array.extend(a, b)
# resize a, leaving just original three elements
array.resize(a, len(a) - len(b))
API 参考
数据字段
data.as_voidptr
data.as_chars
data.as_schars
data.as_uchars
data.as_shorts
data.as_ushorts
data.as_ints
data.as_uints
data.as_longs
data.as_ulongs
data.as_longlongs # requires Python >=3
data.as_ulonglongs # requires Python >=3
data.as_floats
data.as_doubles
data.as_pyunicodes
使用给定类型直接访问基础连续 C 数组;例如,myarray.data.as_ints
。
功能
以下函数可用于数组模块中的 Cython:
int resize(array self, Py_ssize_t n) except -1
快速调整大小/重新分配。不适合重复的小增量;将基础数组的大小调整为所请求的数量。
int resize_smart(array self, Py_ssize_t n) except -1
对小增量更高效;使用增长模式,提供摊销的线性的时间增加。
cdef inline array clone(array template, Py_ssize_t length, bint zero)
给定模板数组,快速创建新数组。类型与template
相同。如果零是True
,则新数组将用零初始化。
cdef inline array copy(array self)
制作一个数组的副本。
cdef inline int extend_buffer(array self, char* stuff, Py_ssize_t n) except -1
有效附加相同类型的新数据(例如相同数组类型)n
:元素数量(不是字节数!)
cdef inline int extend(array self, array other) except -1
使用来自另一个数组的数据扩展数组;类型必须匹配。
cdef inline void zero(array self)
将数组的所有元素设置为零。