php中的array非常强大、灵活的类型。使用HashTable实现的。
HashTable的数据结构:
//Bucket:散列表中存储的元素
typedef struct _Bucket {
zval val; //存储的具体value, 这里嵌入了一个zval, 而不是一个指针
zend_ulong h; //key根据times 33计算得到的哈希值, 或者是数值索引编号
zend_string *key; //存储元素的key
} Bucket;
//HashTable结构
typedef struct _zend_array HashTable;
struct _zend_array {
zend_refcounted_h gc;
union {
struct {
ZEND_ENDIAN_LOHI_4(
zend_uchar flags,
zend_uchar nApplyCount,
zend_uchar nIteratorsCount,
zend_uchar reserve)
} v;
uint32_t flags;
} u;
uint32_t nTableMask; //哈希值计算掩码, 等于nTableSize的负值(nTab
leMask = -nTableSize)
Bucket *arData; //存储元素数组, 指向第一个Bucket
uint32_t nNumUsed; //已用Bucket数
uint32_t nNumOfElements; //哈希表有效元素数
uint32_t nTableSize; //哈希表总大小, 为2的n次方
uint32_t nInternalPointer;
zend_long nNextFreeElement; //下一个可用的数值索引,如:arr[] = 1;a
rr["a"] = 2;arr[] = 3; 则nNextFreeElement = 2;
dtor_func_t pDestructor;
};
实际上这个散列表也在 arData 中,比较特别的是散列表在ht->arData内存之前,分配内
存时这个散列表与Bucket数组一起分配,arData向后移动到了Bucket数组的起始位置,并不
是申请内存的起始位置,这样散列表可以由arData指针向前移动访问到,即arData[-1]、
arData[-2]、 arData[-3]…散列表的结构是 uint32_t ,它保存的是value在Bucket数组中
的位置。
所以,整体来看HashTable主要依赖arData实现元素的存储、 索引。 插入一个元素时先将元
素按先后顺序插入Bucket数组,位置是idx,再根据key的哈希值映射到散列表中的某个位置
nIndex,将idx存入这个位置;查找时先在散列表中映射到nIndex,得到value在Bucket数组
的位置idx,再从Bucket数组中取出元素。
比如:
$arr["a"] = 1;
$arr["b"] = 2;
$arr["c"] = 3;
$arr["d"] = 4;
unset($arr["c"]);
对应的HashTable如下图所示。
splFixedArray数据结构
typedef struct _spl_fixedarray { /* {{{ */
zend_long size;
zval *elements;
} spl_fixedarray;
/* }}} */
typedef struct _spl_fixedarray_object { /* {{{ */
spl_fixedarray array;
zend_function *fptr_offset_get;
zend_function *fptr_offset_set;
zend_function *fptr_offset_has;
zend_function *fptr_offset_del;
zend_function *fptr_count;
int current;
int flags;
zend_class_entry *ce_get_iterator;
zend_object std;
} spl_fixedarray_object;
/* }}} */
对比splFixedArray 没有使用Hashtable方式存储。
在php7之后的版本,执行速度上没太在区别。