从Python的源码来解析Python下的freeblock

(编辑：jimmy 日期: 2024/11/18 浏览：3 次 )

1 引言

在python内存管理中，有一个block的概念。它比较类似于SGI次级空间配置器。
首先申请一块大的空间(4KB)，然后把它切割成一小份（8， 16 一直到512）。
当有内存申请的请求时候，简单的流程是：根据大小找到对应的block，然后在freeblock 上给它一份。

2 问题

整个过程是一种比较自然的slab分配方式。但当我读到这段代码时，却感到疑惑：

static void* _PyObject_Malloc(void* ctx, size_t nbytes)
{
    ...
  pool->freeblock = (block*)pool + pool->nextoffset;

    pool->nextoffset += INDEX2SIZE(size);
    *(block **)(pool->freeblock) = NULL; // [1]
    ...
}

freeblock指向空闲的链表，为它赋值很好理解。但是为什么要加上代码1处那一句！
对C比较熟悉的童鞋很容易能看出它的作用，它在为*freeblock赋值为NULL。

但是为什么要这么做？
直到看到内存回收的代码：

static void _PyObject_Free(void* ctx, void*p)
{
  ...
  *(block**)p = lastfree = pool->freeblock;
  pool->freeblock = (block*)p;
  ...
}

回想一下SGI次级空间配置，它需要一个链表，指向block中可用的小块。因为这些快，是离散的，只有用指针才能索引它。
在SGI次级空间配置中，是用一个union，达到了节省空间的目的：有数据时，它存储着真正的数据；没有数据时，它就变成指向下一块可用内存的指针：

union __Obj {
  union __Obj* free_list_link;
  char client_data[];
};

这样一想，问题就变得很明显了。freeblock指向一个链表，链表的next域就由它自己来索引。
在_PyObject_Free中，内存p是要被回收的，它应该插在freeblock的链表头，freeblock被更新指向它。同时，p指向原来freeblock指向的内容，这是一个很简单的链表插入操作。
这样在遍历的时候，我们就可以用freeblock = * freeblock的方式来工作了。
如下图所示:

上一篇：python通过openpyxl生成Excel文件的方法
下一篇：python比较2个xml内容的方法