网站首页 语言 会计 互联网计算机 医学 学历 职场 文艺体育 范文
当前位置:学识谷 > 计算机 > C语言

C语言课程的Struct Hack笔记

栏目: C语言 / 发布于: / 人气:4.87K

最近在搞Compiler的CodeGenerator实验,有一部分需要把Java程序翻译成C程序,比如:

C语言课程的Struct Hack笔记

复制代码 代码如下:

int [] array;

array = new int[10];

tln(th); //10

这段代码翻译成C很自然的想法是:

复制代码 代码如下:

int * array; // int array[] not support in C

array = (int*)malloc(sizof(int)*10);

printf("%dn",sizof(array)/sizeof(int)); // 1

但很可惜这样是错误的,因为malloc操作在堆上分配空间,不一定是连续的,sizof(array)得到的是指针本身所占的单元,和sizeof(int)相等,无法通过sizof求得数组长度。它和下面还不一样:

复制代码 代码如下:

int array[10];

printf("%dn",sizof(array)/sizeof(int)); // 10

这里array是数组,是指向整个连续存储空间的常量,所以sizeof对其操作求得的是整个区域的长度。但是当数组名作为函数的参数传递时,数组就退化为指针,又回到了刚才问题。

我们应该怎么做?

在 StackOverflow 搜了一下,发现ANSI C根本没有直接办法通过指向内存的指针求得分配长度。但Windows下提供了计算指针指向的内存大小的方法[malloc.h]:

_msize : returns the size (in bytes) as an unsigned integer.

复制代码 代码如下:

size_t _msize(

void *memblock

);

但由于操作系统策略的原因,实际分配到的大小可能会比指定的大一些.

在Linux下,指针往前偏移一个整形大小的单元也会记录实际分配的大小,我们来窥探一下那个单元的内容:

复制代码 代码如下:

//test.c

int main(){

int * p;

int i;

int size;

for (i=1;i<11;i++)

printf("%d ",i);

printf("n");

for (i=0;i<10;i++){

p = (int*)malloc(sizeof(int)*i);

size = *(int*)((char*)p-sizeof(int));

printf("size:%d ",size);

free(p);

}

printf("n");

}

$gcc test.c

$./

1 2 3 4 5 6 7 8 9 10

17 17 17 17 25 25 33 33 41 41

看来Linux的分配策略不能使得内存大小和元素个数一一对应,此法不可用。 后来发现在Linux下原来也有类似_msize的函数[malloc.h]:

复制代码 代码如下:

int * array;

int size;

array = (int*)malloc(sizof(50);

size = malloc_usable_size(array);

printf("%dn",size);//50

但是malloc.h不属于标准C,我们还要继续寻找通用之法。经过大量查阅,终于发现了一种code trick,称作struct-hack. 前面提到过,在C语言中,int a[]是违法的.,但是把它作为struct的最后一个成员却是可以的:

复制代码 代码如下:

typedef struct array{

int size;

int free;

int buf[];

}array,*Tiger_array;

这是在C语言的后期加入的特性,目的就是为了实现flexible array, 这样每次给数组分配空间时,需要同步记录size大小。而求size的时候,直接取出来即可:

复制代码 代码如下:

Tiger_array ta;

ta = (int*)malloc(sizeof(array)+100);

ta->size = 100;

ta->free = 0;

需要注意一点,这时分配的大小应该是sizeof(struct)加上需求的数组大小。

这个问题就说到这里。