博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
C语言内存优化——继续含泪总结
阅读量:6655 次
发布时间:2019-06-25

本文共 2202 字,大约阅读时间需要 7 分钟。

之前分析了基本数据类型的优化,现在开始涉及全局和局部变量的优化,话说这个东西我从没想过还能这样优化的喂!

全局变量 / Global variables

全局变量不会被分配在寄存器上,修改全局变量需要通过指针或者调用函数的方式间接进行。所以编译器不会将全局变量存储在寄存器中,那样会带来额外的、不必要的负担和存储空间。所以在比较关键的循环中,我们要不使用全局变量。

如果一个函数要频繁的使用全局变量,我们可以使用局部变量,作为全局变量的拷贝,这样就可以使用寄存器了。条件是本函数调用的任何子函数不使用这些全局变量。

举个例子:

int f(void);int g(void);int errs;void test1(void){    errs += f();    errs += g();}void test2(void){    int localerrs = errs;    localerrs += f();    localerrs += g();    errs = localerrs;}

可以看到test1()中每次加法都需要读取和存储全局变量errs,而在test2()中,localerrs分配在寄存器上,只需要一条指令。

使用别名 / Using Aliases

考虑下面的例子:

void func1( int *data ){    int i;    for(i = 0; i < 10; i++)        anyfunc(*data, i);}

即使*data从来没有变化,编译器却不知道anyfunc()没有修改它,于是程序每次用到它的时候,都要把它从内存中读出来,可能它只是某些变量的别名,这些变量在程序的其他部分被修改。如果能够确定它不会被改变,我们可以这样写:

void func1( int *data ){    int i;    int localdata;    localdata = *data;    for(i=0; i<10; i++)        anyfunc(localdata, i);}

这样会给编译器优化工作更多的选择余地。

活跃变量和泄漏 / Live variables and spilling

寄存器的数量在每个处理器当中都是固定的,所以在程序的某个特定的位置,可以保存在寄存器中的变量的数量是有限制的。有些编译器支持“生命周期分割”(live-range splitting),也就是说在函数的不同部分,变量可以被分配到不同的寄存器或者内存中。变量的生存范围被定义成:起点是对该变量的一次空间分配,终点是在下次空间分配之前的最后一次使用之间。在这个范围内,变量的值是合法的,是活的。在生存范围之外,变量不再被使用,是死的,它的寄存器可以供其他变量使用,这样,编译器就可以安排更多的变量到寄存器当中。

可分配到寄存器的变量需要的寄存器数量等于经过生命范围重叠的变量的数目,如果这个数目超过可用的寄存器的数量,有些变量就必须被暂时的存储到内存中。这种处理叫做“泄漏(spilling)”。 编译器优先释放最不频繁使用的变量,将释放的代价降到最低。可以通过以下方式避免变量的“释放”:

限制活跃变量的最大数目:通常可以使用简单小巧的表达式,在函数内部不使用太多的变量。把大的函数分割成更加简单的、更加小巧的多个函数,也可能会有所帮助。

使用关键字register修饰最经常使用的变量:告诉编译器这个变量将会被经常用到,要求编译器使用非常高的优先级将此变量分配到寄存器中。尽管如此,在某些情况下,变量还是可能被泄漏。

变量类型 / Variable Types

C编译器支持基本的变量类型:char、short、int、long(signed、unsigned)、float、double。为变量定义最恰当的类型,非常重要,因为这样可以减少代码和数据的长度,可以非常显著的提高效率。

局部变量 / Local variables

如果可能,局部变量要避免使用char和short。对于char和short类型,编译器在每次分配空间以后,都要将这种局部变量的尺寸减少到8位或16位。这对于符号变量来说称为符号扩展,对无符号变量称为无符号扩展。这种操作是通过将寄存器左移24或16位,然后再有符号(或无符号的)右移同样的位数来实现的,需要两条指令(无符号字节变量的无符号扩展需要一条指令)。

这些移位操作可以通过使用int和unsigned int的局部变量来避免。这对于那些首先将数据调到局部变量然后利用局部变量进行运算的情况尤其重要。即使数据以8位或16位的形式输入或输出,把他们当作32位来处理仍是有意义的。

我们来考虑下面的三个例子函数:

int wordinc (int a){     return a + 1;}short shortinc (short a){     return a + 1;}char charinc (char a){     return a + 1;}

他们的运算结果是相同的,但是第一个代码片断要比其他片断运行的要快。

是不是学到了呢?C语言博大进深,诸君还得一起加油啊……请持续关注更新,更多干货和资料请直接联系我,也可以加群710520381,邀请码:柳猫,欢迎大家共同讨论

转载地址:http://mlxto.baihongyu.com/

你可能感兴趣的文章
python字典开发三级菜单
查看>>
.net Framework下载地址
查看>>
十三个经典算法集锦
查看>>
关于rsync报错的问题
查看>>
深圳偶遇
查看>>
给自己电脑安装SSD与加内存条
查看>>
国内最大的 Node.js 社区将 New Relic 的监控产品换成了 OneAPM
查看>>
如何有效地记录 Java SQL 日志?
查看>>
学习Linux决心书
查看>>
stp 总结
查看>>
Java本地文件操作(五)遍历文件夹
查看>>
BGP学习笔记
查看>>
mysql字段加密
查看>>
linux 磁盘分区(一)
查看>>
在虚拟机中的域环境下批量安装部署软件(第三节)
查看>>
java基础(jdbc上)
查看>>
python文件读写,以后就用with open语句
查看>>
10.19 iptables规则备份和恢复 firewalld的9个zone firewalld关
查看>>
自然语言处理NLP(三)
查看>>
Mysql-索引
查看>>