高效的C编程之:C循环结构(下)

来源:本站
导读:目前正在解读《高效的C编程之:C循环结构(下)》的相关信息,《高效的C编程之:C循环结构(下)》是由用户自行发布的知识型内容!下面请观看由(电工技术网 - www.9ddd.net)用户发布《高效的C编程之:C循环结构(下)》的详细说明。
简介:循环体是程序设计与优化的重点考虑对象。本节将着重讲解在ARM上处理for和while循环最有效的方法。

14.5.2循环展开

在14.5.1节中可以发现,每次循环需要在循环体外加两条指令:一条减法指令来减少循环计数值和一条条件分支指令。通常这些指令称为循环开销(LoopOverhead)。在ARM7或ARM9处理器上,加法指令需要1个周期,条件分支指令需要3个周期,这样每个循环就需要4个周期的开销。

可以通过展开循环体(LoopUnrolling),即重复循环主体多次,同时按同样的比例减少循环次数来降低循环开销。

下面的例子通过将循环体展开4次,来达到减少循环开销的目的。

intcountbit1(uintn)

{intbits=0;

while(n!=0)

{

if(n&1)bits++;

n>>=1;

}

returnbits;

}

将循环主体展开。

intcountbit2(uintn)

{intbits=0;

while(n!=0)

{

if(n&1)bits++;

if(n&2)bits++;

if(n&4)bits++;

if(n&8)bits++;

n>>=4;

}

returnbits;

}

这里减少了4N的循环开销(N=4,即循环体执行的次数)。如果循环体中存在耗时的Store/Load指令,则代码执行效率的提高将更明显。

ARM编译器不会自动将循环体展开,只有用户自己判断何时将循环体展开,到底应该展开多少次,如果循环的次数不是循环展开的倍数该怎么办?下面就将详细讨论,用户编写自己的循环展开程序时,需要注意的问题。

①只有当循环展开对提高应用程序的整体性能非常重要时,才进行循环展开;否则反而会增加代码尺寸。

②应设法使循环的次数是循环展开的倍数。如果难以实现,那么就要增加额外的代码来处理数组的剩余元素。这将增加少许代码量,但可以保持较好的性能。

提醒:《高效的C编程之:C循环结构(下)》最后刷新时间 2024-03-14 01:07:25,本站为公益型个人网站,仅供个人学习和记录信息,不进行任何商业性质的盈利。如果内容、图片资源失效或内容涉及侵权,请反馈至,我们会及时处理。本站只保证内容的可读性,无法保证真实性,《高效的C编程之:C循环结构(下)》该内容的真实性请自行鉴别。