国际C语言混乱代码大赛(The International Obfuscated C Code ContestIOCCC)。IOCCC有许多令人捧腹之处,不管你是自己编写还是时候分析获胜者的代码,都能够以令人惊讶的方式扩展你的知识。通常有10种类型的获胜者:“对规则的最奇怪的滥用”,“最具创意的源代码布局”,“最简单的单行代码”等。综合性的“最佳上镜”奖授予最难阅读、行为最为古怪(但能够运行)的C程序的作者。下面我们来欣赏并分析1987年,贝尔实验室的David Korn提交的获奖代码:
main() {printf(&unix[" 21%six 12 "], (unix)["have"] + "fun" - 0x60);}
这段代码打印出什么东西?(提示:和“have fun无关”)。
首先看一段代码:
#include int main() { int a[5]={1,2,3,4,5}; printf("%dn",3[a]); return 0; }
在C语言中,其实数组的引用可以3[a]这样的形式的,等价于a[3]。再看下面一段代码:
#include int main() { int a[5]={1,2,3,4,5},i=4; printf("%dn",3[a]); printf("%dn",i[a]); return 0; }
这样的表示也是可以的。i[a]实际上相当于a[4]了。再看下面一段代码:
#include int main() { printf("%dn",unix); return 0; }
为什么我没有定义unix也能打印出来呢? 原因是unix被编译器内定为一个宏。相当于#define unix 1 这样打印出来1。下面来解释一下这个问题.
#include int main() { printf("%cn",(unix)["have"]); return 0; }
这里的unix相当于1 ,那么unix["have"]相当于 "have"[1] 我们都知道"have"是个字符数组。那么 "have"[1]就相当于引用这个"have"数组下标为1的字符了,实际上就是a;:
#include int main() { printf("0x%x",'a'); return 0; }
a的asc码的16进制表示为0x61。(unix)["have"]+"fun"-0x60就相当于0x61-0x60+"fun"相当于 0x01+"fun" ,相当于字符指针后移并指向"un"了 。这样后面的部分解释完了。
#include int main() { printf(&unix[" 21ix 12 "]); return 0; }
我们首先把%s去掉。%s实际上是刚刚讲过的"un"的格式。我们知道unix宏的值 是1,那么
printf(&unix[" 21ix 12 "]);
相当于
printf(&1[" 21ix 12 "]);
根据上贴我说的 1["have"]这个形式,同理能得到:
printf(&" 21ix 12 "[1]);
这个形式了。这个引用和上面的有所区别区别在于&。那么一个字符数组从它的下标为1 的元素取地址就可以得到一个字符串指针。还原回去相当于
printf(&" 21%six 12 "[1],"un");
也就是说把第一个元素跳过去了把 21跳了过去。相当于:
printf("%six 12 ","un")