快速排序
快速排序思想
1962年,由C.A.R.Hoare创造出来。该算法核心思想就一句话:“排序数组时,将数组分成两个小部分,然后对它们递归排序”。然而采取什么样的策略将数组分成两个部分是关键,想想看,如果随便将数组A分成A1和A2两个小部分,即便分别将A1和A2排好序,那么A1和A2重新组合成A时仍然是无序的。所以,我们可以在数组中找一个值,称为key值,我们在把数组A分解为A1和A2前先对A做一些处理,让小于key值的元素都移到其左边,所有大于key值的元素都移到其右边。这样递归排序A1和A2,数组A就排好了。
举例
我们要排序的数组如下:
我们选取第一个元素作为key值,即55.(一般都是选取第一个元素)。假如我们有一种办法可以将数组做一步预处理,让小于key值的元素都位于其左边,大于key值的元素都位于其右边,预处理完数组如下:
这样数组就被key值划分成了两段,A[0...2]小于key,A[4...7]大于key,可见key值本身已排好序,接下来对A[0...2]和A[4...7]分别进行递归排序,那么整个数组就排好序了。预处理做的工作再次澄清下:找一个key值,把key位放到某位置A[p],使小于key值的元素都位于A[p]左边,大于key值的元素都位于A[p]的右边。到此,我们的快排模型就成型了。
/*l, u 代表待排序部分的下界和上界*/
void qsort(l, u)
{
/*递归结束条件是待排序部分的元素个数小于2*/
if(l >= u)
{
return;
}
/*此处进行预处理,预处理后key值位于位置p*/
qsort(l, p-1);
qsort(p+1, u);
}
接下来看如何做预处理。我们选取A[0]做为key值, p作为key值的位置。我们从A[1]开始遍历后面的数组,用变量i指示目前的位置,每次找到小于key的值都与A[++p]交换。开始时p=0.
5541592653589793 i = 1,A[i]位置为41, 即A[i] < key, swap(++p , i),即p = 1:
5541592653589793 i = 2,A[i]位置为59,A[i] > key,不做任何改变。
i = 3,A[i]位置为26,A[i] < key,swap(++p, i), 即p = 2:
5541265953589793 i = 4,A[i]位置为53,A[i] < key,swap(++p, i),p = 3:
5541265359589793 i = 5,A[i]位置为58,A[i] > key,不做任何改变。
i = 6,A[i]位置为97,A[i] > key,不做任何改变.
i = 7,A[i]位置为93,A[i] > key,不做任何改变.结束循环。此时p为key的最终位置。还需一步把key值填入p位置。
最后swap(l, p)即把Key值放到最终位置上了。至于为什么要交换l,p的位置,可以另拿一组数据试一下:55,41,59,26,99,58,97,93。
完整的程序1
/*l, u 代表待排序部分的下界和上界*/
void qsort(int l, int u)
{
/*递归结束条件是待排序部分的元素个数小于2*/
if(l >= u)
{
return;
}
int p = l;
for(int i = l+1; i <= u; i++)
{
if(A[i] < A[l])
{
swap(++p, i);
}
}
swap(l, p);
qsort(l, p-1);
qsort(p+1, u);
}
这就是第一代快速排序算法,正常情况下其复杂度为nlogn,但在考虑一种极端情况:n个相同元素组成的数组。在n-1次划分中每次划分都需要O(n)的时间,所以总的时间为O(n^2)。使用双向划分就可以避免这个问题。
双向划分快速排序
/*l, u 代表待排序部分的下界和上界*/
void qsort(int l, int u)
{
/*递归结束条件是待排序部分的元素个数小于2*/
if(l >= u)
{
return;
}
key = A[l]
for(int i = l, j = u+1; i <= j;)
{
do i++ while(i <= u && A[i] < key));
do j-- while(A[j] > key);
if(i > j)
{
break;
}
swap(i, j);
}
swap(l, j);
qsort(l, j-1);
qsort(j+1, u);
}
插入排序优化
插入排序的精髓就是首先将第一个元素视为有序子数组x[0...0],然后插入x[1]...x[n-1].思想很简单,代码也很简单,简单的代码有没有优化的空间呢?编程珠玑中提供了几个优化后的方案,效率提高了70%之多。
简单的实现(sort1)
void insertSort(int *array, size_t size)
{
for(size_t i = 1; i < size; i++)
{
for(int j = i; j > 0 && array[j - 1] > array[j]; j--)
{
swap(array[j - 1], array[j]);
}
}
}
优化思路
内循环的swap函数可能不如内联函数快些,所以第一步优化将该swap函数展开,据作者说,展开后效率提高了60%。
优化代码(sort2)
void insertSort(int *array, size_t size)
{
for(size_t i = 1; i < size; i++)
{
for(int j = i; j > 0 && array[j - 1] > array[j]; j--)
{
int t = array[j];
array[j] = array[j - 1];
array[j - 1] = t;
}
}
}
优化思路
由于内循环中总是给变量t赋同样的值(x[i]的初始值),所以内循环关于t的两条赋值语句移出循环,据说这么做的效率又提高了15%。
优化代码(sort3)
void insertSort(int *array, size_t size)
{
for(size_t i = 1; i < size; i++)
{
int j = i;
int t = array[j];
for(; j > 0 && array[j - 1] > array[j]; j--)
{
array[j] = array[j - 1];
}
array[j] = t;
}
}
《编程珠玑》书中给出了三种排序的运行时间:
插入排序的效率总是O(n2),效率差在比较的次数以及交换的频率,如果交换的频率减少的话就可以大大提高插入排序的效率,这也是为什么元素基本有序时插入排序效率高的原因。
个人观点
代码调优以及性能优化都可能带来一系列的副作用,比如程序的正确性,可读性,可维护性等。是否需要调优要看问题性质,调优既是华而不实的“花活”,也是一把利刃,区别就在于使用的场合。