求中位数,O,n的java实现【利用快速排序折半查找中位数】

查找无序数组的中位数,要想时间复杂度为O(n)其实用计数排序就能很方便地实现,在此讨论使用快速排序进行定位的方法。

1、中位数定义

2、算法思想

3、Java代码实现

4、时间复杂度分析

5、附录

中位数一般两种定义:

第一种:

排序后数组的中间位置的值,如果数组的个数是偶数个,则返回排序后数组的第N/2个数。

第一种(官方):

排序后数组的中间位置的值,如果数组的个数是偶数个,则返回最中间两个数的平均数。

例如:{ 7, 9, 4, 5}   第一种输出5;第二种输出6.0

算法思想:大家应该都知道,快速排序每一躺都能定位一个数在这个数组的最终位置,所以可以利用此特性对数组中任意一个位置进行二分法定位。

    方法就是:一趟快排的partition结束之后,将此时定位的位置与欲定位位置进行比较,如果不等于,则将partition的区间折半,直到等于为止,返回这个位置的值

Java代码实现

因为第二种中位数定义需要定位两个位置,在第一种上扩展即可,所以先讨论第一种:

 1     public static int getMedian(int[] nums) {
 2         return partition(nums, 0, nums.length - 1);
 3     }
 4 
 5     private static int partition(int[] nums, int start, int end) {
 6         /***快排partition函数原代码——start***/
 7         int left = start;
 8         int right = end + 1;
 9 
10         int point = nums[start];
11         while (true) {
12             while (left < right && nums[--right] >= point)
13                 ;
14             while (left < right && nums[++left] <= point)
15                 ;
16             if (left == right) {
17                 break;
18             } else {
19                 int tmp = nums[left];
20                 nums[left] = nums[right];
21                 nums[right] = tmp;
22             }
23         }
24         nums[start] = nums[left];
25         nums[left] = point;
26         /***快排partition函数原代码——end***/
27         
28         /***定位判断***/
29         if (left == (nums.length - 1) / 2) {
30             return nums[left];
31         } else if (left > (nums.length - 1) / 2) {
32             return partition(nums, start, left - 1);
33         } else {
34             return partition(nums, left + 1, end);
35         }
36     }

其实就是在原来的partition结束后加了一个定位判断,此时left指向的就是已经本趟定位的那一个数,如果没有定位成功则将上下界调整折半。

【注意】:“如果数组的个数是偶数个,则返回排序后数组的第N/2个数”这句话需要用 (nums.length - 1) / 2 来实现这句描述的下标,并满足奇数时取最中间下标的效果。

时间复杂度分析:

由于此方法采用的也是递归,那么必定符合递归的复杂度通项表达式: T(n) = aT(n/b) + f(n)

其中a为每次递归会分成几个需要计算的下一层,(n/b)为下一层计算的元素个数,f(n)为本层的计算复杂度

由于是折半查找,所以有:a=1、b=2(平均)、f(n)=n(每次的遍历比较交换)

所以有

T(n) = T(n/2) +n
        =  T(n/4) + n/2 +n
        ……
        = T(1) + 2 + …… + n/2 +n    // T(1)≈1 等比数列求和
        = (1 - n * 2)/(1 - 2)
        = 2n - 1

所以最后平均时间复杂度为O(n)

【最优情况下b=n复杂度O(n);

 最坏情况下b=n-1/n,也就是(n/b)=(n-1),此时复杂度为O(n²),请自行计算哈】

附录——第二种求中位数的实现

思路:第一种已经解决了定位一个数字,而第二种就是定位两个数字,由于定位一个数字的时候不能保证另一个数字已经排序好,所以还需重新调用方法

  那么就把方法中定位判断的部分单独移出来做一个getByQuickSort(int[] nums,int stop)

java代码实现:

 1     public static double getByQuickSort(int[] nums, int stop) {
 2         if (stop < 0 || stop >= nums.length) {
 3             throw new IndexOutOfBoundsException();
 4         }
 5         
 6         int start = 0;
 7         int end = nums.length -1;
 8         int par = 0;
 9         
10         while (start <= end) {
11             par = partition(nums, start, end);
12             if (par == stop) {
13                 break;
14             } else if (par > stop) {
15                 end = par - 1;
16             } else {
17                 start = par + 1;
18             }
19         }
20         return nums[par];
21     }

此处的partition(...)方法就是上一段代码中的partition方法中把 /***定位判断***/ 以下都去掉,然后加一个 return left; 即可。

而找中位数就再写一个方法getMedian2(...)判断一下奇偶,再调用getByQuickSort(....)就可以了:

1     public static double getMedian2(int[] nums) {
2         if (nums.length % 2 == 1) {
3             return getByQuickSort(nums, nums.length / 2);
4         } else {
5             return (getByQuickSort(nums, nums.length / 2 - 1) + 
6                     getByQuickSort(nums, nums.length / 2)) / 2.0;
7         }
8     }