堆排序
堆是一种叫做完全二叉树的数据结构,可以分为大根堆和小根堆。
大根堆:每个节点的值都大于或者等于它的左右孩子的值
小根堆:每个节点的值都小于或者等于它的左右孩子的值
完全二叉树在数组中的存储
当二叉树按层序遍历的顺序保存在数组中时,**如果根节点存放在array[0],则节点i的左孩子节点为array[i*2+1],右孩子节点为array[i*2+2];如果根节点存放在array[1],则其左孩子为array[i*2],其右孩子为array[i*2+1]**。
建堆过程(大根堆为例)
从最后一个父节点array[n/2]开始,往前遍历,判断父节点和两个孩子节点大小,如果有孩子比父节点还大的,交换,这个交换会导致子树不符合大根堆的特点,因此要再往下再调整子树,直到调整完所有的,就构建好了大根堆
注:其中n是元素的个数。
###代码
堆排序实现找第k大数,采用大根堆的方法
class Solution { public: int findKthLargest(vector<int>& nums, int k) { //建堆 bigRootHeaps(nums,nums.size()); //交换k-1个元素去堆底,下一个堆根即为第k大个元素 for(int i=0;i<k-1;i++) { //交换 int temp=nums[0]; nums[0]=nums[nums.size()-1-i]; nums[nums.size()-1-i]=temp; //调整,只需要调整交换的那个子树即可 change(nums,0,nums.size()-i-1); } return nums[0]; } void bigRootHeaps(vector<int>&nums,int len) { for(int i=len/2;i>=0;i--) { change(nums,i,len); } } void change(vector<int>&nums,int i,int len) { int left_child=i*2+1; int right_child=i*2+2; int largest=i; if(left_child<len&&nums[left_child]>nums[i]) largest=left_child; if(right_child<len&&nums[right_child]>nums[largest]) largest=right_child; if(largest!=i){ int temp=nums[i]; nums[i]=nums[largest]; nums[largest]=temp; change(nums,largest,len); } } };
|
执行用时:144 ms, 在所有 C++ 提交中击败了14.16%的用户 内存消耗:44.4 MB, 在所有 C++ 提交中击败了65.45%的用户 通过测试用例:39 / 39
|
效果跟快排旗鼓相当:http://8.130.83.240/article/2023/3/19/9.html
找最大k个元素的堆排序优化
可以采用小根堆而不是大根堆的方式来实现,小根堆只维护k个元素,减少了堆调整的次数
小根堆存放k个元素,根节点存储这k个元素中的最小值
在解决这个问题时:
- 首先把前k个元素读入堆中,然后维护成一个小根堆;
- 由于要求最大的前k个值,之后都进来的元素,如果比小根堆的根节点还小,则直接丢弃,因为它不可能是top K元素了;
- 如果比根节点的元素大,则替换根节点,并调整小根堆,使其符合小根堆的特性;
- 遍历完所有元素后,小根堆的根节点就是我们要找的第k大个元素;
小根堆解决方法代码实现
class Solution { public: int findKthLargest(vector<int>& nums, int k) { //存放前k个元素的数组 vector<int>array; //初始化数组,先存k个数进去 for(int i=0;i<k;i++) { array.push_back(nums[i]); } //建堆 smallRootHeaps(array,k); for(int i=k;i<nums.size();i++) { //如果之后的元素甚至比小根堆根节点还小,直接丢掉 if(nums[i]<=array[0]) continue; else{ //否则将这个元素放入小根堆根节点 array[0]=nums[i]; //调整使其符合小根堆特性 change(array,0,k); } } return array[0]; } void smallRootHeaps(vector<int>&nums,int len) { for(int i=len/2;i>=0;i--) { change(nums,i,len); } } void change(vector<int>&nums,int i,int len) { int left_child=i*2+1; int right_child=i*2+2; int min=i; if(left_child<len&&nums[left_child]<nums[min]) min=left_child; if(right_child<len&&nums[right_child]<nums[min]) min=right_child; if(min!=i){ int temp=nums[i]; nums[i]=nums[min]; nums[min]=temp; change(nums,min,len); } } };
|
执行用时:96 ms, 在所有 C++ 提交中击败了50.23%的用户 内存消耗:46.1 MB, 在所有 C++ 提交中击败了19.67%的用户 通过测试用例:39 / 39
|
对比使用大根堆,效率提升了一大截,因为除去调整小根堆和建堆的时间,效率接近O(n),但是由于使用了辅助数组,内存占用多了一点,也可以不用辅助数组而直接在nums的前k个位置建小根堆,比较简单,就不实现了。