【高频面试题】数组中的第K个最大元素(堆、快排进阶)

news2025/6/2 3:35:31

文章目录

    • 数组中的第K个最大元素
      • 题目描述
      • 示例1
      • 示例2
      • 提示:
    • 解法1(堆维护前k大元素)
    • 解法2 手写堆维护
    • 解法3(快速选择算法)
    • 例题:P1923 【深基9.例4】求第 k 小的数
    • 参考

数组中的第K个最大元素

题目描述

给定整数数组 n u m s nums nums和整数 k k k,请返回数组中第 k k k 个最大的元素。
请注意,你需要找的是数组排序后的第 k k k 个最大的元素,而不是第 k k k 个不同的元素。
你必须设计并实现时间复杂度为 O ( n ) O(n) O(n)的算法解决此问题。

示例1

输入: [3,2,1,5,6,4], k = 2
输出: 5

示例2

输入: [3,2,3,1,2,4,5,5,6], k = 4
输出: 4

提示:

  • 1 < = k < = n u m s . l e n g t h < = 10 5 1 <= k <= nums.length <= 10^5 1<=k<=nums.length<=105
  • − 10 4 < = n u m s [ i ] < = 10 4 -10^4 <= nums[i] <= 10^4 104<=nums[i]<=104

解法1(堆维护前k大元素)

时间复杂度 O ( n l o g k ) O(nlogk) Onlogk 空间复杂度 O ( k ) O(k) Ok)

class Solution {
public:
    int findKthLargest(vector<int>& nums, int k) {
        priority_queue<int, vector<int>, greater<int>> pq; 
        for(auto& num: nums){
            pq.emplace(num);
            if(pq.size() > k){
                pq.pop();   // 堆中元素超过k个,弹出最小的那个
            }
        }
        return pq.top();   
    }
};

解法2 手写堆维护

思路:

  • n u m s nums nums种存放二叉堆,索引 [ 0 , n − 1 ] [0,n - 1] [0,n1]对应按层序遍历对应的元素,对于下标从0开始的某节点 i i i,左右孩子节点编号分别为 i ∗ 2 + 1 , i ∗ 2 + 2 i*2+1,i*2+2 i2+1,i2+2
  • 下沉操作: m a x H e a p i f y maxHeapify maxHeapify操作为将二叉堆数组 n u m s nums nums索引 i i i处元素下沉
  • 建堆操作:我们从最后一个非叶子节点 h e a p S i z e / 2 − 1 heapSize / 2-1 heapSize/21开始倒序遍历,从下往上下沉
  • 删除操作:每次将堆顶交换到数组末尾,再将 h e a p S i z e heapSize heapSize减一,最后再调整新的堆顶即可
  • 时间复杂度 O ( n l o g n ) O(nlogn) Onlogn 空间复杂度 O ( l o g n ) O(logn) Ologn) 因为最大堆需要维护n个结点
class Solution {
public:
	// down 
    void maxHeapify(vector<int>& a, int i, int heapSize) {
        int l = i * 2 + 1, r = i * 2 + 2, largest = i;
        if (l < heapSize && a[l] > a[largest]) {
            largest = l;
        }
        if (r < heapSize && a[r] > a[largest]) {
            largest = r;
        }
        if (largest != i) {
            swap(a[i], a[largest]);
            maxHeapify(a, largest, heapSize);
        }
    }
    // initialize 
    void buildMaxHeap(vector<int>& a, int heapSize) {
        for (int i = heapSize / 2 - 1; i >= 0; i--) {
            maxHeapify(a, i, heapSize);
        }
    }
    int findKthLargest(vector<int>& nums, int k) {
        int heapSize = nums.size();
        buildMaxHeap(nums, heapSize); // 建堆
        // 执行k-1次提取最大值操作
        for (int i = nums.size() - 1; i >= nums.size() - k + 1; i--) {
            swap(nums[0], nums[i]);   // 调整堆顶
            -- heapSize;              // 删除堆
            maxHeapify(nums, 0, heapSize); 
        }
        return nums[0];
    }
};

解法3(快速选择算法)

我们首先来回顾一下快排的实现

void quickSort(vector<int>& nums, int l, int r) {
    if (l >= r) return;
    // - i 初始在左边界左侧(l-1)
    // - j 初始在右边界右侧(r+1)
    // - 基准值 x 选中间元素(避免极端情况如全排序数组导致最坏时间复杂度)
    int i = l - 1, j = r + 1;
    int x = nums[(l + r) >> 1]; // 位运算代替 (l + r) / 2,等价且更高效
    // partition :双指针从两端向中间移动
    while (i < j) {
    	// 移动左指针 i:跳过所有小于 x 的元素,直到找到 >=x 的元素
        do i++; while (nums[i] < x); 
        // 移动右指针 j:跳过所有大于 x 的元素,直到找到 <=x 的元素
        do j--; while (nums[j] > x);
        //  如果指针未交错,交换左右指针的元素(确保左边 <=x,右边 >=x)
        if (i < j) swap(nums[i], nums[j]);
    }
    // 4. 递归排序左右子数组:
    quickSort(nums, l, j), quickSort(nums, j + 1, r);
}
  • 快速选择( Q u i c k s e l e c t Quickselect Quickselect)算法是一种用于在未排序的列表中找到第k小(或第k大)元素的高效算法。与快速排序一样,它使用分治策略,但不同于快速排序的是,它只递归处理包含目标元素的那一部分,而不是全部。这使得快速选择的平均时间复杂度为 O ( n ) O(n) O(n),最坏情况为 O ( n 2 ) O(n^2) O(n2),但在实际应用中,通过随机化选取枢轴( p i v o t pivot pivot)可以避免最坏情况。
  • 复杂度:递归时,每层时间复杂度为 O ( n ) O(n) O(n),但并不是都进入左右两部分递归。仅进入一侧递归在平均情况下 数组长度会减半,故平均情况下的时间复杂度为 n + n / 2 + n / 4 + … + 1 = O ( n ) n+n/2+n/4+…+1=O(n) n+n/2+n/4++1=O(n)

以下是快速选择实现找第K大元素的具体实现:

class Solution {
public:
    int quick_select(vector<int>& nums, int l, int r, int k) {
        if (l == r) return nums[k];
        int i = l - 1, j = r + 1, x = nums[l + r >> 1]; // 若选取nums[l], 极端样例 时间会很久
        //int x = nums[rand() % (r - l + 1) + l], i = l - 1, j = r + 1; // 随机选取
        while (i < j) {
            do i ++ ; while (nums[i] > x); // 注意是第k大 上面的模板是升序排序
            do j -- ; while (nums[j] < x);
            if (i < j) swap(nums[i], nums[j]);
        }
        if (k <= j) return quick_select(nums, l, j, k);
        else return quick_select(nums, j + 1, r, k);
    }

    int findKthLargest(vector<int>& nums, int k) {
        //srand(time(0)); // 随机种子
        return quick_select(nums, 0, nums.size() - 1, k - 1); // 0-base
    }
};

例题:P1923 【深基9.例4】求第 k 小的数

#include <bits/stdc++.h>

using namespace std;

const int N = 5e6 + 7;

int n, k;
int a[N];

int quick_select(int nums[], int l, int r, int k) {
    if (l == r) return nums[k];
    int x = nums[l], i = l - 1, j = r + 1;
    while (i < j) {
    	// paration 方向改一下即可
        do i ++; while (nums[i] < x); 
        do j --; while (nums[j] > x);
        if (i < j) swap(nums[i], nums[j]);
    }
    if (k <= j) return quick_select(nums, l, j, k);
    else return quick_select(nums, j + 1, r, k);
}

int main() {
    scanf("%d%d", &n, &k);
    //getchar();
    for (int i = 0; i < n; i++) {
        scanf("%d", &a[i]);
    }
    printf("%d\n", quick_select(a, 0, n - 1, k));
    return 0;
}

参考

  • LeetCode官方题解:数组中的第K个最大元素
  • yxc常用代码模板1——基础算法
  • LeetCode 215. 数组中的第K个最大元素

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2393272.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一篇文章玩转CAP原理

CAP 原理是分布式系统设计的核心理论之一&#xff0c;揭示了系统设计中的 根本性权衡。 一、CAP 的定义 CAP 由三个核心属性组成&#xff0c;任何分布式系统最多只能同时满足其中两个&#xff1a; 一致性&#xff08;Consistency&#xff09; 所有节点在同一时刻看到的数据完全…

Vue-收集表单信息

收集表单信息 Input label for 和 input id 关联, 点击账号标签 也能聚焦 input 代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><title>表单数据</title><!-- 引入Vue --><scrip…

vscode开发stm32,main.c文件中出现很多报错影响开发解决日志

本质上为 .vscode/c_cpp_properties.json文件和Makefile文件中冲突&#xff0c;两者没有同步。 将makefile文件中的内容同步过来即可&#xff0c;下面给出一个json文件的模板&#xff0c;每个人的情况不同&#xff0c;针对性修改即可 {"configurations": [{"na…

嵌入式鸿蒙系统中水平和垂直以及图片调用方法

利用openharmony操作的具体现象: 第一:Column 作用:沿垂直方向布局的容器。 第二:常用接口 Column(value?: {space?: string | number}) 参数: 参数名参数类型必填参数描述spacestring | number否纵向布局元素垂直方向间距。 从API version 9开始,space为负数或者ju…

【海康USB相机被HALCON助手连接过后,MVS显示无法连接故障。】

在Halcon里使用助手调用海康USB相机时&#xff0c;如果这个界面点击了【是】 那么恭喜你&#xff0c;相机只能被HALCON调用使用&#xff0c;使用MVS或者海康开发库&#xff0c;将查找不到相机 解决方式&#xff1a; 右键桌面【此电脑】图标 ->选择【管理】 ->选择【设备…

2025年电气工程与轨道交通国际会议:绿色能源与智能交通的创新之路

2025年电气工程与轨道交通国际会议&#xff08;ICEERT 2025&#xff09;是一场电气工程与轨道交通领域的国际盛会&#xff0c;将于2025年在武汉隆重召开。此次会议汇聚了全球顶尖的专家学者和行业精英&#xff0c;共同探讨电气工程与轨道交通的最新研究成果和技术趋势。会议将围…

WPF log4net用法

WPF log4net用法 一、在工程中管理NuGet程序包&#xff0c;找到log4net&#xff0c;点击安装&#xff0c;如下图已成功安装&#xff1b; 二、在工程中右键添加新建项&#xff0c;选择应用程序配置文件&#xff08;后缀为.config&#xff09;,然后设置名称&#xff0c;这里设置…

数字孪生数据监控如何提升汽车零部件工厂产品质量

一、汽车零部件工厂的质量挑战 汽车零部件作为汽车制造的基础&#xff0c;其质量直接关系到整车的性能、可靠性和安全性。在传统的汽车零部件生产过程中&#xff0c;质量问题往往难以在早期阶段被发现和解决&#xff0c;导致生产效率低下、生产成本上升&#xff0c;甚至影响到…

贪心算法实战3

文章目录 前言区间问题跳跃游戏跳跃游戏II用最少数量的箭引爆气球无重叠区间划分字母区间合并区间 最大子序和加油站监控二叉树 前言 今天继续带大家进行贪心算法的实战篇3&#xff0c;本章注意来解答一些运用贪心算法的比较难的问题&#xff0c;大家好好体会&#xff0c;怎么…

实测,大模型谁更懂数据可视化?

大家好&#xff0c;我是 Ai 学习的老章 看论文时&#xff0c;经常看到漂亮的图表&#xff0c;很多不知道是用什么工具绘制的&#xff0c;或者很想复刻类似图表。 实测&#xff0c;大模型 LaTeX 公式识别&#xff0c;出乎预料 前文&#xff0c;我用 Kimi、Qwen-3-235B-A22B、…

Linux入门(十一)进程管理

Linux 中每个执行的程序都称为一个进程&#xff0c;每个进程都分配一个ID号&#xff08;PID&#xff09; 每个进程都可能以两种方式存在&#xff0c;前台&#xff08;屏幕上可以操作的&#xff09;和后台&#xff08;屏幕上无法看到的&#xff09;&#xff0c;一般系统的服务都…

【技能篇】RabbitMQ消息中间件面试专题

1. RabbitMQ 中的 broker 是指什么&#xff1f;cluster 又是指什么&#xff1f; 2. 什么是元数据&#xff1f;元数据分为哪些类型&#xff1f;包括哪些内容&#xff1f;与 cluster 相关的元数据有哪些&#xff1f;元数据是如何保存的&#xff1f;元数据在 cluster 中是如何分布…

Linux研学-环境搭建

一 概述 1 Linux 概述 Linux系统由内核、Shell、文件系统、应用程序及系统库等关键部分组成。内核作为核心&#xff0c;管理硬件资源与系统服务&#xff1b;Shell提供用户与系统交互的命令行界面&#xff0c;让用户能便捷执行操作&#xff1b;文件系统负责数据的存储、组织与管…

Ubuntu系统下可执行文件在桌面单击运行教程

目录 ​编辑 操作环境&#xff1a;这个可执行文件在原目录下还有它的依赖文件 1&#xff0c;方法1&#xff1a;创建启动脚本 操作步骤​&#xff1a; &#xff08;1&#xff09;​​在桌面创建脚本文件​​&#xff08;如 run_main_improve.sh&#xff09;&#xff1a; ​…

Linux之文件进程间通信信号

Linux之文件&进程间通信&信号 文件文件描述符文件操作重定向缓冲区一切皆文件的理解文件系统磁盘物理结构&块文件系统结构 软硬链接 进程间通信匿名管道命名管道system V共享内存 信号 文件 首先&#xff0c;Linux下一切皆文件。对于大量的文件&#xff0c;自然要…

代码随想录算法训练营 Day61 图论ⅩⅠ Floyd A※ 最短路径算法

图论 题目 97. 小明逛公园 本题是经典的多源最短路问题。 在这之前我们讲解过&#xff0c;dijkstra朴素版、dijkstra堆优化、Bellman算法、Bellman队列优化&#xff08;SPFA&#xff09; 都是单源最短路&#xff0c;即只能有一个起点。 而本题是多源最短路&#xff0c;即求多…

改写自己的浏览器插件工具 myChromeTools

1. 起因&#xff0c; 目的: 前面我写过&#xff0c; 自己的一个浏览器插件小工具 最近又增加一个小功能&#xff0c;可以自动滚动页面&#xff0c;尤其是对于那些瀑布流加载的网页。最新的代码都在这里 2. 先看效果 3. 过程: 代码 1, 模拟鼠标自然滚动 // 处理滚动控制逻辑…

python-pptx去除形状默认的阴影

文章目录 效果原理1. 阴影继承机制解析2. XML层操作细节3. 注意事项 扩展应用1. 批量去除阴影2. 复合效果控制 效果 右边这个是直接添加一个形状。可以看到它会默认被赋予一个阴影。 然而&#xff0c;这个东西在特定的场合&#xff0c;其实是我们所不需要的。 那怎么把这个阴…

kuboard自带ETCD存储满了处理方案

一、前言 当运行 ETCD 日志报 Erro: mvcc database space exceeded 时&#xff0c;说明 ETCD 存储不足了&#xff08;默认 ETCD 存储是 2G&#xff09;&#xff0c;配额会触发告警&#xff0c;然后 Etcd 系统将进入操作受限的维护模式。 通过下面命令可以查看 ETCD 存储使用情…

SpringBoot+tabula+pdfbox解析pdf中的段落和表格数据

一、前言 在日常业务需求中&#xff0c;往往会遇到解析pdf文件中的段落或者表格数据的需求。 常见的做法是使用 pdfbox 来做&#xff0c;但是它只能提取文本数据&#xff0c;没有我们在文件页面上面的那种结构化组织&#xff0c;文本通常是散乱的包含各种换行回车空格等格式&a…