精品题解 👉 九章刷题录👈 猛戳订阅

JZ3 - 数组中重复的数字

📜 目录：

「法一」暴力大法（BF）

「法二」排序 + 遍历

「法三」哈希集合

「法四」哈希无序集

「法五」原地哈希

「法六」Map 查字典大法

「法七」ST 数组

🔗 题目链接：数组中重复的数字

📚 题目描述：在一个长度为 $n$ 的数组里的所有数字都在 0 到 $n-1$ 的范围内。数组中某些数字是重复的，但不知道有几个数字是重复的。也不知道每个数字重复几次。请找出数组中任意一个重复的数字。例如，如果输入长度为 7 的数组 $[2,3,1,0,2,5,3]$ ，那么对应的输出是 2 或者 3。存在不合法的输入的话输出 -1。

数据范围： $0\leq n\leq 10000$
进阶：时间复杂度 $O(n)$ ，空间复杂度 $O(n)$

输入：[2,3,1,0,2,5,3]
返回值：2
说明：2或3都是对的

💭 模板：C

/**
 * 代码中的类名、方法名、参数名已经指定，请勿修改，直接返回方法规定的值即可
 *
 * 
 * @param numbers int整型一维数组 
 * @param numbersLen int numbers数组长度
 * @return int整型
 */
int duplicate(int* numbers, int numbersLen ) {
    // write code here
}

💭 模板：C++

class Solution {
public:
    /**
     * 代码中的类名、方法名、参数名已经指定，请勿修改，直接返回方法规定的值即可
     *
     * 
     * @param numbers int整型vector 
     * @return int整型
     */
    int duplicate(vector<int>& numbers) {
        // write code here
    }
};

「法一」暴力大法（BF）

💡 思路：内外双 for 暴力搜索

最容易想到的方法，简单粗暴，直接两层循环暴力遍历！外层循环依次选定一个数字作为锚点 (Anchor) 。内层循环遍历锚点数字之后的数字 (target)，当找到相同的数字时退出循环返回该数字 (target)。全部遍历完后仍未找到，按题目要求返回 -1 即可。

两层循环时间复杂度为 $O(n^2)$ ，空间复杂度为 $O(1)$ 。

……

💬 代码：C

int duplicate(int* numbers, int numbersLen ) {
    // 依次设置锚点
    for (int i = 0; i < numbersLen; i++) {
        // 遍历锚点之后的数字
        for (int j = i + 1; i < numbersLen; j++) {
            if (numbers[i] == numbers[j]) {
                return numbers[i];  // 找到了
            }
        }
    }
    return -1;  // 没找到
}

💬 代码：C++

class Solution {
public:
    int duplicate(vector<int>& numbers) {
        for (int i = 0; i < numbers.size(); i++) {
            for (int j = i + 1; j < numbers.size(); j++) {
                if (numbers[i] == numbers[j]) {
                    return numbers[i];  // 找到了
                }
            }
        }
        return -1;   // 没找到
    }
};

「法二」排序 + 遍历

💡 思路：排序后相同的元素会紧挨着

在允许修改原数组的前提下，我们可以尝试 "排序 + 遍历" 的方法，先对数组进行排序，因为排序后，相同的元素肯定是紧挨着的，如此一来，我们只需要一层循环遍历整个数组即可。遍历时将下标 $i$ 设置从 1 开始，依次和 $i-1$ 下标的元素做对比即可。

如果使用系统函数 sort，或手写堆排序等，排序所需时间复杂度为 $O(nlogN)$ ，随后只需遍历一次数组所以为 $O(n)$ ，所以总的时间复杂度为 $O(nlogN)$ ，空间复杂度为 $O(1)$ 。相较于 "法一" 的 $O(n^2)$ 的暴力，好多了。

💭 代码：C

    int cmp(const void* a, const void* b) {
        return (*(int*)a - * (int*)b);
    }
int duplicate(int* numbers, int numbersLen ) {
    // 使用qsort对数组进行升序排序
    qsort(numbers, numbersLen, sizeof(int), cmp);

    // 检查相邻元素是否相等
    for (int i = 1; i < numbersLen; i++) {
        if (numbers[i] == numbers[i - 1]) {
            return numbers[i];
        }
    }
    return -1;
}

我们可以使用简单快捷的 qsort 函数，使用此函数另写一个 cmp 函数即可。排序完毕后直接遍历数组检查相邻元素是否相等即可。

💭 代码：C++

class Solution {
public:
    int duplicate(vector<int>& numbers) {
        // 直接调用 sort 排序
        sort(numbers.begin(), numbers.end());
        
        // 遍历数组，前后挨个比对
        for (int i = 1; i < numbers.size(); i++) {
            // 如果前后元素一致
            if (numbers[i] == numbers[i - 1]) {
                return numbers[i];   // 找到了
            }
        }
        return -1;    // 没找到
    }
};

C++ 做排序就更方便了，直接调 sort 就行，传入 vector 的 begin 和 end 即可。

「法三」哈希集合

💡 思路：集合的元素是唯一的

稍稍思考一下，既然要找重复的元素，本质上就是看是否 unique (唯一)，这让我们想到了数学中的集合，可以利用 "集合元素是唯一的" 的特点。拿题目中的例子来说，如果我们以集合的方式存储一遍该数组，那么如果在存储过程中出现重复，那么不就找到我们想要的 target 了吗？

$[2,3,1,0,2,5,3]\rightarrow \left \{ 2,3,1,0,5,3 \right \}\, \, \setminus 2$

回到语言角度，我们可以考虑使用 set 集合，该容器底层是红黑树，该部分时间复杂度为 $O(logN)$ ，和 "法二" 一样只需遍历一遍数组即可，所以时间复杂度为 $O(n)$ ，由于使用 set 要额外开空间，在悲观情况下 (没有找到返回 -1) 需要将全部元素存入，因此空间复杂度为 $O(n)$ 。

遍历数组，我们可以通过 count 接口检查集合中是否存在该数字，如果已经存在，则说明找到重复的数字了，返回该数字即可。如果该数字不在集合中 (说明是第一次出现)，我们就用 insert 将该数字加入哈希表 (杂凑表) 中。遍历结束后仍未找到按题目要求我们返回 -1 即可。

那么只有两种情况：① 在集合中 ② 不在集合中，只需在循环内做一个简单的 if-else 即可。

💭 代码：C++ 实现

class Solution {
public:
    int duplicate(vector<int>& numbers) {
        set<int> s;
        for (int i = 0; i < numbers.size(); i++) {
             // 如果表中已经存在该数字 （count返回值1为存在，0不存在）
            if (s.count(numbers[i]) == 1) {
                return numbers[i];      // 找到了
            }
            else {    // 不存在，首次出现
                s.insert(numbers[i]);   // 记录到表中
            }
        }
        return -1;    // 没找到
    }
};

我们首先定义 set，模板设为 <int>。随后遍历整个数组，我们使用 count 接口来检查是否存在该数字。count 接收一个参数，此参数表示容器中是否存在需要检查的元素。count 的返回值：如果元素存在于容器中则返回1，否则返回 0。所以我们将当前数字传入 count，如果返回值为 1 则存在，返回即可。如果不存在我们就调用 insert，将当前数字传给 insert 将该数字添加到集合中即可。

「法四」哈希无序集

💡 思路：尝试把容器换成 unordered_set

此法属于「法三」的小优化，我们知道，set 的底层是红黑树，时间复杂度为 $O(logN)$ ，但而 unordered_set 的期望复杂度能够达到 $O(1)$ 。显然使用 unordered_set 更优。

我们来简单介绍一下该容器，unordered_set 即 无序集。是一种不按特定顺序存储唯一元素的关联容器，允许根据元素的值快速检索单个元素。在 unordered_set 内部的元素不会按任何顺序排序，而是通过元素值的 hash 值将元素分组放置到各个槽中，其采用 vector + list 开链法，能通过元素值快速访问各个对应的元素，均摊耗时为 $O(1)$ ，相较于「法三」的 set 有小小的提升。但还是要遍历一次数组，所以时间复杂度还是 $O(n)$ ，并且仍然额外开空间，所以空间复杂度为 $O(n)$ 。

unordered_set 我们仍然是用 count 来检查是否在 hash 表内，用 insert 来插入。和「法三」一样，只是容器换成了 unordered_set 而已。

⚡ 代码：C++ 实现

#include <unordered_set>
class Solution {
public:
    int duplicate(vector<int>& numbers) {
        unordered_set<int> u_set;
        for (int i = 0; i < numbers.size(); i++) {
            // 如果表中已经存在该数字 （count返回值1为存在，0不存在）
            if (u_set.count(numbers[i]) == 1) {
                return numbers[i];   // 找到了
            }
            else {   // 不存在，首次出现
                u_set.insert(numbers[i]);   // 记录到表中
            }
        }
        return -1;   // 没找到
    }
};

我们首先定义 unordered_set，模板设为 <int>。随后遍历整个数组，我们使用 count 接口来检查是否存在该数字，count 接收一个参数，此参数表示容器中是否存在需要检查的元素。如果元素存在于容器中则返回1，否则返回 0。所以我们将当前数字传入 count，如果返回值为 1 则存在，返回即可。如果不存在我们就调用 insert，将当前数字传给 insert 将该数字添加到集合中即可。

「法五」原地哈希

💡 思路：

再读一遍题干 —— "在一个长度为 $n$ 的数组里的所有数字都在 0 到 $n-1$ 的范围内" 可知：数组长度为 $n$ ，且数组中所有数字都在 $[0,n-1]$ 内，我们可以用 swap 函数将数组中的数对应到数组下标上。首先遍历整个数组：

① 如果 numbers[i] 等于下标 $i$ ，则判断下一个下标是否对应。

② 如果 numbers[i] 不等于下标 $i$ ，那么：

如果 numbers[i] == numbers[numbers[i]]，那么此时对应下标 $i$ 的 numbers[i] 已经对应，则说明出现了重复的数字。
否则 swap(numbers[numbers[i]], numbers[i])

③ 当遍历结束后都没有找到重复的数字，根据题目要求返回 -1。

时间复杂度为 $O(n)$ ，空间复杂度为 $O(n)$ 。

💬 代码：C++ 实现

class Solution {
public:
    int duplicate(vector<int>& numbers) {
        int i = 0;
        while (i < numbers.size()) {
            if (i == numbers[i]) {
                i++;
            }   
            else {
                if (numbers[numbers[i]] == numbers[i]) {
                    return numbers[i];
                }
                else {
                    // 交换
                    std::swap(numbers[numbers[i]], numbers[i]); 
                }
            }
        }
        return -1;
    }
};

「法六」Map 查字典大法

💡 思路：直接用 map 统计

在遍历的过程中使用 map 记录当前数字，存在就记为1，遍历前这个数如果已经存在则说明该数字重复。我们可以通过 count 来检查数字是否为 1，发现是 1 就说明找到了重复的了。

定义 map<int,int>，map 部分的时间复杂度为 $O(nlogN)$ ，遍历一遍数组是 $O(n)$ 。由于使用了
额外空间，空间复杂度为 $O(n)$ 。

当然，我们可以换用 unordered_map 容器，其期望复杂度为 $O(1)$ 。

💭 代码：C++ 实现

class Solution {
public:
    int duplicate(vector<int>& numbers) {
        map<int, int> m;
        for (int i = 0; i < numbers.size(); i++) {
            if (m.count(numbers[i]) > 0) {
                return numbers[i];
            }
            else {
                m[numbers[i]] = 1;
            }
        }
        return -1;
    }
};

⚡ 优化：使用 unorderd_map

class Solution {
public:
    /**
     * 代码中的类名、方法名、参数名已经指定，请勿修改，直接返回方法规定的值即可
     *
     * 
     * @param numbers int整型vector 
     * @return int整型
     */
    int duplicate(vector<int>& numbers) {
        unordered_map<int, int> m;
        for (int i = 0; i < numbers.size(); i++) {
            if (m.count(numbers[i]) > 0) {
                return numbers[i];
            }
            else {
                m[numbers[i]] = 1;
            }
        }
        return -1;
    }
};

「法七」ST 数组

💡 思路：ST 数组

在遍历数组时，使用 st 数组记录当前数字，如果该数存在则说明该数字重复。由于要遍历数组，时间复杂度为 $O(n)$ ，由于使用了额外的空间开辟了新的数组，大小取决于值域，空间复杂度为 $O(R(f))$ 。

💭 代码：C++ 实现

class Solution {
public:
    int duplicate(vector<int>& numbers) {
        bool st[10000] = { 0 };   // 初始化为0
        for (int i = 0; i < numbers.size(); i++) {
            if (st[ numbers[i] ] != 0) {   // 如果不为0
                return numbers[i];
            }
            st[ numbers[i] ] = 1;    // 设置为1
        }
        return -1;
    }
};

定义布尔数组 st 用来记录每个数字是否已经出现过，并将所有元素初始化为 0。然后我们循环遍历数组 numbers 中的每个元素。对于每个元素 numbers[i]，检查 st[numbers[i]] 是否为0。如果不为0，说明该元素已经出现过，就可以返回该元素作为重复的数字。如果 st[numbers[i]] 为0，表示该元素还未出现过，将 st[numbers[i]] 设置为1，表示该元素已经出现过。如果遍历完都没有找到重复的数字，根据题意返回 -1 即可。

📌 [ 笔者 ]   王亦优
📃 [ 更新 ]   2023.5.24
❌ [ 勘误 ]   /* 暂无 */
📜 [ 声明 ]   由于作者水平有限，本文有错误和不准确之处在所难免，
              本人也很想知道这些错误，恳望读者批评指正！

📜 参考资料

C++reference[EB/OL]. []. http://www.cplusplus.com/reference/.

Microsoft. MSDN(Microsoft Developer Network)[EB/OL]. []. .

百度百科[EB/OL]. []. https://baike.baidu.com/.

数组中重复的数字_牛客题霸_牛客网

【九章刷题录】C/C++：数组中重复的数字（JZ3）

JZ3 - 数组中重复的数字

「法一」暴力大法（BF）

「法二」排序 + 遍历

「法三」哈希集合

「法四」哈希无序集

「法五」原地哈希

「法六」Map 查字典大法

「法七」ST 数组

相关文章

北京筑龙作为软件服务商出席《国企阳光采购标准》研讨会

【Linux】线程同步

多台linux设备之间设置免密登陆

使用AWTK实现汽车仪表Cluster/DashBoard嵌入式开发概述

【vsomeip】vsomeip安装与入门案例

luatOS网站 lua语言学习练习题

【C++】运算符重载（日期类的实现）

接口自动化【六】——接口关联之jsonpath提取+设置全局变量+通用封装

mybatis 在当前项目中的实际应用及自定义分页的实现

OTA升级技术概览

欧拉公式——最令人着迷的公式之一

generate 和 summary 配合——解析 bingchat 逻辑

chatgpt赋能Python-python_span_抓取

Mac上安装多个版本的MySQL

【Error】Python3.7 No module named ‘_sqlite3‘ 解决方案

【LeetCode】169. 多数元素

CompletableFuture 异步编排如何使用？

【盘点】界面控件DevExpress WPF的几大应用程序主题

oracle WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK问题分析

c++ 11标准模板（STL） std::map(三）

【九章刷题录】C/C++：数组中重复的数字（JZ3）

JZ3 - 数组中重复的数字

「 法一 」暴力大法（BF）

「 法二 」排序 + 遍历

「 法三 」哈希集合

「 法四 」哈希无序集

「 法五 」原地哈希

「 法六 」Map 查字典大法

「 法七 」ST 数组

相关文章

「法一」暴力大法（BF）

「法二」排序 + 遍历

「法三」哈希集合

「法四」哈希无序集

「法五」原地哈希

「法六」Map 查字典大法

「法七」ST 数组