AI+无人机如何守护濒危物种?YOLOv8实现95%精准识别

news2025/6/12 12:44:46

【导读】

野生动物监测在理解和保护生态系统中发挥着至关重要的作用。然而,传统的野生动物观察方法往往耗时耗力、成本高昂且范围有限。无人机的出现为野生动物监测提供了有前景的替代方案,能够实现大范围覆盖并远程采集数据。尽管具备这些优势,但通过航拍图像有效检测和识别小型或伪装的野生动物物种(如鹿)仍面临挑战。本研究分析了人工智能技术在航拍图像中自动识别鹿的应用,从而解决野生动物保护中的关键难题。>>更多资讯可加入CV技术群获取了解哦~

在广袤的潘帕斯草原和巴拉那河三角洲,濒危鹿类正因栖息地破坏而日益稀少。传统的人工监测方式不仅耗时耗力,还难以覆盖复杂地形。阿根廷研究团队最新成果显示,通过高分辨率无人机航拍和YOLOv8深度学习算法,仅需3小时43分钟就能完成近4万张航拍图像的鹿群筛查,准确率高达95%。这项技术如何从实验室走向荒野?

图片1.png

论文标题:

Efficient Endangered Deer Species Monitoring with UAV Aerial Imagery and Deep Learning

论文链接:

https://arxiv.org/pdf/2506.00164


目录

一、摘要

二、研究方法

相关研究

数据采集

数据处理

千款模型+海量数据,开箱即用!

三、结果

检测评估

发现未标注的鹿

潘帕斯鹿的评估

无需代码,训练结果即时可见!

从实验到落地,全程高速零代码!

四、结论


一、摘要

本文探讨了利用无人机(UAV)和深度学习技术在自然栖息地中检测濒危鹿类物种的应用。由于传统识别流程需要经过专业培训的人工操作,这在资源和时间上都可能造成高昂成本,因此亟需更高效的解决方案。通过利用高分辨率航拍影像,应用先进计算机视觉技术实现鹿类自动识别。研究团队基于YOLO框架开发了定制算法,并利用无人机拍摄的图像数据集进行训练。研究结果表明,该算法能以高精度有效识别沼泽鹿,并初步验证了其在潘帕斯鹿识别中的应用潜力,尽管仍存在一定局限性。本研究不仅支持当前保护工作,还凸显了将人工智能与无人机技术整合以提升野生动物监测与管理实践的潜力。


二、研究方法

采用了一种结构化的方法,涵盖数据的采集与处理,以及先进深度学习技术在野生动物检测中的应用。

  • 相关研究

由于多种因素,如标志性物种的非法猎杀增加以及自然环境的改变,越来越多的物种面临灭绝威胁。栖息地快速丧失和环境退化加剧了这一局面,因此对野生动物进行定期监测至关重要,以理解那些变化速度超过野生动物群落正常变迁的进程。为简化观测任务并降低成本,无人机(UAV)已被用于此类任务多年。

无人机在野生动物观测中的应用已超过十年。本研究采用YOLOv8模型对无人机获取的图像中的沼泽鹿进行检测。该方法专门针对沼泽鹿的检测,但所用数据集还包含牛、水豚和鸟类等其他动物的图像,这表明该模型在检测过程中能够处理多样化的野生动物。这一方法代表了基于无人机野生动物监测领域的重大进展,通过将深度学习技术与实际应用相结合,提升了保护工作成效。

  • 数据采集

使用某些工具进行野生动物自动检测的关键在于拥有足够丰富的数据库来训练算法。本研究中,Pantano 项目框架内获取的信息可供使用。

此外,还在PNCDT进行了调查,并从不同车辆获取了鹿的航拍图像。尽管该数据库的规模不如Pantano项目,但它对于验证在特定栖息地针对某一鹿科物种训练的网络如何将学习成果推广到具有不同特征和栖息地的另一物种具有实用价值。

  • 使用的车辆和摄像头:

Pantano项目:为收集用于创建Pantano项目数据库的数据,使用了配备高分辨率2000万像素摄像头(84°视场角、8.8/24毫米镜头、1米距离下自动对焦范围为f/2.8至f/11)的Phantom 4 Pro四旋翼无人机,该摄像头安装于三轴稳定器上。该无人机可自动执行飞行任务,通过DJI专有软件加载飞行路线,起飞后从起飞点沿预设路线飞行,地面操作员远程监控。

在本研究中,热成像摄像头获取的信息未用于网络训练,因为目前缺乏足够的鹿类热成像数据。然而,计划开展更多飞行任务以覆盖更广区域并获取更多鹿类热成像数据,因现有结果显示出良好前景。

如图1和图2所示,展示了在PNCDT的一次飞行中,六旋翼无人机摄像头在可见光谱和热成像光谱下拍摄的图像对比。在图1中,即使放大图像(该图像来自1080p视频的帧),也几乎无法检测到鹿。相比之下,如图2所示,同一场景通过热成像视频捕捉时,两只鹿的轮廓清晰可见。

图片2.png

图片3.png

在RGB视频中,由于鹿的运动,可以检测到它们,但分析单帧时则无法检测到。在某些情况下,动态信息可用于检测动物,但理想情况下,鹿不应因无人机存在而受到惊扰,因此大多数视频两辆无人机的自动驾驶仪均为Pixhawk v2.4.8,每辆无人机均配置了PX4固件。使用QGroundControl软件对无人机进行配置并编程任务。

  • 航线:

Pantano项目:2019年5月16日至17日,开展了一项初步探索性研究,期间执行了六次飞行计划(总飞行距离为19.5公里)。这些飞行旨在测试不同的飞行参数(即速度、高度)和图像采集时间,以最大限度地提高在研究区域内各种生境类型中区分沼泽鹿与其环境的概率。基于分析结果,确定了以下参数:地面以上45米高度(对应67.5米宽的航线)、6.5米/秒的速度,以及每5秒拍摄一张照片,连续照片之间约有33%的前向重叠。在选择的航线参数下,未观察到鹿在无人机接近时出现逃跑行为。

WiMoBo项目:PNCDT的首次飞行于2022年12月底进行。在此初始阶段,使用四旋翼无人机(特别是DJI型号)进行了多次飞行试验,在不同高度观察鹿群在无人机存在下的行为。主要目标是确定一个不会打扰鹿群的飞行高度。根据对鹿群行为的观察,得出结论认为,为防止鹿群因无人机存在而感到威胁,最低飞行高度需达到海拔25米。然而,需特别指出的是,此初步分析仅适用于DJI四旋翼无人机,可能不适用于其他类型航空器。

  • 数据处理

在Pantano项目框架内进行的飞行任务中,共获取了39,798张照片,分为575个样带。这些照片由4名专家科学家和168名经过培训的志愿者进行人工审查,并记录了其中出现沼泽鹿的照片。每位观察员分析了一组照片,遵循标准化流程:通过数字放大照片,从左至右、从上至下搜索沼泽鹿。通过比较连续重叠的照片以避免重复计数。每张照片均由至少两名独立观察员进行验证。所有观察员记录的沼泽鹿总数(排除同一只个体被多名观察员重复检测的情况)用于估算沼泽鹿的密度。

观察员在分析的照片中总共识别出231只鹿。此外,在此次工作中,还识别出88张包含牛的照片,由于牛与鹿在体型和颜色上相似,可能被误认为是鹿。三张照片中捕捉到了其他动物(两只水豚和一只鸟)。

部分图像可参见图3。值得注意的是,分析还发现了一张未被观察者初始标注的鹿类图像。该发现的详细结果将在结果部分讨论。

图片4.png

为232张阳性鹿类图像生成了掩膜,以精确识别鹿类所占用的像素。使用140张带有鹿及其对应遮罩的图像、54张带有牛的图像、3张带有其他动物的图像以及575张没有动物的图像(每条样带一张)对YOLOv8n-seg模型进行了微调。在训练过程中,使用了一个验证集,其中包含46张带有鹿的图像、17张带有牛的图像以及575张没有动物的图像(每条样带一张)。网络在将图像缩放至1280×1280像素后进行训练,允许图像以任意角度翻转和旋转。同时规定两只鹿的实例不得重叠。模型训练共进行了440个 epoch,在第340个 epoch时在验证集上达到了最优效果。整个训练过程耗时约6小时28分钟(23,252秒)完成。

如果你也想要使用模型进行训练或改进Coovally——新一代AI开发平台,为研究者和产业开发者提供极简高效的AI训练与优化体验!Coovally支持计算机视觉全任务类型,包括目标检测、文字识别、实例分割等全新任务类型。

  • 千款模型+海量数据,开箱即用!

平台汇聚国内外开源社区超1000+热门模型,覆盖YOLO系列、Transformer、ResNet等主流视觉算法。同时集成300+公开数据集,涵盖图像分类、目标检测、语义分割等场景,一键下载即可投入训练,彻底告别“找模型、配环境、改代码”的繁琐流程!

IMG_2734.GIF


三、结果

以下各节对研究结果进行了全面分析,展示了所开发检测算法的性能及其影响。

  • 检测评估

系统的性能采用标准目标检测指标进行评估。以下所有结果均基于包含46张鹿图像、17张牛图像及575张无动物图像的测试集进行测试。该数据集中的所有图像均未在模型训练或验证过程中出现。

在配备Nvidia T4 GPU的服务器上运行时,该模型对39,798张图像进行检测耗时3小时43分钟,相当于每秒处理近3张图像。

作为初步评估,在不同置信度阈值下测量了mAP10。选择10%的IoU是因为鹿在图像中占据的区域非常小,且鹿的完美构图对本问题无关紧要。

因此,在图4中可以看到,最大化mAP10的置信度阈值为0.260。图5显示了在此置信度阈值下的精确率-召回率曲线。

图片5.png

图片6.png

使用选定的最佳阈值,统计模型在测试集每张图像中检测到的鹿的数量。生成的混淆矩阵如图6所示。

图片7.png

  • 发现未标注的鹿

在观察者进行的全面审查过程中,成功识别并分类了大量鹿。然而,基于YOLOv8的检测模型凭借其先进能力,识别出一个此前未标注的鹿,如图7所示。

图片8.png

这一案例在分析的早期迭代中被发现。它凸显了将自动化检测系统与人类观察相结合的实用性,尤其是在大规模数据集中,其中细微细节可能极具挑战性且难以一致识别。

  • 潘帕斯鹿的评估

在沼泽鹿数据库上训练的模型在潘帕斯鹿数据上进行了评估,两者在颜色上存在差异,尤其是在鹿的下部区域,潘帕斯鹿颜色较浅,而沼泽鹿则更偏棕色,如图8所示。

图片9.png

此外,潘帕斯鹿的图像并非从鸟瞰视角拍摄。模型能够在阈值接近0.1时检测到部分潘帕斯鹿(见图9),这表明虽然模型能够识别潘帕斯鹿,但存在一定局限性。

图片10.png

  • 无需代码,训练结果即时可见!

在Coovally平台上,上传数据集、选择模型、启动训练无需代码操作,训练结果实时可视化,准确率、损失曲线、预测效果一目了然。无需等待,结果即训即看,助你快速验证算法性能!

图片

  • 从实验到落地,全程高速零代码!

无论是学术研究还是工业级应用,Coovally均提供云端一体化服务:

  • 免环境配置:直接调用预置框架(PyTorch、TensorFlow等);

  • 免复杂参数调整:内置自动化训练流程,小白也能轻松上手;

  • 高性能算力支持:分布式训练加速,快速产出可用模型;

  • 无缝部署:训练完成的模型可直接导出,或通过API接入业务系统。

!!点击下方链接,立即体验Coovally!!

平台链接:https://www.coovally.com

无论你是算法新手还是资深工程师,Coovally以极简操作与强大生态,助你跳过技术鸿沟,专注创新与落地。访问官网,开启你的零代码AI开发之旅!


四、结论

从野生动物监测到农业遥感、城市管理再到灾害预警,无人机与计算机视觉的融合正逐步构建一个“可感知的世界”。此次基于YOLOv8的濒危物种识别研究,既是科研创新的典范,也折射出智能边缘设备在实际场景中的落地能力。随着算法持续进化、硬件日趋轻量,无人机将成为未来“数据生产前沿”的关键节点,推动生态保护、环境治理乃至公共决策走向更加智能和精准的时代。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2407227.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MFC 抛体运动模拟:常见问题解决与界面美化

在 MFC 中开发抛体运动模拟程序时,我们常遇到 轨迹残留、无效刷新、视觉单调、物理逻辑瑕疵 等问题。本文将针对这些痛点,详细解析原因并提供解决方案,同时兼顾界面美化,让模拟效果更专业、更高效。 问题一:历史轨迹与小球残影残留 现象 小球运动后,历史位置的 “残影”…

云原生安全实战:API网关Kong的鉴权与限流详解

🔥「炎码工坊」技术弹药已装填! 点击关注 → 解锁工业级干货【工具实测|项目避坑|源码燃烧指南】 一、基础概念 1. API网关(API Gateway) API网关是微服务架构中的核心组件,负责统一管理所有API的流量入口。它像一座…

【C++特殊工具与技术】优化内存分配(一):C++中的内存分配

目录 一、C 内存的基本概念​ 1.1 内存的物理与逻辑结构​ 1.2 C 程序的内存区域划分​ 二、栈内存分配​ 2.1 栈内存的特点​ 2.2 栈内存分配示例​ 三、堆内存分配​ 3.1 new和delete操作符​ 4.2 内存泄漏与悬空指针问题​ 4.3 new和delete的重载​ 四、智能指针…

vulnyx Blogger writeup

信息收集 arp-scan nmap 获取userFlag 上web看看 一个默认的页面,gobuster扫一下目录 可以看到扫出的目录中得到了一个有价值的目录/wordpress,说明目标所使用的cms是wordpress,访问http://192.168.43.213/wordpress/然后查看源码能看到 这…

基于IDIG-GAN的小样本电机轴承故障诊断

目录 🔍 核心问题 一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) ​梯度归一化(Gradient Normalization)​​ (2) ​判别器梯度间隙正则化(Discriminator Gradient Gap Regularization)​​ (3) ​自注意力机制(Self-Attention)​​ 3. 完整损失函数 二…

【JVM面试篇】高频八股汇总——类加载和类加载器

目录 1. 讲一下类加载过程? 2. Java创建对象的过程? 3. 对象的生命周期? 4. 类加载器有哪些? 5. 双亲委派模型的作用(好处)? 6. 讲一下类的加载和双亲委派原则? 7. 双亲委派模…

push [特殊字符] present

push 🆚 present 前言present和dismiss特点代码演示 push和pop特点代码演示 前言 在 iOS 开发中,push 和 present 是两种不同的视图控制器切换方式,它们有着显著的区别。 present和dismiss 特点 在当前控制器上方新建视图层级需要手动调用…

LLMs 系列实操科普(1)

写在前面: 本期内容我们继续 Andrej Karpathy 的《How I use LLMs》讲座内容,原视频时长 ~130 分钟,以实操演示主流的一些 LLMs 的使用,由于涉及到实操,实际上并不适合以文字整理,但还是决定尽量整理一份笔…

RabbitMQ入门4.1.0版本(基于java、SpringBoot操作)

RabbitMQ 一、RabbitMQ概述 RabbitMQ RabbitMQ最初由LShift和CohesiveFT于2007年开发,后来由Pivotal Software Inc.(现为VMware子公司)接管。RabbitMQ 是一个开源的消息代理和队列服务器,用 Erlang 语言编写。广泛应用于各种分布…

DingDing机器人群消息推送

文章目录 1 新建机器人2 API文档说明3 代码编写 1 新建机器人 点击群设置 下滑到群管理的机器人,点击进入 添加机器人 选择自定义Webhook服务 点击添加 设置安全设置,详见说明文档 成功后,记录Webhook 2 API文档说明 点击设置说明 查看自…

[免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】

大家好,我是java1234_小锋老师,看到一个不错的微信小程序问卷调查系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】,分享下哈。 项目视频演示 【免费】微信小程序问卷调查系统(SpringBoot后端Vue管理端) Java毕业设计_哔哩哔哩_bilibili 项…

Selenium常用函数介绍

目录 一,元素定位 1.1 cssSeector 1.2 xpath 二,操作测试对象 三,窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口 四,弹窗 五,等待 六,导航 七,文件上传 …

在Mathematica中实现Newton-Raphson迭代的收敛时间算法(一般三次多项式)

考察一般的三次多项式,以r为参数: p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]; 此多项式的根为: 尽管看起来这个多项式是特殊的,其实一般的三次多项式都是可以通过线性变换化为这个形式…

华为OD机考-机房布局

import java.util.*;public class DemoTest5 {public static void main(String[] args) {Scanner in new Scanner(System.in);// 注意 hasNext 和 hasNextLine 的区别while (in.hasNextLine()) { // 注意 while 处理多个 caseSystem.out.println(solve(in.nextLine()));}}priv…

莫兰迪高级灰总结计划简约商务通用PPT模版

莫兰迪高级灰总结计划简约商务通用PPT模版,莫兰迪调色板清新简约工作汇报PPT模版,莫兰迪时尚风极简设计PPT模版,大学生毕业论文答辩PPT模版,莫兰迪配色总结计划简约商务通用PPT模版,莫兰迪商务汇报PPT模版,…

力扣热题100 k个一组反转链表题解

题目: 代码: func reverseKGroup(head *ListNode, k int) *ListNode {cur : headfor i : 0; i < k; i {if cur nil {return head}cur cur.Next}newHead : reverse(head, cur)head.Next reverseKGroup(cur, k)return newHead }func reverse(start, end *ListNode) *ListN…

如何更改默认 Crontab 编辑器 ?

在 Linux 领域中&#xff0c;crontab 是您可能经常遇到的一个术语。这个实用程序在类 unix 操作系统上可用&#xff0c;用于调度在预定义时间和间隔自动执行的任务。这对管理员和高级用户非常有益&#xff0c;允许他们自动执行各种系统任务。 编辑 Crontab 文件通常使用文本编…

2025年渗透测试面试题总结-腾讯[实习]科恩实验室-安全工程师(题目+回答)

安全领域各种资源&#xff0c;学习文档&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具&#xff0c;欢迎关注。 目录 腾讯[实习]科恩实验室-安全工程师 一、网络与协议 1. TCP三次握手 2. SYN扫描原理 3. HTTPS证书机制 二…

uniapp手机号一键登录保姆级教程(包含前端和后端)

目录 前置条件创建uniapp项目并关联uniClound云空间开启一键登录模块并开通一键登录服务编写云函数并上传部署获取手机号流程(第一种) 前端直接调用云函数获取手机号&#xff08;第三种&#xff09;后台调用云函数获取手机号 错误码常见问题 前置条件 手机安装有sim卡手机开启…

【Linux】Linux 系统默认的目录及作用说明

博主介绍&#xff1a;✌全网粉丝23W&#xff0c;CSDN博客专家、Java领域优质创作者&#xff0c;掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域✌ 技术范围&#xff1a;SpringBoot、SpringCloud、Vue、SSM、HTML、Nodejs、Python、MySQL、PostgreSQL、大数据、物…