1080T、2080T、4070T显卡的深度学习性能测试和结论

news2025/7/30 23:01:15

先说结论:

4070T显卡FP32的训练和推理速度跟3090应该基本类似。但由于显存12G偏低,4070T不太适合如今的深度学习模型训练(新手列外,大部分模型都能训练起来,耗电也相对很低),更适合测试最新的一些算法效果(只用推理)。

环境:

pytorch环境:conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.6 -c pytorch -c conda-forge

测试代码:霹雳吧啦Wz的GitHub中的swin-L和FastRCNN。 

深度学习模型个人测试结果 

swin-L模型单位是 图像/秒,FastRCNN模型单位是 秒/图像

备注1:主流显卡的测评分

备注2:其他显卡的测试性能(SSD模型,FP32训练)

备注3:另一个网站上的综合评分

 备注4:各类GPU的FP16和FP8训练和推理性能

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== 编辑

感觉备注4和我真实测试的有较大差异,FP16的训练,4070ti竟然和2080Ti几乎一样,不知道为什么作者会得出此结论。

个人总结

  • timespy 4K跑分非常适合深度学习性能评估:作为经过本人验证,4070ti的深度学习性能(FP32训练和推理)相对1080T和2080T显卡的差异,几乎跟time spy 4K跑分差异几乎一致。至于FP16和FP8,还未测试。
  • 操作系统基本不影响显卡深度学习性能:Ubuntu 22.04和win11系统下,4070ti的训练和推理速度几乎一模一样。
  • 12G显存是硬伤:4070T相对3090速度上并不差,只是显存12G真的是硬伤,分类网络swin-L的batchsize都只能设为8(图像224*224)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/367819.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

记录一次ubuntu下配置ssh登录出现的问题

现象描述: 1. 配置完服务器端公钥和本地的私钥之后,ssh登录始终会让输入密码,用ssh -vvv rootip 查看发现发送密钥之后就没反应了。 本机debug info: debug1: Trying private key: C:\Users\wangc/.ssh/id_xxxx (私钥文件) debug3…

每日站会如何进行优化流程,更高效?

1、每日站会时间要求 每日站会是开发团队一个以15分钟为限的活动。每日站会每一天的上午9点准时在会议室举行。开会时间需要把握精准,并需要每天坚持进行站会讨论活动。 每日站会如何进行优化流程,更高效?​ 2、团队中站会的角色和职责…

Unity(三)--导入3d模型并实现UGUI界面上嵌入3d模型

Unity支持的常用模型格式及建模软件: 格式建模软件网格动画材质骨骼FBX3DMax,C4D,Blender,Maya等√√√√OBJ3DMax,C4D,Blender,Maya等√目录 导入模型并调整好位置创建2D场景(UGUI)使3d模型显示在图片前面方法一:使用Render Texture注意点导入模型并调整好位置 以FBX为例,…

SAP MM 物料管理模块入门学习笔记 2023.2.24

https://zhuanlan.zhihu.com/p/555022893 SAP 企业组织结构 SAP 物料管理模块企业组织结构从上到下分为 集团——》公司——》工厂——》库存地点 集团:SAP 系统组织结构最高级别:内部包括一个完整的SAP系统全部数据 公司代码: 标识集团内一…

【Kubernetes 企业项目实战】09、Rancher 2.6 管理 k8s-v1.23 及以上版本高可用集群

目录 一、Rancher 介绍 1.1Rancher简介 1.2 Rancher 和 k8s 的区别 1.3 Rancher 企业使用案例 二、安装 Rancher 2.1 初始化环境 2.2 安装 Rancher 2.3 登录 Rancher 平台 三、通过 Rancher 管理已存在的 k8s 集群 3.1 配置 rancher 3.2 导入 k8s ​四、通过 Ranc…

啊哈 算法读书笔记 第 1 章 一大波数正在靠近——排序

目录 排序算法: 时间复杂度: 排序算法和冒泡排序之间的过渡: 冒泡排序 冒泡排序和快速排序之间的过渡: 快速排序 排序算法: 首先出场的是我们的主人公小哼,上面这个可爱的娃就是啦。期末考试完了老…

安装Ffmpeg音视频编解码工具和搭建EasyDarwin开源流媒体服务器

目录 一,安装Ffmpeg音视频编解码工具 1,简介 2,开发文档 3,安装部署 二,搭建EasyDarwin开源流媒体服务器 1,简介 2,主要功能特点 3,安装部署 4,效果图 三&…

「mysql是怎样运行的」第17章 调节磁盘和CPU的矛盾---InnoDB的BufferPool

「mysql是怎样运行的」第17章 调节磁盘和CPU的矛盾—InnoDB的Buffer Pool 文章目录「mysql是怎样运行的」第17章 调节磁盘和CPU的矛盾---InnoDB的Buffer Pool[toc]一、缓存的重要性二、InnoDB的Buffer Pool2.1 啥是Buffer Pool2.2 Buffer Pool内部组成2.3 free链表的管理2.4 缓…

Sallen-Key二阶低通滤波器——设计问题浅析

目录前言1 Sallen-Key二阶低通滤波器结构2 截止频率3 结语前言 这两天接了个简单的活,关于设计一个Sallen-Key二阶低通滤波器,有一些体会。 1 Sallen-Key二阶低通滤波器结构 这个结构很简单,优势就是在于简易实现二阶低通。这种类电压跟随器…

第九届蓝桥杯省赛 C++ B组 - 日志统计

✍个人博客:https://blog.csdn.net/Newin2020?spm1011.2415.3001.5343 📚专栏地址:蓝桥杯题解集合 📝原题地址:日志统计 📣专栏定位:为想参加蓝桥杯的小伙伴整理常考算法题解,祝大家…

电脑技巧:分享六个非常实用的资源网站

今天小编给大家分享六个非常实用的资源网站,大家一起来看看吧! 1、高清壁纸:Wallhaven 一个免费的高清壁纸下载网站,里面的壁纸资源丰富,更新速度也快,各种类型的壁纸都能找到,尤其是动漫壁纸。…

mars3d常用参数备用

1.多个包围盒计算飞行定位 map.camera.flyToBoundingSphere(boundingSphere) 可以一个数组记录下center,再用http://mars3d.cn/api/Map.html#flyToPositions 2.轨迹漫游实现沿着原轨迹倒退 把播放速率改为负数 3.自带的图层管理里面这个noCenter属性跟flyTo属性区…

动态网站开发讲课笔记02:Java Web概述

文章目录零、本讲学习目标一、 XML基础(一)XML概述1、XML2、XML与HTML的比较(二)XML语法1、XML文档的声明2、XML元素的定义3、XML属性的定义4、XML注释的定义5、XML文件示例(三)DTD约束1、什么是XML约束2、…

做出改变:农业科技和区块链在为地球的未来而战中的力量

到2050年,全球有100亿人需要养活,全世界都在关注区块链和农业信息化,以推动发展中国家的技术革新。 自成立以来,区块链技术已经找到了多样化和有价值的应用,以帮助提高效率和激励社区在不同领域和行业的参与。 农业是…

【华为OD机试模拟题】用 C++ 实现 - 去除多余空格(2023.Q1)

最近更新的博客 华为OD机试 - 入栈出栈(C++) | 附带编码思路 【2023】 华为OD机试 - 箱子之形摆放(C++) | 附带编码思路 【2023】 华为OD机试 - 简易内存池 2(C++) | 附带编码思路 【2023】 华为OD机试 - 第 N 个排列(C++) | 附带编码思路 【2023】 华为OD机试 - 考古…

《Linux运维实战:Centos7.6基于ansible一键离线部署rabbitmq3.9.16镜像模式集群》

一、部署背景 由于业务系统的特殊性,我们需要针对不同的客户环境部署 rabbitmq镜像模式集群,由于大都数用户都是专网环境,无法使用外网,为了更便捷,高效的部署,针对业务系统的特性,我这边编写了…

git cherry-pick could not apply fb2cde669...问题解决

最近多个分支修复bug,在使用git cherry-pick进行小功能合并时经常会出现类似could not apply fb2cde669...的错误。具体如下图:具体原因是cherry-pick指定的commit内容中和当前分支有冲突导致的。具体解决分以下步骤:1:首先使用gi…

DeepLabV3+:对预测处理的详解

相信大家对于这一部分才是最感兴趣的,能够实实在在的看到效果。这里我们就只需要两个.py文件(deeplab.py、predict_img.py)。 创建DeeplabV3类 deeplab.py的作用是为了创建一个DeeplabV3类,提供一个检测图片的方法,而…

数据结构与算法入门

目录数据结构概述逻辑结构存储结构算法概述如何理解“大O记法”时间复杂度空间复杂度数据结构概述 数据结构可以简单的理解为数据与数据之间所存在的一些关系,数据的结构分为数据的存储结构和数据的逻辑结构。 逻辑结构 集合结构:数据元素同属于一个集…

Codeforces Round #848 (Div. 2)A-C

传送门 目录 A. Flip Flop Sum 代码: B. The Forbidden Permutation 代码: C. Flexible String 代码: A. Flip Flop Sum 题意:给你一个长度为n的数组(数组元素只为1或者-1),你要且只能进行…