GPU加速-系统CUDA12.5-Windows10

news2025/7/19 17:23:07

误区注意

  • 查看当前系统可支持的最高版本cuda:nvidia-smi
    在这里插入图片描述
    • 说明:
      • 此处显示的12.7只是驱动对应的最高版本,不一定是 / 也不一定需要是 当前Python使用的版本。
      • 但我们所安装的CUDA版本需要 小于等于它(即≤12.7)
      • 因此即使我此处显示的是12.7,我依然可以使用12.5的cuda,并不需要卸载再重新安装
  • 可以在CUDA文件夹下查看,电脑是否安装了多个版本CUDA(多版本CUDA,可能是 “ pytorch找不到匹配,从而发生错误 ” 的原因之一)
    • 可以通过找NVIDIA GPU Computing Toolkit文件夹,找到CUDA安装路径,从而查看电脑里安装了几个CUDA(再次注意,上面的12.7并不属于其中一个。安装了几个版本CUDA只看这个文件夹里有几个即可)
    • 比如我的电脑只有一个12.5版本的CUDA在这里插入图片描述

安装CUDA Toolkit(即CUDA)

  • 之前从没安装过CUDA的,可以参考如下过程。
    • 该部分内容是整合如下两篇博文的,因为我之前已经安装了,但没有一步步记录。
    • 本来是想直接附这俩博文链接,但单看它俩是有缺漏的,所以我把它们结合整理一下,看着比较方便。
  • 1、先根据这篇文章完成基础的CUDA安装,但要注意如下提示。
    • 参考博文1:基础CUDA安装(缺少安装后的一些工作)
    • 提示①:3.2中的安装路径可以不默认C盘,以免占据太大空间(但你要记住安装路径,后续添加系统环境变量时要用)
    • 提示②:3.5中取消勾选Visual Studio是由于若系统未安装VS,勾选后会出错。但如果已安装VS,则可以勾选。
    • 提示③:在4中,若命令窗口输入nvcc -V没有显示不必担心,可能是因为该博文缺少了添加环境变量的步骤,此时点开下面第二个博文链接。
  • 2、接着跟着博文2的步骤2~5完成cuDNN和pytorch-gpu的安装(其中涉及CUDA Toolkit的安装在博文1中已安装,可跳过)
    • 参考博文2:安装后续讲得比较清楚完整
    • 提示①:在3中的虚拟环境Python可安装3.8版,不是一定3.11
    • 提示②:虽然我安装的是CUDA12.5,没有直接匹配的pytorch12.5,但可以安装pytorch12.4
    • 提示③:pytorch-gpu若文件太大(一般都几个G),可以直接在官网或者网络的其他渠道下载到whl文件后 → 进入虚拟环境 → 直接pip install (whl文件名),能比较快一点。比如:
      • 我安装时嫌2G多太慢,就直接点开*.whl链接,用另一个有线网电脑几分钟下载后(或者也可以找其他渠道下载到同名文件),总之把whl文件放在本地在这里插入图片描述
      • (记得切换到虚拟环境下后),再直接pip安装即可。
        在这里插入图片描述
      • 如上安装了torch后,还要安装俩小的,直接再输入命令即可:
        在这里插入图片描述

使用加速

  • 根据博文2的步骤5中torch.cuda.is_available()结果显示True后,即可开始训练了。
  • 开另个窗口输入nvidia-smi后:
    • CUDA 版本(驱动支持): 12.7(但我的 PyTorch 是 cu124 版本,CUDA可向下兼容)
    • 可以查看当前的内存使用:1970MiB / 6144MiB → 表示当前 Python 程序大约使用了 2GB 显存
      在这里插入图片描述
    • 也可显示正在使用GPU的进程,与其指向的虚拟环境在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2343981.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

kafka课后总结

Kafka是由LinkedIn开发的分布式发布 - 订阅消息系统,具备高吞吐量、低延迟、可扩展性、持久性、可靠性、容错性和高并发等特性。其主要角色包括Broker、Topic、Partition、Producer、Consumer、Consumer Group、replica、leader、follower和controller。消息系统中存…

【股票系统】使用docker本地构建ai-hedge-fund项目,模拟大师炒股进行分析。人工智能的对冲基金的开源项目

股票系统: https://github.com/virattt/ai-hedge-fund 镜像地址: https://gitcode.com/gh_mirrors/ai/ai-hedge-fund 项目地址: https://gitee.com/pythonstock/docker-run-ai-hedge-fund 这是一个基于人工智能的对冲基金的原理验证项目。本项目旨在探讨利用人工智能进行…

施工安全巡检二维码制作

进入新时代以来,人们对安全的重视程度越来越高。特别在建筑施工行业,安全不仅是关乎着工人的性命,更是承载着工人背后家庭的幸福生活。此时就诞生了安全巡检的工作,而巡检过程中内容庞杂,安全生产检查、隐患排查、施工…

基于 Google Earth Engine (GEE) 的土地利用变化监测

一、引言 土地利用变化是全球环境变化的重要组成部分,对生态系统、气候和人类社会产生深远影响。利用遥感技术可以快速、准确地获取土地利用信息,监测其变化情况。本文将详细介绍如何使用 GEE 对特定区域的 Landsat 影像进行处理,实现土地利…

BT169-ASEMI无人机专用功率器件BT169

编辑:ll BT169-ASEMI无人机专用功率器件BT169 型号:BT169 品牌:ASEMI 封装:SOT-23 批号:最新 引脚数量:3 特性:单向可控硅 工作温度:-40℃~150℃ BT169单向可控硅&#xff…

AI图像编辑器 Luminar Neo 便携版 Win1.24.0.14794

如果你对图像编辑有兴趣,但又不想花费太多时间学习复杂的软件操作,那么 Luminar Neo 可能就是你要找的完美工具。作为一款基于AI技术的创意图像编辑器,Luminar Neo简化了复杂的编辑流程,即使是没有任何图像处理经验的新手&#xf…

发币流程是什么,需要多少成本?

这是一个专注于Web3相关开发的账号,具体会讲解步骤以及开发方案 偶尔会有科普,有兴趣的可以点右上角关注一下 发币(发行数字货币)的流程通常涉及技术实现、法律合规、经济模型设计等多个环节,以下是关键步骤的简要说明…

【fork初体验】

文章目录 Linux 实验:深入理解 fork 系统调用一、实验目的二、实验环境三、实验内容与步骤(一)打印进程的进程 ID 和父进程 ID1. 编写程序2. 编译与运行3. 运行结果 (二)使用 fork 系统调用创建进程并加入循环语句1. 编…

学习设计模式《六》——抽象工厂方法模式

一、基础概念 抽象工厂模式的本质是【选择产品簇(系列)的实现】; 抽象工厂模式定义:提供一个创建一系列相关或相互依赖对象的接口,而无需指定它们具体的类; 抽象工厂模式功能:抽象工厂的功能是为一系列相关对象或相互依…

python_BeautifulSoup提取html中的信息

目录 描述: 过程: step one 下载html网页到本地 step two 提取html信息 list_con soup.select(.list-con) [0] li_list list_con.find_all(li) a li.find(span).find(a) title a.get(title) url a.get(href) span li.find(span).find(spa…

今日头条如何查看IP归属地?详细教程与常见问题解答

在当今互联网时代,IP属地信息已成为各大社交平台展示用户真实性的重要标识。今日头条作为国内领先的资讯平台,也提供了IP属地显示功能。那么,今日头条怎么查看IP归属地?本文将详细介绍在今日头条11.9.0版本中如何查看自己和他人的…

【物联网】基于LORA组网的远程环境监测系统设计(机智云版)

基于LORA组网的远程环境监测系统设计(机智云版) 演示视频: 简介: 1.本系统有一个主机,两个从机。 2.一主多从的LORA组网通信,主机和两个从机都配备了STM32F103单片机与 LoRa 模块,主机作为中心设备及WIFI网关,负责接收和发送数据到远程物联网平台和手机APP,两个从机…

制作一款打飞机游戏22:表格导出

编辑器功能扩展 今天,我想让编辑器能够处理一个数组,这是编辑器将要编辑的东西,它只编辑数组。这些区域在后续的不同版本的编辑器中会有不同的含义,但现在我想创建一个模板,能够加载一个二维数组,并将二维…

Linux内核源码结构

目录 Linux内核源码结构 Linux内核版本命名 Linux内核版本选择 内核源码结构 arch:与CPU架构相关的源代码 block:磁盘设备的支持 COPYING文件 CREDITS文件 crypto:加密相关 Documentation: drivers:设备驱动 firmware:固件 fs:文件系统 include:头文件…

72.评论日记

【巫师】中美关税战02:应给人民爆装备,以及普通人如何应对(7条建议)_哔哩哔哩_bilibili 2025年4月26日11:03:31

Websocket自动发送消息客户端工具

点击下载《Websocket自动发送消息客户端工具》 1. 前言 在现代网络应用中,实时通信和即时数据传输变得越来越重要。WebSocket作为一种全双工通信协议,因其高效、实时的特点,被广泛应用于聊天应用、实时数据监控、在线游戏等领域。然而&…

STM32的开发环境介绍

目录 STM32软件环境 Keil软件在线安装 其他软件环境安装 STM32开发的几种方式 STM32寄存器版本和库函数版本 标准外设库的作用: STM32软件环境 STM32 的集成开发环境(IDE):编辑编译软件 常见的环境: (1)KEIL&a…

数据库系统概论(四)关系操作,关系完整性与关系代数

数据库系统概论(四)详细讲解关系操作,关系完整性与关系代数 前言一、什么是关系操作1.1 基本的关系操作1.2 关系数据语言的分类有哪些 二、关系的完整性2.1 实体完整性2.2 参照完整性2.3 用户的定义完整性 三、关系代数是什么3.1 传统的集合运…

基于 IPMI + Kickstart + Jenkins 的 OS 自动化安装

Author:Arsen Date:2025/04/26 目录 环境要求实现步骤自定义 ISO安装 ipmitool安装 NFS定义 ks.cfg安装 HTTP编写 Pipeline 功能验证 环境要求 目标服务器支持 IPMI / Redfish 远程管理(如 DELL iDRAC、HPE iLO、华为 iBMC)&…

使用 Node、Express 和 MongoDB 构建一个项目工程

本文将详细介绍如何使用 Node.js Express MongoDB 构建一个完整的 RESTful API 后端项目,涵盖: 项目初始化 Express 服务器搭建 MongoDB 数据库连接 REST API 设计(CRUD 操作) 错误处理与中间件 源码结构与完整代码 部署建…