Cuda笔记1

Cuda笔记1

news2026/2/26 8:48:35

1、培训001

在这里插入图片描述

1
1+…+100，CPU是串行执行，GPU是分成几部分同时计算，如1+2+3,4+5+6…

2、培训002

在这里插入图片描述
一来一回

每种定义有对应的调用位置，和执行位置，不对会报错。

下图是用NVPROF时间分析

下图是资源分析

1） CUDA线程层次

在这里插入图片描述
一个SM执行多个block

所有线程执行同一个kernel，每个线程处理的数据不一样

线程在cuda core里面，block以块为单位分配到sm中，grid在device中
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/b0ebf85958584b2aa17be70d7dcbc1a5.png
如图描述的是：9个block分给3个sm
这张ppt的流程与下面这个图其实是一回事

理由：层层分级便于管理，和企业或government管理有点相似。还有个协作，通过共享内存使thread block协作。
在这里插入图片描述

h_a，h_b指CPU的变量，d_a等指GPU的变量，申请各自的空间。
使用cudaMemcpy函数将cpu的变量传给gpu，然后使用kernel函数计算。
然后将结果送回去给CPU，最后释放
第一步

第二步，还有个步骤是，cpu通过giga thread将block分配给sm中
在这里插入图片描述
第三步

2）CUDA线程索引

设置多大？没有规矩，要通过实验！！！

3）CUDA线程分配

在这里插入图片描述
每个线程块的xyz维度最大申请1024,1024,64

参考链接：https://www.bilibili.com/video/BV1dq4y1k7RD?p=1《NVIDIA-CUDA-冬令营》

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1409903.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

《统计学习方法：李航》笔记从原理到实现（基于python）-- 第 2章感知机

《统计学习方法：李航》笔记从原理到实现（基于python）-- 第 2章感知机

文章目录第 2章感知机2.1 感知机模型2.2 感知机学习策略2.2.1 数据集的线性可分性2.2.2 感知机学习策略 2.3 感知机学习算法2.3.1 感知机学习算法的原始形式2.3.2 算法的收敛性2.3.3 感知机学习算法的对偶形式实践：二分类模型（iris数据集）数…

阅读更多...

爬虫正则+bs4+xpath+综合实战详解

爬虫正则+bs4+xpath+综合实战详解

Day3 - 1.数据解析概述_哔哩哔哩_bilibili 聚焦爬虫：爬取页面中指定的页面内容编码流程：指定url -> 发起请求 -> 获取响应数据 -> 数据解析 -> 持久化存储数据解析分类：正则、bs4、xpath(本教程的重点) 数据解析原理概述&am…

阅读更多...

2024群硕荣誉首响，第十三届公益节斩获企业大奖

2024群硕荣誉首响，第十三届公益节斩获企业大奖

2024年1月23日至24日，第十三届公益节在北京顺利举行。历经多年的探索和实践，公益节已经成为中国公益慈善领域颇具影响力的年度盛事。本届公益节全面恢复线下活动，各大企业齐聚现场，展现社会责任的力量，现场气氛热烈而…

阅读更多...

什么是5G RedCap？5G RedCap有什么优势？

什么是5G RedCap？5G RedCap有什么优势？

5G RedCap（Reduced Capability）是指5G轻量化技术，即通过对5G技术进行一定程度的“功能裁剪”，来降低终端和模组的复杂度、成本、尺寸和功耗等指标，从而“量体裁衣”适配不同的物联需求，实现兼顾物联网系统的…

阅读更多...

【送书活动八期】docker容器中登陆并操作postgresql

【送书活动八期】docker容器中登陆并操作postgresql

这里的背景比较简单，因为区块链浏览器使用的是blockscout，blockscout的数据库选择的是postgresql，这些服务组件都是使用的docker容器来管理，今天进行区块链上交易查询的时候，发现数据存在部分问题，因此需要…

阅读更多...

大数据信用查询系统能查到什么呢?

大数据信用查询系统能查到什么呢?

在金融助贷行业，大数据有叫大数据信用或者网贷大数据，在申贷的时候，想必大多数人都有听说过，很多人因为大数据不良的原因申贷被拒过，那大数据信用查询系统能查到什么呢?本文就简单为大家总结几点大数据信用查询的内容…

阅读更多...

freeRTOS总结（十）消息队列

freeRTOS总结（十）消息队列

1，队列简介（了解） 队列是任务到任务、任务到中断、中断到任务数据交流的一种机制（消息传递） 与全局变量的区别类似全局变量？假设有一个全局变量a 0，现有两个任务都在写这个变量a 假如当任务…

阅读更多...

三层架构-pc通外网小实验

三层架构-pc通外网小实验

要求:pc端能上外网(isp) 效果图:pc1(VLAN2)和pc3(vlan3)都能ping通2.2.2.2(R2环回) 代码:#先配置好r1,r2,端口ip # [R1] ip route-static 0.0.0.0 0.0.0.0 10.1.1.2 acl 2000 rule permit source any interface GigabitEthernet0/0/2 nat outbound 2000 …

阅读更多...

Android消息推送 SSE（Server-Sent Events）方案实践

Android消息推送 SSE（Server-Sent Events）方案实践

转载请注明出处：https://blog.csdn.net/kong_gu_you_lan/article/details/135777170 本文出自容华谢后的博客 0.写在前面最近公司项目用到了消息推送功能，在技术选型的时候想要找一个轻量级的方案，偶然看到一篇文章讲ChatGPT的对话机制是基…

阅读更多...

Bank_Code_FullName_2020.06.16.xlsx

Bank_Code_FullName_2020.06.16.xlsx

Bank_Code_FullName_2020.06.16.xlsx 银行联行号和全称 https://download.csdn.net/download/spencer_tseng/88780566 144692条记录，没法子贴上去

阅读更多...

抖音VR直播：沉浸式体验一键打通360度精彩

抖音VR直播：沉浸式体验一键打通360度精彩

随着5G技术的发展，VR直播近年来也逐步进入到大众的视野中，相比于传统直播，VR直播能够提供更加丰富的内容和多样化的互动方式，让观众更有沉浸感和参与感。现如今，抖音平台也上线了VR直播，凭借沉浸式体验和有…

阅读更多...

基于 pytorch-openpose 实现 “多目标” 人体姿态估计

基于 pytorch-openpose 实现 “多目标” 人体姿态估计

前言还记得上次通过 MediaPipe 估计人体姿态关键点驱动 3D 角色模型，虽然节省了动作 K 帧时间，但是网上还有一种似乎更方便的方法。MagicAnimate 就是其一，说是只要提供一张人物图片和一段动作视频 (舞蹈武术等)，就可以完成图片…

阅读更多...

【Kubernetes】深入了解Kubernetes（K8s）：现代容器编排的引领者

【Kubernetes】深入了解Kubernetes（K8s）：现代容器编排的引领者

欢迎来到英杰社区： https://bbs.csdn.net/topics/617804998 欢迎来到阿Q社区： https://bbs.csdn.net/topics/617897397 作者简介： 辭七七，目前大二，正在学习C/C，Java，Python等作者主页&#xf…

阅读更多...

JVM-初始JVM

JVM-初始JVM

什么是JVM JVM 全称是 Java Virtual Machine，中文译名 Java虚拟机。JVM 本质上是一个运行在计算机上的程序，他的职责是运行Java字节码文件。 Java源代码执行流程如下： JVM的功能 1 - 解释和运行 2 - 内存管理 3 - 即时编译解释和运行解释…

阅读更多...

LeetCode.2865. 美丽塔 I

LeetCode.2865. 美丽塔 I

题目题目链接分析闲谈：每次读 LeetCode 的题目描述都要费老大劲，o(╥﹏╥)o 题意：这个其实意思就是以数组的每一位作为最高点，这个点（数字）左右两边的数字都不能大于这个数字(可以等于)，…

阅读更多...

Qt基础-屏蔽qDebug()、qWarning()调试和警告消息

Qt基础-屏蔽qDebug()、qWarning()调试和警告消息

本文讲解Qt如何-屏蔽qDebug()、qWarning()调试和警告消息在工程文件.pro里面添加 DEFINES QT_NO_WARNING_OUTPUT\ QT_NO_DEBUG_OUTPUT 如果只想Release版本的时候不打印： Release:DEFINES QT_NO_WARNING_OUTPUT\ QT_NO_DEBUG_OUTPUT 这样只是在Release版本…

阅读更多...

想要透明拼接屏展现更加效果，视频源是技术活，尤其作为直播背景

想要透明拼接屏展现更加效果，视频源是技术活，尤其作为直播背景

随着科技的飞速发展，视频制作和显示技术也在不断进步。透明拼接屏视频作为一种新型的视频形式，在许多场合都得到了广泛的应用。尼伽小编将深入探讨透明拼接屏视频的制作过程、要求、清晰度，以及目前常作为直播背景的优势。一、透明拼接屏视频…

阅读更多...

Make.com的发送邮件功能已经登峰造极

Make.com的发送邮件功能已经登峰造极

make.com的发送邮件功能已经做到了登峰造极。我给你个任务，让你发送个新邮件给谁谁，你一定想到SMTP服务器不就行了。我给你第二个任务，我让你自动回复一个邮件，注意是回复。做不到了吧～～！…

阅读更多...

【3万字】modbus简易不简单的教程

【3万字】modbus简易不简单的教程

🎖️Modbus简易不简单的教程文章目录 🎖️Modbus简易不简单的教程🎫一、简介1.1 Modbus：工业通信的革命1.2 理解标准化通信1.3 Modbus协议的变体 🎀二、例程引入2.1 示例：使用01功能码读取灯的开关状态2.2…

阅读更多...

电商一年挣100w的赚钱模型

电商一年挣100w的赚钱模型

现在有多少人还不知道电商具体应该怎么干，有多少人还是看了身边的朋友做电商挣钱了也跟着做了。然后做半天没做起来，然后就找各种原因，你看别人每天上架你也上架，别人开车你也开车，别人亏钱你也亏钱，别人赚…

阅读更多...

推荐文章

最新文章