测试在 4090 上运行 vicuna-33b 进行推理

news2025/12/17 14:02:15

测试在 4090 上运行 vicuna-33b 进行推理

今天尝试在 4090 上运行 vicuna-33b 进行推理，使用的是 8bit 量化。

运行命令如下，

python3 -m fastchat.serve.cli --model-path lmsys/vicuna-33b-v1.3 --load-8bit

结论，使用 8bit 量化在 4090 上可以运行 vicuna-33b 进行推理，显存用到大概 23239MiB，GPU 使用率基本全程 100%，推理过程非常非常慢。
在这里插入图片描述
完结！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/711537.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

HTTP概述以及Tomcat概述

HTTP 概念：Hyper Text Transfer Protocol，超文本传输协议，规定了浏览器和服务器之间数据传输的规则。特点： 基于TCP协议：面向连接、安全基于请求-响应模型的：一次请求对应一次响应HTTP协议是无状态的协议…

Java面试题3

[TOC]目录 1. spring事务事务简介事务在逻辑上是一组操作，要么执行，要不都不执行。主要是针对数据库而言的，比如说 MySQL。为了保证事务是正确可靠的，在数据库进行写入或者更新操作时，就必须得表现出 ACID 的 4 …

nexus搭建maven私有仓库

Nexus 在企业开发中还是比较常用的私有仓库管理工具，一般把公司内部的Maven jar 包或npm包上传到仓库中，有效的对包文件进行管理。 Nexus 至少需要 2G 以上的内存安装nexus之前首先安装配置好 JDK 环境和 Maven环境 1、Linux环境安装openJDK 2、Centos…

机器学习——掌握决策树ID3算法的原理，通过增益熵实现手工推导的过程。

文章目录决策树介绍优缺点ID3算法原理举例决策树的构建1、特征选择（1）香农熵（2）信息增益 2、决策树的生成3、决策树的修剪总结：参考文献决策树介绍决策树(decision tree)是一种基本的分类与回归方法。ID3是其中…

模拟实现atoi

函数简介 atoi (表示 ascii to integer)是把字符串转换成整型数的一个函数，应用在计算机程序和办公软件中。int atoi(const char *nptr) 函数会扫描参数 nptr字符串，会跳过前面的空白字符（例如空格，tab缩进）等。如果 n…

socket 网络编程

socket UDP1、单播收发数据测试2、广播发送 TCP1、收发数据测试2、TCP 服务端 Socket是两个程序之间的双向通信链路。它是一种网络通信协议，用于不同计算机之间的进程间通信或同一计算机内部进程之间的通信。 import sockets socket.socket(AddressFamily, Type)…

初识【Matplotlib】

Matplotlib Matplotlib简单介绍Matploylib的分类学习Matploylib网站推荐Matplotlib用法Matplotlib中文字体显示Matplotlib的三层结构容器层图像层辅助显示层 Matplotlib简单介绍 Matplotlib是一个Python的数据可视化库，它提供了一种简单而有效的方式来创建各种类型…

程序 #include <REGX52.H>void main() {while(1) {if(P3_1 0) //DOWN{P2_0 0xFE;}if(P3_1 1) //UP{P2_0 0XFF;}};}按键的抖动问题软件实现解决-按键的抖动问题通过延时解决 #include <REGX52.H>void Delay(unsigned int xms) {while(xms){unsigned cha…

【C语言】整型在内存中存储赛场(来试试)

前言 🎈大家好，我是何小侠🎈 🍃大家可以叫我小何或者小侠🍃 💐希望能通过写博客加深自己对于学习内容的理解💐 🌸也能帮助更多人理解和学习🌸 合抱之木，生于…

简单实用配置VScode的C# Framework环境

1. 设置window path环境csc变量 D:\Program Files\Microsoft Visual Studio\2022\Professional\MSBuild\Current\Bin\Roslyn 或者 C:\Windows\Microsoft.NET\Framework64\v4.0.30319 2. 设置"code-runner.executorMap" "csharp": "cd $dir &…

第五课—大学英语四六级备考—听力专项

Key words 1.implement vt.实施 "Implement" 在中文中的意思是「实施」或「执行」。以下是一些示例用法和搭配： 中文意思：实施、执行形近字：implicate（牵连） 1. 用英文造句：The government …

【C++初阶(二)】缺省参数以及函数重载

💓博主CSDN主页:杭电码农-NEO💓 ⏩专栏分类:C初阶之路⏪ 🚚代码仓库:NEO的学习日记🚚 🌹关注我🫵带你学习排序知识 🔝🔝 缺省参数＆函数重载 1. 前言2. 缺…

红黑树内容及代码实现

目录 1.概念 2.性质 3.实现 3.1定义数据类型 3.2设计基本操作 3.2.1着色问题详解 3.2.2 代码基本框架 3.2.3着色问题代码 3.2.4红黑树的销毁 3.3验证基本操作 4.总结 1.概念红黑树是一种二叉搜索树，但是在其中的每个结点上增加一个存储表示该节点的颜…

【数据结构】栈和队列(队列篇）

上期我们已经学习了数据结构中的栈，这期我们开始学习队列。目录 1.队列的概念及结构 2.队列的实现队列结构体定义常用接口函数初始化队列队尾入队列队头出队列获取队列头部元素、获取队列队尾元素获取队列中有效元素个数检测队列是否为空销毁…

chatgpt赋能python：用Python轻松给手机用户发送短信——优秀的工具在手，无限可能！

用Python轻松给手机用户发送短信——优秀的工具在手，无限可能！ 作为一个有10年Python编程经验的工程师，我想分享一下如何用Python给手机用户发送短信。Python是目前非常流行的编程语言之一，它可以轻松地完成很多任务。而给用户发…

13.定时器中断

1.通用定时器工作过程： 2.时钟选择： 内部时钟(CK_INT);外部时钟模式1：外部输入脚(TIx)；外部时钟模式2：外部触发输入(ETR)；内部触发输入(ITRx):使用一个定时器作为另一个定时器的预分频器，例如可…

【Kafka面试题1】Kafka消费者是pull(拉)还是push(推)模式，这种模式有什么好处？

Kafka消费者是pull(拉)还是push(推)模式，这种模式有什么好处？ 一、概述回答 Kafka中的Producer和consumer采用的是push-and-pull模式，即Producer只管向broker push消息，consumer只管从broker pull消息，两者对消息的生…

从零用自己数据跑R3LIVE

1、相机内参标定相机选用4mm的广角相机，相机内参标定选择用最常见的棋盘格方法，首先安装ROS自带的包 sudo apt install ros-melodic-camera-calibration 用usb_cam启动相机后进行标定。 rosrun camera_calibration cameracalibrator.py --size 8x6…

【Linux】网络编程相关概念介绍、UDP套接字简单演示、最简单的UDP公共聊天室实现~

文章目录 [toc] 网络编程 - 套接字一些概念1. 源ip地址与目的ip地址2. 端口号和 socket套接字 **问题 3. 源端口号和目的端口号4. 认识TCP协议基本特点5. 认识UDP协议基本特点6. 网络字节序 socket编程接口**struct sockaddr**接口演示: 简单的UDP网络通信int socket()UDP网络…

读书笔记-《ON JAVA 中文版》-摘要18[第十八章字符串-1]

文章目录第十八章字符串1. 字符串的不可变2. 的重载与 StringBuilder3. 意外递归4. 字符串操作5. 格式化输出5.1 printf()5.2 System.out.format()5.3 Formatter 类5.3.1 格式化修饰符5.3.2 Formatter 转换 5.4 String.format() 6. 自我学习总结第十八章字符串字符串操作…