【大模型】情绪对话模型项目研发

news2025/6/3 21:55:49

 一、使用框架:

  1. Qwen大模型后端+Open-webui前端实现
  2. 使用LLamaFactory的STF微调数据集,vllm后端部署,

二、框架安装

  1. 下载千问大模型

安装魔塔社区库文件

pip install modelscope

Download.py 内容

from modelscope import snapshot_download

model_dir = snapshot_download('Qwen/Qwen2.5-0.5B-Instruct',cache_dir="/root/llm/")
python download.py

  1. 下载LLamaFactory
pip install LLamaFactory

  1. 下载vllm部署工具
pip install vllm

  1. 下载Open-webui前端工具
pip install open-webui

三、自定义格式数据集生成

from zhipuai import ZhipuAI

import random

import json

import time

from sentence_transformers import SentenceTransformer

import numpy as np

#初始化模块

client = ZhipuAI(api_key="xxxxxx") # 填写您自己的APIKey

#加载embedding

style_model =SentenceTransformer(r"/root/llm/thomas/text2vec-base-chinese")



#风格模版配置(修正消息格式)

style_config = {

    "温柔":{

        "system_prompt":"你是一个温柔体贴的聊天助手,说话时总是充满关怀,使用一下特征:\n1. 包含'呢、呀、啦'等语气词\n2.使用c:\\Users\\lenovo\\AppData\\Local\\Temp\\SGPicFaceTpBq\\2752\\05574898.png等温暖表情\n3.主动询问用户感受",

        "examples":[

            {"role": "user", "content": "今天好累啊"},

            {"role": "assistant", "content": "辛苦啦~ 要给自己泡杯热茶放松一下吗?"},

            {"role": "user", "content": "考试没考好..."},

            {"role": "assistant", "content": "没关系的呀~ 下次一定会更好!需要我陪你聊聊吗?"}

        ],

        "temperature": 0.3

    },

    "毒舌":{

        "system_prompt":"你是一个喜欢用犀利吐槽表达关心的朋友,需满足:\n1.使用网络流行语(如‘栓Q’‘退退退’)\n2.包含夸张比喻(‘你这速度堪比树懒’)",

        "examples":[

            {"role": "user", "content": "又胖了5斤"},

            {"role": "assistant", "content": "好家伙!你这是要把体重秤压成分子料理?"},

            {"role": "user", "content": "游戏又输了"},

            {"role": "assistant", "content": "菜就多练练!需要给你推荐《从零开始的电竞之路》么?"}

        ],

        "temperature": 0.7

    }

}

#生成数据(修正消息的结构)

def generate_style_data(style_name,num_samples=50):

    config = style_config[style_name]

    data =[]



    messages = [

        {"role":"system","content":config["system_prompt"]},

        *config["examples"]

    ]



    user_inputs=[

        "今天心情不太好","推荐个电影吧","怎么才能早睡早起",

        "养猫好还是养狗好","工作压力好大","最近总是失眠"

    ]



    for _ in range(num_samples):

        try:

            user_msg=random.choice(user_inputs)

            current_messages = messages + [

                {"role":"user","content":user_msg}

            ]

#

            response = client.chat.completions.create(

                model="glm-4-flash",  # 填写需要调用的模型编码

                messages=current_messages,

                temperature=config["temperature"],

                max_tokens=100

            )



            reply = response.choices[0].message.content



            if is_valid_reply(style_name,user_msg,reply):

                data.append({

                    "user": user_msg,

                    "assistant": reply,

                    "style": style_name

                })



            time.sleep(1.5)



        except Exception as e:

            print(f"生成失败:{str(e)}")

    return data



def is_valid_reply(style,user_msg,reply):

    if not reply or len(reply.strip())==0:

        return False

    if len(reply)<5 or len(reply)>150:

        return False

    style_keywords={

        "温柔":["呢","呀","c:\\Users\\lenovo\\AppData\\Local\\Temp\\SGPicFaceTpBq\\2752\\05788D52.png","c:\\Users\\lenovo\\AppData\\Local\\Temp\\SGPicFaceTpBq\\2752\\05788D52.png"],

        "毒舌":["好家伙","栓Q","!"]

    }



    if not any(kw in reply for kw in style_keywords.get(style,[])):

        return False

    #语义相似度

    try:

        ref_text = next(msg["content"] for msg in style_config[style]["examples"] if msg["role"]=="assistant")

        ref_vec = style_model.encode(ref_text)

        reply_vec = style_model.encode(reply)

        similarity = np.dot(ref_vec,reply_vec)#余弦相似度

        return similarity>0.65

    except:

        return False

   

# 执行生成(容错)



if __name__ =='__main__':

    all_data=[]



    try:

        print("开始生成温柔风格数据...")

        gentle_data=generate_style_data("温柔",50)

        all_data.extend(gentle_data)



        print("开始生成恶毒风格数据...")

        sarcastic_data = generate_style_data("毒舌",50)

        all_data.extend(sarcastic_data)



    except KeyboardInterrupt:

        print("\n用户中断,保存已生成数据...")



    finally:

        with open("style_chat_data.json","w",encoding="utf-8") as f:

            json.dump(all_data,f,ensure_ascii=False,indent=2)

        print(f"数据已保存,有效样本数:{len(all_data)}")

生成数据格式:

[

  {

    "user": "推荐个电影吧",

    "assistant": "当然可以呢。最近有一部挺温馨的电影,叫做《奇迹男孩》,讲述了一个有面部畸形的男孩如何勇敢面对生活,融入学校的故事。它挺能让人感到温暖的,你可能会喜欢哦。有没有什么特别想看的类型呀?",

    "style": "温柔"

  }

]

四、转换数据集格式:

import json



# 读取原始JSON文件

input_file = "/root/pretrain_file/style_chat_data.json"  # 你的JSON文件名

output_file = "/root/pretrain_file/style_chat_data_train.json"  # 输出的JSON文件名



with open(input_file, "r", encoding="utf-8") as f:

    data = json.load(f)



# 转换后的数据

converted_data = []



for item in data:

    converted_item = {

        "instruction": item["user"],

        "input": "",

        "output": "["+item["style"]+"],"+item["assistant"]

    }

    converted_data.append(converted_item)



# 保存为JSON文件(最外层是列表)

with open(output_file, "w", encoding="utf-8") as f:

    json.dump(converted_data, f, ensure_ascii=False, indent=4)



print(f"转换完成,数据已保存为 {output_file}")

五、通过LLamaFactory 使用Lora微调数据

Llamafactory-cli webui

六、导出模型

七、使用vllm命令部署后端

Vllm serve /root/export/Qwen/Qwen2.5-0.5B-Instruct_export1

后端启动后:http://localhost:8000

八、启动open-webui

export HF_ENDPOINT=https://hf-mirror.com

export ENABLE_OLLAMA_API=false

export OPENAI_API_BASE_URL==http://127.0.0.1:8000/v1

open-webui:

在vscode中添加转发端口8080

九、最终效果:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2395221.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【PCI】PCI入门介绍(包含部分PCIe讲解)

先解释一下寻址空间&#xff1a; 机器是32bit的话&#xff0c;意味着4G&#xff08;2的32次方&#xff09;寻址空间&#xff0c;内存条作为它的实际物理存储设备。大部分在跑内存程序运行&#xff0c;少部分用来存放其他东西。这是一个常见的4G寻址空间分布&#xff08;不一定是…

使用PowerBI个人网关定时刷新数据

使用PowerBI个人网关定时刷新数据 PowerBI desktop连接mysql&#xff0c;可以设置定时刷新数据或在PowerBI服务中手动刷新数据,步骤如下&#xff1a; 第一步&#xff1a; 下载网关。以个人网关为例&#xff0c;如图 第二步&#xff1a; 双击网关&#xff0c;点击下一步&…

数字人引领政务新风尚:智能设备助力政务服务

在信息技术飞速发展的今天&#xff0c;政府机构不断探索提升服务效率和改善服务质量的新途径。实时交互数字人在政务服务中的应用正成为一大亮点&#xff0c;通过将“数字公务员”植入各种横屏智能设备中&#xff0c;为民众办理业务提供全程辅助。这种创新不仅优化了政务大厅的…

深入剖析Java类加载机制:双亲委派模型的突破与实战应用

引言&#xff1a;一个诡异的NoClassDefFoundError 某金融系统在迁移到微服务架构后&#xff0c;突然出现了一个诡异问题&#xff1a;在调用核心交易模块时&#xff0c;频繁抛出NoClassDefFoundError&#xff0c;但类明明存在于classpath中。经过排查&#xff0c;发现是由于不同…

tauri2项目打开某个文件夹,类似于mac系统中的 open ./

在 Tauri 2 项目中打开文件夹 在 Tauri 2 项目中&#xff0c;你可以使用以下几种方法来打开文件夹&#xff0c;类似于 macOS 中的 open ./ 命令功能&#xff1a; 方法一&#xff1a;使用 shell 命令 use tauri::Manager;#[tauri::command] async fn open_folder(path: Strin…

企业文件乱、传输慢?用群晖 NAS 构建安全高效的共享系统

在信息化办公不断加速的今天&#xff0c;企业对文件存储、共享与安全管理的需求愈发严苛。传统文件共享方式效率低下、权限混乱、远程访问困难&#xff0c;极大影响了协同办公效率。此时&#xff0c;一套可靠、高效、安全的文件共享解决方案便成为众多企业的“刚需”。 这正是…

防爆手机VS普通手机,区别在哪里?

在加油站掏出手机接打电话、在化工厂车间随手拍照记录……这些看似寻常的行为&#xff0c;实则暗藏致命风险。普通手机在易燃易爆环境中可能成为“隐形炸弹”&#xff0c;而防爆手机却能安全护航。这两者看似相似&#xff0c;实则从底层基因到应用场景都存在着本质差异&#xf…

在RTX5060Ti上进行Qwen3-4B的GRPO强化微调

导语 最近赶上618活动&#xff0c;将家里的RTX 4060显卡升级为了RTX 5060Ti 16GB版本&#xff0c;显存翻了一番&#xff0c;可以进行一些LLM微调实验了&#xff0c;本篇博客记录使用unsloth框架在RTX 5060Ti 16GB显卡上进行Qwen3-4B-Base模型的GRPO强化微调实验。 简介 GPU性…

武汉火影数字VR大空间制作

VR大空间是一种利用空旷的物理空间&#xff0c;结合先进的虚拟现实技术&#xff0c;让用户能够在其中自由移动并深度体验虚拟世界的创新项目方式。 在科技飞速发展的当下&#xff0c;VR大空间正以其独特的魅力&#xff0c;成为科技与娱乐领域的耀眼新星&#xff0c;掀起了一股沉…

(增强)基于sqlite、mysql、redis的消息存储

原文链接&#xff1a;&#xff08;增强&#xff09;基于sqlite、mysql、redis的消息存储 教程说明 说明&#xff1a;本教程将采用2025年5月20日正式的GA版&#xff0c;给出如下内容 核心功能模块的快速上手教程核心功能模块的源码级解读Spring ai alibaba增强的快速上手教程…

MFC坦克大战游戏制作

MFC坦克大战游戏制作 前言 现在的游戏制作一般是easyx&#xff0c;有没有直接只用mfc框架的&#xff0c;笔者研究了一番&#xff0c;做出了一个雏形&#xff0c;下面把遇到的问题总结出来 一、MFC框架制作游戏 初步设想&#xff0c;MFC可以选用 对话框 或者 单文档 结构&…

Kafka ACK机制详解:数据可靠性与性能的权衡之道

在分布式消息系统中&#xff0c;消息确认机制是保障数据可靠性的关键。Apache Kafka 通过 ACK&#xff08;Acknowledgment&#xff09;机制 实现了灵活的数据确认策略&#xff0c;允许用户在 数据可靠性 和 系统性能 之间进行权衡。本文将深入解析 Kafka ACK 机制的工作原理、配…

VulnStack|红日靶场——红队评估四

信息收集及漏洞利用 扫描跟kali处在同一网段的设备&#xff0c;找出目标IP arp-scan -l 扫描目标端口 nmap -p- -n -O -A -Pn -v -sV 192.168.126.154 3个端口上有web服务&#xff0c;分别对应三个漏洞环境 &#xff1a;2001——Struts2、2002——Tomcat、2003——phpMyAd…

数据库 | 时序数据库选型

选型目标 高性能与低延迟&#xff1a;满足高频率数据写入与即时查询的需求。资源效率&#xff1a;优化存储空间使用&#xff0c;减少计算资源消耗。可扩展架构&#xff1a;支持数据量增长带来的扩展需求&#xff0c;易于维护。社区活跃度&#xff1a;有活跃的开发者社区&#…

网络拓扑如何跨网段访问

最近领导让研究下跟甲方合同里的&#xff0c;跨网段访问怎么实现&#xff0c;之前不都是运维网工干的活么&#xff0c;看来裁员裁到动脉上了碰到用人的时候找不到人了&#xff0c; 只能赶鸭子上架让我来搞 IP 网络中&#xff0c;不同网段之间的通信需要通过路由器&#xff0c;…

CppCon 2014 学习第1天:An SQL library worthy of modern C++

sqlpp11 — 现代 C 应用值得拥有的 SQL 库 template<typename T> struct _member_t {T feature; };你提到的是一个 C 中的“成员模板&#xff08;Member Template&#xff09;”&#xff0c;我们来一步步理解&#xff1a; 基本代码分析&#xff1a; template<typena…

【LLM相关知识点】 LLM关键技术简单拆解,以及常用应用框架整理(二)

【LLM相关知识点】 LLM关键技术简单拆解&#xff0c;以及常用应用框架整理&#xff08;二&#xff09; 文章目录 【LLM相关知识点】 LLM关键技术简单拆解&#xff0c;以及常用应用框架整理&#xff08;二&#xff09;一、市场调研&#xff1a;业界智能问答助手的标杆案例1、技术…

数据分析与应用-----使用scikit-learn构建模型

目录 一、使用sklearn转换器处理数据 &#xff08;一&#xff09;、加载datasets模块中的数据集 &#xff08;二&#xff09;、将数据集划分为训练集和测试集 ​编辑 train_test_spli &#xff08;三&#xff09;、使用sklearn转换器进行数据预处理与降维 PCA 二、 构…

003 flutter初始文件讲解(2)

1.书接上回 首先&#xff0c;我们先来看看昨天最后的代码及展示效果&#xff1a; import "package:flutter/material.dart";void main(){runApp(MaterialApp(home:Scaffold(appBar:AppBar(title:Text("The World")), body:Center(child:Text("Hello…

什么是数据驱动?以及我们应如何理解数据驱动?

在谈到企业数字化转型时&#xff0c;很多人都会说起“数据驱动”&#xff0c;比如“数据驱动运营”、“数据驱动业务”等等。 在大家言必称“数据驱动”的时代背景下&#xff0c;我相信很多人并未深究和思考“数据驱动”的真正含义&#xff0c;只是过过嘴瘾罢了。那么&#xff…