开源项目chatgpt-artifacts:为ChatGPT实现Claude式并排视图,支持多模型部署
1. 项目概述将Claude的Artifacts功能带到ChatGPT如果你和我一样既是ChatGPT的重度用户又对Anthropic的Claude 3.5 Sonnet新推出的Artifacts功能眼馋不已那么这个项目绝对值得你花时间折腾一下。简单来说chatgpt-artifacts是一个开源项目它通过一个自托管的Web应用复刻了Claude Artifacts的核心体验——在对话界面旁边实时生成并展示代码、文档、图表等“工作产物”。我最初看到Claude的演示时就被这个设计打动了左边是自然的对话右边是AI实时“敲”出来的代码或文档这种并排视图对于开发者、内容创作者来说效率提升是肉眼可见的。但问题是我日常的工作流已经深度绑定了OpenAI的API和GPT-4o切换成本太高。这个项目正好解决了这个痛点它不改变你后端的AI服务提供商你依然可以用OpenAI、Azure OpenAI甚至本地的Ollama只是在前端给你提供了一个类似Claude Artifacts的交互界面。这个项目适合谁呢首先是全栈或前端开发者你可以直接部署使用甚至基于它的代码进行二次开发。其次是AI应用爱好者想体验多模型支持下的“产物生成”工作流。最后它也适合任何希望提升与AI协作效率的人尤其是需要频繁生成、查看和调试结构化内容如代码、JSON、Markdown的场景。接下来我会带你从零开始完成部署、配置到深度定制的全过程并分享我踩过的几个坑和优化技巧。2. 核心设计思路与方案选型解析这个项目的本质是一个构建在Next.js框架上的Web应用它充当了一个“智能中继”的角色。理解它的设计思路有助于我们后续的故障排查和自定义扩展。2.1 为什么选择Next.js OpenAI SDK架构作者选择了Next.js这是一个非常务实且高效的选择。Next.js同时支持服务端渲染SSR和API Routes这让整个项目的结构变得异常清晰。前端页面/pages/index.js负责渲染类似Claude的聊天界面和Artifacts预览窗格而后端API/pages/api/chat.js则专门处理与AI模型的通信。这种分离使得前端可以专注于用户体验后端则专注于稳定、安全地调用AI接口。更重要的是项目使用了官方的openaiNode.js SDK。这个SDK最新版本的一个重要特性是它不再仅仅服务于api.openai.com而是设计成了一个通用的“OpenAI API兼容层”。只要后端服务遵循OpenAI的API格式这个SDK就能与之通信。这恰恰是项目能支持Ollama、Groq等服务的技术基石。你看到的代码修改本质上都是在配置这个SDK的客户端实例告诉它“别去找OpenAI了去找这个地址baseURL并且用这个格式headers/query。”2.2 Artifacts功能是如何实现的Claude的Artifacts看起来神奇但其核心原理在这个项目中被巧妙地简化并实现了。它主要依赖于GPT-4o等模型强大的结构化输出能力。流程是这样的用户提问你在聊天框输入“用Python写一个快速排序函数并附上解释”。提示词工程应用后端在将你的问题发送给AI模型之前很可能对消息messages进行了一层包装。它可能添加了类似“请将代码部分用特定的Markdown代码块格式输出”的系统指令。虽然项目代码中没有明确展示这部分但这是实现可靠产物提取的常见做法。流式响应与解析后端开启流式传输stream: true。前端一边接收AI返回的文本流一边进行实时解析。这里的关键是前端需要识别并分离“普通对话文本”和“产物内容”。内容分离与渲染解析逻辑可能在前端组件中会监测像 python这样的Markdown代码块标记。当检测到一个完整的代码块时它就会将这个块的内容提取出来放置到右侧的Artifacts预览窗格中。对于非代码块的文本则继续在左侧聊天区域显示。预览窗格通常集成了代码高亮如通过prism.js或Markdown渲染如react-markdown库让产物看起来更专业。所以它并不是调用了某个特殊的“生成产物”的API而是通过前后端配合对模型的常规文本输出进行了智能的识别、分割和展示。这种实现方式的好处是兼容性极强任何能输出格式化文本的模型都能支持。3. 本地部署与基础配置详解让我们动手把这个项目跑起来。我将以macOS/Linux环境为例Windows用户只需在终端部分稍作调整如使用Git Bash。3.1 环境准备与项目初始化首先确保你的系统已经安装了Node.js版本18或以上推荐20 LTS和Git。你可以通过终端命令检查node --version git --version如果未安装请前往Node.js官网和Git官网下载安装。接下来克隆仓库并安装依赖。这里有一个关键细节项目根目录下的package.json里定义了构建和启动脚本。我们需要先安装所有必需的npm包。# 克隆项目到本地 git clone https://github.com/ozgrozer/chatgpt-artifacts.git # 进入项目目录 cd chatgpt-artifacts # 安装依赖。这里网络状况不好的同学可能会遇到问题解决方案见后文“常见问题”部分。 npm installnpm install命令会根据package.json文件下载Next.js、OpenAI SDK、React以及其他必要的UI库到本地的node_modules文件夹。这个过程可能会花费一两分钟。3.2 配置OpenAI API密钥项目使用环境变量来管理敏感信息如API密钥。这是现代应用的标准安全实践。# 复制环境变量示例文件为正式配置文件 cp .env.example .env现在用你喜欢的文本编辑器如VSCode、Vim、Nano打开新创建的.env文件。你会看到类似如下的内容OPENAI_API_KEYsk-xxx你需要将sk-xxx替换成你从OpenAI平台获取的真实API密钥。重要安全提示.env文件包含了你的密钥务必将其添加到.gitignore文件中项目通常已默认添加确保它不会被意外提交到公开的Git仓库。永远不要在代码中硬编码API密钥。3.3 构建与启动应用配置好密钥后就可以构建并启动应用了。Next.js应用在开发环境下可以直接运行但为了模拟生产环境项目脚本要求先构建。# 构建生产优化版本 npm run buildbuild命令会执行Next.js的构建过程包括编译TypeScript如果存在、打包React组件、优化代码等。你会在终端看到构建进度。完成后运行# 启动生产服务器 npm start如果一切顺利终端会输出类似 Ready on http://localhost:3000的信息。现在打开你的浏览器访问http://localhost:3000你应该能看到一个简洁的聊天界面左侧是对话历史中间是输入框右侧是一个空白的产物预览区。3.4 首次使用测试在输入框中尝试发送一条消息比如“用JavaScript写一个Hello World函数”。如果配置正确你应该会看到左侧聊天区域出现你的问题和AI的回复文本。右侧的Artifacts预览区会高亮显示生成的JavaScript代码块。至此基础部署就成功了。但这只是开始这个项目的强大之处在于其多模型支持能力。4. 多模型支持配置实战这是本项目最精彩的部分。通过修改一个核心文件你就能让这个“ChatGPT Artifacts”界面为多种AI模型服务。4.1 连接本地Ollama运行Llama 3, Gemma等Ollama让你能在本地电脑上运行大型语言模型完全离线数据隐私性最高。假设你已经安装好了Ollama并拉取了模型例如ollama pull llama3:8b配置步骤如下首先确保Ollama服务正在运行。默认情况下它会在http://127.0.0.1:11434提供API服务。找到项目中的/pages/api/chat.js文件。这是所有AI请求的入口。按照项目说明修改文件。但这里我提供更清晰、更安全的修改实践不要直接删除原有代码而是通过环境变量或条件判断来切换配置。这是更工程化的做法。你可以这样修改chat.js文件的开头部分import OpenAI from openai; // 根据环境变量决定使用哪个后端 let openai; if (process.env.AI_PROVIDER ollama) { openai new OpenAI({ apiKey: ollama, // Ollama不需要真密钥但SDK要求此字段存在 baseURL: http://127.0.0.1:11434/v1, // 指向本地Ollama服务 }); } else if (process.env.AI_PROVIDER groq) { openai new OpenAI({ apiKey: process.env.GROQ_API_KEY, // 从环境变量读取Groq密钥 baseURL: https://api.groq.com/openai/v1, }); } else { // 默认为OpenAI openai new OpenAI({ apiKey: process.env.OPENAI_API_KEY, }); }然后在调用处同样进行条件判断let modelName; if (process.env.AI_PROVIDER ollama) { modelName llama3; // 与你本地拉取的模型名称一致 } else if (process.env.AI_PROVIDER groq) { modelName llama3-70b-8192; // Groq提供的模型名 } else { modelName gpt-4o; // 默认使用GPT-4o } const stream await openai.chat.completions.create({ stream: true, model: modelName, messages: conversations[conversationId], });最后记得在.env文件中添加一行AI_PROVIDERollama。这样你就可以通过修改一个环境变量轻松切换不同的AI后端而无需每次都去改动代码。实操心得使用Ollama时响应速度取决于你的电脑硬件。对于7B/8B参数量的模型16GB内存的MacBook Pro可以流畅运行但生成速度仍无法与云端API相比。它的优势在于完全离线和零成本适合处理敏感数据或进行大量实验。4.2 接入Groq Cloud体验极致速度Groq以其LPU推理引擎闻名能提供极快的文本生成速度。接入步骤同样简单前往 Groq控制台 注册并获取API密钥。在你的.env文件中设置GROQ_API_KEY和AI_PROVIDER。OPENAI_API_KEYsk-xxx仍可保留 GROQ_API_KEYgsk_xxx你的Groq密钥 AI_PROVIDERgroq按照上面4.1节的代码示例你已经配置好了条件判断。重启应用 (npm run build npm start) 即可。现在你的应用后端就会将请求转发到Groq的API。你可以尝试问同一个问题感受一下生成速度的显著提升。4.3 配置Azure OpenAI服务对于企业用户或需要更稳定服务保障的开发者Azure OpenAI是一个理想选择。它的配置稍复杂因为涉及Azure特有的资源结构。创建资源在Azure门户中创建“Azure OpenAI”资源。部署模型在Azure OpenAI Studio中于你的资源下创建一个模型部署例如部署一个GPT-4o模型。记下你给这个部署起的名字比如my-gpt-4o-deployment。获取关键信息终结点Endpoint格式类似https://你的资源名称.openai.azure.com/。API密钥在Azure门户中资源的“密钥与终结点”页面找到。API版本例如2024-02-15-preview。使用较新的版本。部署名称你上一步起的名字my-gpt-4o-deployment。修改配置在chat.js的条件判断中增加一个azure分支else if (process.env.AI_PROVIDER azure) { openai new OpenAI({ apiKey: process.env.AZURE_OPENAI_API_KEY, defaultQuery: { api-version: process.env.AZURE_API_VERSION }, defaultHeaders: { api-key: process.env.AZURE_OPENAI_API_KEY }, baseURL: ${process.env.AZURE_ENDPOINT}openai/deployments/${process.env.AZURE_DEPLOYMENT_NAME}, }); }更新环境变量在.env文件中补充AI_PROVIDERazure AZURE_OPENAI_API_KEY你的Azure密钥 AZURE_API_VERSION2024-02-15-preview AZURE_ENDPOINThttps://你的资源名称.openai.azure.com/ AZURE_DEPLOYMENT_NAMEmy-gpt-4o-deployment注意事项Azure OpenAI的baseURL格式非常关键必须精确到/deployments/部署名。一个常见的错误是漏掉了deployments路径段导致404错误。另外Azure的计费是基于你选择的模型和部署的令牌使用量使用前请了解定价。5. 高级使用技巧与自定义优化基础功能跑通后我们可以让它更贴合个人使用习惯。以下是我在实际使用中总结的几个优化方向。5.1 提升Artifacts的识别与渲染效果默认的解析器可能对某些复杂的Markdown或非标准代码块支持不佳。你可以探索和修改前端组件中负责解析聊天流的部分。这通常位于/components或/pages/index.js文件中寻找处理stream数据或解析message content的函数。例如你可以增强解析逻辑使其不仅能识别python还能识别json、html甚至自定义的 artifact:chart 这样的标记并为不同类型的产物调用不同的渲染组件如为JSON展示一个可折叠的树状视图。5.2 实现对话持久化当前项目示例中对话历史可能保存在内存中服务器重启就会丢失。对于日常使用这是不可接受的。一个简单的改进方案是引入一个轻量级数据库。选择数据库SQLite是一个零配置、单文件数据库非常适合个人项目。可以使用better-sqlite3或kysely这类库。修改API逻辑在/pages/api/chat.js中当收到新消息时不再仅更新内存对象conversations而是将其写入SQLite数据库的一张表中表字段可包括id,conversation_id,role,content,timestamp。加载历史当应用启动或用户请求某个对话时从数据库中读取记录并重构messages数组。这样你的所有对话和生成的Artifacts都能被永久保存和检索。5.3 添加前端功能导出与分享一个实用的功能是允许用户将右侧Artifacts预览区的内容导出为文件。这可以通过在前端添加一个按钮来实现。在产物预览区组件旁添加一个“导出”按钮。编写按钮点击事件处理函数。这个函数需要获取预览区内的纯文本或HTML内容。利用JavaScript的Blob对象和URL.createObjectURL方法创建一个文件下载链接。根据产物类型设置文件名和扩展名如quicksort.py,document.md。触发浏览器下载。通过动态创建一个隐藏的a标签并模拟点击来触发文件下载。这个功能虽然简单但能极大提升工具的实用性让你生成的代码、文档能立刻保存到本地使用。6. 常见问题与故障排查实录在部署和使用过程中你几乎一定会遇到下面这些问题。我把我的解决方案记录下来希望能帮你节省时间。6.1 依赖安装失败或构建错误问题运行npm install或npm run build时出现网络超时、依赖冲突或Node版本不兼容的错误。排查与解决网络问题这是最常见的问题尤其在国内。解决方案是切换npm源到国内镜像。npm config set registry https://registry.npmmirror.com # 然后重新运行 npm installNode版本问题确保你的Node.js版本符合项目要求查看package.json中的engines字段或项目README。推荐使用nvm(Mac/Linux) 或nvm-windows来管理多个Node版本。# 使用nvm安装并切换至18.x或20.x nvm install 18 nvm use 18清理缓存有时旧的缓存会导致问题。npm cache clean --force rm -rf node_modules package-lock.json npm install6.2 应用启动后发送消息无反应或报错问题页面能打开但发送消息后长时间无响应或前端控制台浏览器按F12出现500错误。排查步骤检查后端日志首先看启动应用的终端窗口是否有红色的错误堆栈信息。这是最直接的线索。验证API密钥与环境变量90%的初始化问题源于此。确保.env文件中的密钥正确无误并且没有多余的空格或换行。可以在chat.js中临时添加console.log(process.env.OPENAI_API_KEY)来验证是否成功读取。检查API端点连通性对于Ollama在浏览器中访问http://127.0.0.1:11434/api/tags应该能看到你已下载的模型列表。对于Groq或Azure可以使用curl命令测试# 测试OpenAI (将YOUR_KEY替换) curl https://api.openai.com/v1/models \ -H Authorization: Bearer YOUR_KEY检查模型名称确保代码中model参数与你的服务提供商支持的模型名称完全一致。例如Azure OpenAI使用的是部署名称而不是模型名称。6.3 Ollama连接正常但返回乱码或错误问题配置Ollama后能收到响应但内容是乱码或非预期的错误信息。排查与解决模型未加载Ollama需要显式拉取pull模型。确保你运行了ollama pull llama3以你要用的模型为准。上下文长度超限本地模型上下文窗口较小。如果对话历史很长可能导致失败。尝试在API调用中减少messages数组的长度或者使用Ollama的num_ctx参数在拉取模型时设置更大的上下文如ollama pull llama3:8b --num_ctx 4096。Ollama API版本确保baseURL指向的是.../v1。Ollama的OpenAI兼容端点在/v1路径下。6.4 产物预览区不显示或显示格式错乱问题聊天有回复但右侧的Artifacts窗口是空的或者代码没有高亮。排查与解决检查AI输出格式Artifacts的提取依赖于AI返回的Markdown代码块。如果AI的回复是纯文本而没有用 包裹提取就会失败。你可以在系统提示词如果项目支持配置中明确要求AI“将代码放在Markdown代码块中”。前端解析逻辑打开浏览器开发者工具切换到“网络”标签页查看对/api/chat的响应数据流SSE。观察AI返回的数据是否包含完整的代码块标记。如果包含但页面不显示问题可能在前端的解析和渲染组件上。检查控制台是否有JavaScript错误。代码高亮库缺失确认项目依赖中包含了如prismjs或highlight.js这类库并且相关CSS样式文件已被正确引入。6.5 如何同时支持多个模型并快速切换问题按照上文修改代码后每次切换模型都需要修改.env文件并重启服务不够方便。进阶解决方案实现一个简单的模型选择器。前端添加下拉菜单在聊天界面添加一个select下拉框选项包括 “GPT-4o”, “Ollama Llama3”, “Groq Llama3-70B” 等。修改API请求前端发送消息时将选中的模型标识如provider: groq, model: llama3-70b-8192作为一个额外的字段或请求头如X-AI-Provider发送到/api/chat。后端动态路由在chat.js中不再依赖环境变量而是从请求体或请求头中读取客户端传来的模型标识然后动态创建对应的OpenAI客户端实例。这样你就可以在网页上点点鼠标实时切换不同的AI后端体验它们在同一任务下的表现差异这非常有助于模型对比和评估。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2613085.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!